Stable Diffusion web UIとは、Stable Diffusionというテキスト入力に基づく画像生成AIを、ブラウザで簡単に操作できるようにしたツールです。数ある画像生成AIの中でも人気があり現在主流のツールとなっております。
Stable Diffusion web UIの特徴は以下の通りです。
- Stable Diffusionを使うために必要な環境構築を自動で行ってくれる
- ブラウザを介して簡単に画像を生成できる
- 無料で使うことができる
- 日本語化できる
- 頻繁に更新されておりどんどん便利になる
- 元々多機能なうえに、拡張機能をインストールすることで便利な機能を追加できる
Stable Diffusion web UIのインストール方法は、ZIPファイルをダウンロードして展開するだけの簡単な方法があります。
Stable Diffusion web UIのインストールには2つの方法があります。

- クラウド環境にインストールする方法
- ローカル環境にインストールする方法
ローカル環境にインストールする場合は、無料で自由に画像を生成できます。上記の2つの方法のうち、より簡便な方法はZIPファイルをダウンロードし、展開する方法です。大まかな手順は以下のとおりです。
- 手順1:ZIPファイルをダウンロードします。
- 手順2:所定のフォルダに任意のモデルファイルをダウンロードします。
- 手順3:バッチファイルを実行します。
Stable Diffusion Web UIの使用方法
Stable Diffusion Web UIの使用方法には主に二通りの方法があります。
txt2img(=呪文から画像を生成する機能)の利用
基本的には、次のような手順となります。
- 「Prompt」欄には、作成する画像に関連する英単語を入力します。
- 「Generate」をクリックすれば、画像が生成されます。
- 生成した画像は「output」フォルダに保存されます。
例えば、「女の子, 短い髪, 森」と入力すると、髪が短い女の子が森で立っているような画像が生成されます。
なお、使用するモデルやパラメータによって、生成される画像の品質やスタイルは異なります。
さらに、拡張機能をインストールすることで、顔の補正や画像の拡大機能などを利用できます。
img2img(=元画像と呪文から別の画像を生成する機能)の使い方
基本的には、次のような手順となります。
- 「img2img」のタブをクリックします。
- 「img2img用画像」欄に、元の画像をドラッグアンドドロップします。
- プロンプト欄には、作成する画像に関連する英単語を入力します。
- 「Generate」をクリックすると、画像が生成されます。
- 生成されたイメージは「出力(output)」フォルダに自動的に保存されます。
拡張機能のインストール手順
主要な拡張機能を利用するための基本的な手順は以下の通りです。
- 「Extensions(拡張機能)」タブをクリックします。
- 「Available(利用可能)」タブを開き、「Load from(読み込む)」ボタンをクリックします。そうすると主要な拡張機能の一覧が表示されます。
- インストールしたい拡張機能の「Install(インストールする)」ボタンをクリックします。こうしてインストールが始まります。
- インストールが完了したら、「Apply and restart UI(適用してUIを再起動する)」をクリックして、UIを再起動します。
stable diffusionのローカルでの利用方法
stable diffusionをローカルで利用するには、以下の手順が必要です。
- PythonとGitをインストールします。
- stable diffusionのリポジトリをクローンします。
- stable diffusionのモデルとGFPGANの重みファイルをダウンロードします。
- stable diffusion web UIのフォルダにファイルを配置します。
- コマンドプロンプトからweb UIを起動します。
- ブラウザからweb UIにアクセスします。
スマートフォンでのstable diffusionの使用方法
スマートフォンでstable diffusionを利用する方法には、以下の選択肢があります。
- LINEやスマートフォンアプリなどで簡単に使用できるものを利用する。
- Google Colaboratory版のWebUIがスマートフォンのブラウザから起動できます。
- iOS版アプリ「AI Picasso-Dream Art Studio」もインストール可能です。
Google Colabを用いたstable diffusionの使用方法
コラボでstable diffusionを利用するためには、以下の手順が必要です。
- Hugging Faceのアカウントを作成してアクセストークンを発行する。
- stable diffusionモデルの使用に関する条件に同意する必要があります。
- Google Colabのノートブックを新規作成し、GPUを有効にします。
- 必要なライブラリをインストールします。
- stable diffusionのソースコードをダウンロードしてセットアップを行います。
- 生成したい画像の内容をテキストで入力し、スクリプトを実行します。
stable diffusionのモデル
stable diffusionは、元テキストから自動的に画像を生成する人工知能(AI)です。この技術は、Hugging Faceの1やCivitaiの2など、多くのサイトで公開されています。
このAIのモデルによって、生成される画像のスタイルやテーマが異なっています。
例えば、最新のモデルであるrunwayml/stable-diffusion-v1-5は、高品質の画像を生成することができます。
また、stabilityai/stable-diffusion-2-1-unclipというモデルは、UNCLIPと呼ばれる関連性を学習したもので、元テキストに忠実な画像を生成することができます。さらに、stabilityai/stable-diffusion-x4-upscalerというモデルは、画像の解像度を4倍に増やすことができます。
また、IDEA-CCNL/Taiyi-Stable-Diffusion-1B-Chinese-v0.1というモデルは、中国語のテキストに対応しており、中国語を元テキストにした画像を生成することができます。さらに、Fictiverse/Stable_Diffusion_PaperCut_Modelというモデルは、切り絵風の画像を生成することができます。
stable diffusionの呪文について
stable diffusionにて詳細な指示をAIに伝える際のコマンドを「プロンプト」と呼びます。このプロンプトは「呪文」とも呼ばれており、この呪文を駆使することにより自身が望むイラストを作成することができます。
呪文には、品質(クオリティ)呪文、コアプロンプト(主題)、追加要素、背景、スタイル、構図、照明やフィルタなどの要素が含まれることがあります。 これらの要素を組み合わせて、より詳細な指示をAIに伝えることができます。例えば、
beautiful concept art illustration of a one beautiful kawaii girl in fluttery white dress with wavy hair,symmetrical perfect face fine detail delicate features quiet gaze,a beautiful full body illustration,beautiful europian building background,High-angle shot by void/Re:era and wlop and makotoshinkai and greg rutkowski and krenz cushart and KanLiu and rossdraws and void/Re:era and @ribao_bbb and modare,atmospheric lighting,volumetric lighting,sdorica,reduce saturation,pretty-small-face,fine detailed face,Twice,volumetric top lighting,big kawii eye,bold line painting,soft shadow,kawaii girl,4k,8k,trending artstation,pixiv ranking 1st
という呪文は、品質(クオリティ)呪文から始まり、コアプロンプト(主題)と追加要素を含み、背景やスタイルなどの要素も指定しています。
呪文を作る作業をプロンプトエンジニアリングと呼ぶことがあります。 プロンプトエンジニアリングには、いろいろなアプローチの仕方があり、答えはありません。 AIがどんな絵を生成するかは実際に試してみないと誰にもわからないからです。 モデルによっても推奨されるプロンプトの組み方があります。 トップ術師さんのプロンプトを見ても、プロンプトの組み方は人それぞれの方法があることがわかります。
つまり、基礎的な知識を頭に入れたら、あとはトライアンドエラーを繰り返すしかないということです。 翻訳ツールやChatGPTなどを使って英語で書くこともできます。 プロンプトエンジニアリングに便利なツールやヒントもインターネット上にたくさんあります。
stable diffusion 商用利用
このディープラーニングモデルは、テキストから画像を生成するために使用されます。Stable Diffusionは、英国のStability AI社が開発し、オープンソース化されました。
商用利用については、以下の点を考慮する必要があります。
- Stable Diffusionは、Creative Commons Attribution-NonCommercial 4.0 International License(CC BY-NC 4.0)の下で公開されています。このライセンスは、非営利目的で利用、編集、配布が可能ですが、商用目的で利用する場合は事前に許可を得る必要があります。
- Stable Diffusionは、複数のデータセットを学習に使用しています。それぞれのデータセットに別々の著作権やライセンスが適用される可能性がありますので、Stable Diffusionで生成する画像についても同様にライセンスや著作権に注意する必要があります。
コメント