Stable Diffusionは、テキストプロンプトから高品質なイメージを生成できる革新的なAIツールです。思い描いた通りの画像を生み出すには、適切なプロンプト(呪文)を入力することが不可欠です。本記事では、Stable Diffusionを最大限に活用するためのおすすめプロンプト一覧と、効果的な使い方をご紹介します。初心者から上級者まで、誰もが自分の創造力を存分に発揮できるよう、実践的なテクニックもお伝えします。
Stable Diffusionのプロンプト(呪文)の基本
Stable Diffusionのプロンプトは、AIに生成してほしい画像の内容を指示するためのテキストです。単なる単語の羅列ではなく、AIが理解しやすい形式で構成された文章や表現の集合体です。プロンプトは主に以下の要素で構成されています。
- コアプロンプト:生成したい画像の主要な内容を表す部分
- スタイル:画像の芸術的なスタイルや雰囲気を指定する部分
- アーティスト:特定のアーティストの作風を参考にする場合に使用
- 仕上げ:画質や細部の指定など、最終的な調整を行う部分
プロンプトの入力順序は重要で、最初に記述された内容ほど強い影響力を持ちます。効果的なプロンプトを作成するには、AIが理解しやすい具体的な表現を使用し、細部まで丁寧に指定することが大切です。例えば、「美しい風景」よりも「夕暮れ時の桜並木、川沿いの遊歩道」のように具体的に描写すると、より意図した画像が生成されやすくなります。また、ネガティブプロンプトを使用することで、生成したくない要素を排除し、より精密な画像制御が可能です。プロンプトの効果的な使用法を習得することで、Stable Diffusionの可能性を最大限に引き出し、創造的で独自性のある画像を生成できます。
(参考)AI画像生成モデルStable Diffusionとは?使い方やセットアップのポイントを解説
プロンプト(呪文)を入力する手順
Stable Diffusionでプロンプトを入力する手順は、使用するインターフェースによって若干異なりますが、基本的な流れは以下のとおりです。
1. Stable Diffusionのインターフェースを開く
・ローカル環境の場合はWebUIを起動
・オンラインサービスの場合は該当のウェブページにアクセス
2. テキスト入力欄を見つける
・通常、画面上部または中央に配置されています
3. プロンプトを入力する
・英語で入力するのが一般的ですが、日本語対応の拡張機能を使用すれば日本語も可能です
・カンマ(,)で区切って複数の要素を指定できます
4. ネガティブプロンプトを入力する(オプション)
・生成したくない要素を指定する欄があれば、そこに入力します
5. その他の設定を調整する
・画像サイズ、生成数、サンプリング方法などを必要に応じて設定します
6. 生成ボタンをクリック
・「Generate」や「Create」などのボタンを押して画像生成を開始します
7. 結果を確認し、必要に応じてプロンプトを調整
・生成された画像が意図したものでない場合は、プロンプトを修正して再度生成します
プロンプトの入力では、以下の点に注意することで、より効果的な結果を得られます。
- 具体的な描写を心がける
- 重要な要素を文頭に配置する
- カンマの後にスペースを入れて可読性を高める
- 括弧や重み付けを使って要素の重要度を調整する
例えば、「beautiful woman, long hair, blue eyes, smiling, (high quality, detailed:1.2), (photorealistic:1.3), (masterpiece:1.1)」のようなプロンプトを入力することで、高品質で写実的な美しい女性の画像を生成できます。プロンプトの入力は試行錯誤の過程です。最初は簡単なプロンプトから始め、徐々に複雑化させていくことで、Stable Diffusionの挙動を理解し、より意図に沿った画像を生成できるようになります。
カテゴリー別プロンプト(呪文)一覧
Stable Diffusionで使用できるプロンプトを、カテゴリー別に整理してご紹介します。これらのプロンプトを組み合わせることで、より具体的で詳細な画像生成が可能になります。
Stable Diffusion プロンプト一覧
カテゴリー | プロンプト | 説明 |
画像の品質 | high quality | 高品質な画像を生成 |
画像の品質 | best quality | 最高品質の画像を生成 |
画像の品質 | masterpiece | 傑作レベルの画像を生成 |
画像の品質 | ultra-detailed | 非常に詳細な画像を生成 |
画像の品質 | photorealistic | 写実的な画像を生成 |
画像の品質 | 8k resolution | 高解像度の画像を生成 |
人物 | 1girl / 1boy | 1人の女性 / 男性 |
人物 | beautiful woman / handsome man | 美しい女性 / ハンサムな男性 |
人物 | young / mature | 若い / 成熟した |
人物 | Japanese / Asian / Caucasian | 日本人 / アジア人 / 白人 |
人物 | child / teenager / adult / elderly | 子供 / 10代 / 大人 / 高齢者 |
人物 | smiling | 笑顔 |
表情 | laughing | 笑っている |
表情 | serious | 真剣な表情 |
表情 | angry | 怒っている |
表情 | sad | 悲しい |
表情 | surprised | 驚いている |
視線・目線 | looking at viewer | 視聴者を見ている |
視線・目線 | looking away | 目をそらしている |
視線・目線 | looking up / down | 上 / 下を見ている |
視線・目線 | closed eyes | 目を閉じている |
視線・目線 | wink | ウインクしている |
髪 | long hair / short hair | 長髪 / 短髪 |
髪 | blonde / brown / black hair | 金髪 / 茶髪 / 黒髪 |
髪 | wavy hair / straight hair | ウェーブヘア / ストレートヘア |
髪 | ponytail / twin tails | ポニーテール / ツインテール |
髪 | braid / bun | 三つ編み / お団子ヘア |
体型 | slim / curvy | スリム / 曲線美 |
体型 | muscular / athletic | 筋肉質 / アスリート体型 |
体型 | tall / short | 背が高い / 背が低い |
体型 | petite / plus-size | 小柄 / ぽっちゃり |
体型 | dress / suit | ドレス / スーツ |
服装 | casual wear / formal wear | カジュアルウェア / フォーマルウェア |
服装 | kimono / yukata | 着物 / 浴衣 |
服装 | school uniform | 学生服 |
服装 | swimsuit / bikini | 水着 / ビキニ |
ポーズ | standing | 立っている |
ポーズ | sitting | 座っている |
ポーズ | lying down | 横たわっている |
ポーズ | running | 走っている |
ポーズ | jumping | ジャンプしている |
ポーズ | dancing | 踊っている |
被写体 | portrait | ポートレート |
被写体 | full body | 全身 |
被写体 | upper body | 上半身 |
被写体 | close-up | クローズアップ |
被写体 | group shot | グループショット |
背景 | nature background | 自然の背景 |
背景 | city background | 都市の背景 |
背景 | beach | ビーチ |
背景 | forest | 森 |
背景 | mountains | 山 |
背景 | studio background | スタジオ背景 |
光源 | sunlight | 太陽光 |
光源 | moonlight | 月光 |
光源 | studio lighting | スタジオ照明 |
光源 | candlelight | ろうそくの光 |
光源 | neon lights | ネオンライト |
光源 | golden hour | ゴールデンアワー |
これらのプロンプトを組み合わせることで、より具体的で詳細な画像を生成できます。例えば、「beautiful Japanese woman, long black hair, kimono, cherry blossom background, soft sunlight, (high quality, detailed:1.2), (photorealistic:1.3)」というプロンプトを使用すると、桜の背景の中で着物を着た美しい日本人女性の写実的な画像を生成できます。
プロンプト(呪文)入力のコツ
Stable Diffusionで効果的なプロンプトを入力するには、いくつかのコツがあります。これらのテクニックを活用することで、より意図に沿った高品質な画像を生成できます。
具体的な描写を心がける
「美しい風景」よりも「夕暮れ時の桜並木、川沿いの遊歩道」のように具体的に描写します。
重要な要素を先頭に配置する
Stable Diffusionは文頭の要素をより重視するため、最も重要な要素を先に記述します。
カンマで区切り、スペースを入れる
「beautiful woman, long hair, blue eyes」のように、カンマの後にスペースを入れて可読性を高めます。
括弧と重み付けを使用する
「(high quality, detailed:1.2), (photorealistic:1.3)」のように、括弧と数値で要素の重要度を調整できます。
ネガティブプロンプトを活用する
生成したくない要素を指定することで、より精密な画像制御が可能になります。
アーティストや作品名を参考にする
「style of Monet」や「in the style of Studio Ghibli」のように、特定のアーティストや作品の雰囲気を取り入れられます。
画像の品質を指定する
「masterpiece, best quality, ultra-detailed」などの品質指定を加えることで、より高品質な画像が生成されやすくなります。
構図や視点を指定する
「close-up shot」や「wide angle view」のように、構図や視点を指定することで画像の構成をコントロールできます。
光源や雰囲気を描写する
「soft sunlight」や「moody atmosphere」のように、光や雰囲気を指定することで画像の印象を調整できます。
試行錯誤を重ねる
最初は簡単なプロンプトから始め、徐々に複雑化させていくことで、Stable Diffusionの挙動を理解し、より意図に沿った画像を生成できるようになります。これらのコツを組み合わせると、以下のようなプロンプトを作成できます。
「1 beautiful Japanese woman, long black hair, wearing traditional kimono, (cherry blossom background:1.2), soft sunlight, (high quality, detailed:1.2), (photorealistic:1.3), (masterpiece:1.1), close-up portrait, looking at viewer, slight smile」
このプロンプトは、高品質で写実的な日本人女性の肖像画を生成するよう指示しています。桜の背景、着物、柔らかな日光など、具体的な要素を指定し、括弧と重み付けを使用して重要度を調整しています。プロンプトの作成は創造的なプロセスです。これらのコツを参考にしながら、自分なりのプロンプトスタイルを見つけていくことが大切です。
プロンプト(呪文)を日本語で入力する方法
Stable Diffusionは基本的に英語のプロンプトを使用しますが、日本語でプロンプトを入力する方法もあります。
1. 翻訳ツールの活用
オンラインの翻訳ツールを使用して、日本語のプロンプトを英語に翻訳してから入力する方法があります。ただし、翻訳の精度によっては意図した結果が得られない場合もあるので注意が必要です。
2. 日本語対応モデルの使用
一部のStable Diffusionモデルは日本語入力に対応しています。例えば、「Anything V3」や「Waifu Diffusion」などのモデルを使用すると、日本語のプロンプトでも画像生成が可能です。
3. 日本語プラグインの利用
WebUIを使用している場合、日本語入力を可能にするプラグインを導入することで、日本語のプロンプトを直接入力できます。
プロンプト(呪文)を画像から抽出する方法
既存の画像からプロンプトを抽出する方法もあります。これは「逆プロンプティング」や「プロンプト推測」と呼ばれる技術です。
1. 専用ツールの使用
CLIP Interrogatorなどの専用ツールを使用すると、画像を解析してプロンプトを推測できます。
2. AIサービスの活用
一部のAIサービスでは、画像をアップロードすることで、その画像を生成するのに適したプロンプトを提案してくれる機能があります。
3. コミュニティの活用
Stable Diffusionのコミュニティサイトでは、ユーザーが自分の作品とともにプロンプトを共有しています。似た画像を見つけて、そのプロンプトを参考にできます。これらの方法を活用することで、プロンプト作成の幅が広がり、より効果的な画像生成が可能になります。
プロンプト(呪文)の活用事例
Stable Diffusionのプロンプトは、様々な分野で活用されています。以下にいくつかの具体的な活用事例を紹介します。
イラスト制作の補助
イラストレーターやデザイナーが、アイデアの初期段階でStable Diffusionを使用して、コンセプトアートや下絵を生成しています。これにより、クリエイティブプロセスが加速し、新しいアイデアの探索が容易になります。
広告ビジュアルの作成
広告業界では、キャンペーンのビジュアルイメージを素早く生成するためにStable Diffusionが使用されています。プロンプトを調整することで、ブランドのイメージに合った画像を効率的に作成できます。
教育コンテンツの制作
教育分野では、教材や説明用のイラストを生成するためにStable Diffusionが活用されています。複雑な概念を視覚化することで、学習者の理解を促進できます。
ゲーム開発のアセット作成
ゲーム開発者は、背景やキャラクターデザインのアイデアを生成するためにStable Diffusionを使用しています。これにより、開発初期段階でのビジュアルコンセプトの探索が容易になります。
効率的にプロンプト(呪文)を入力しよう
プロンプトを効率的に入力するためには、以下のポイントを押さえることが重要です。
1. テンプレートの活用
よく使うプロンプトの組み合わせをテンプレート化しておくことで、入力時間を短縮できます。例えば、画質や様式に関する基本的なプロンプトをセットにしておき、それに具体的な描写を追加するという方法が効果的です。
2. プロンプトライブラリの構築
自分専用のプロンプトライブラリを作成し、カテゴリーごとに整理しておくと、必要な時にすぐに適切なプロンプトを見つけられます。
3. ショートカットの利用
Stable Diffusionの使用環境によっては、カスタムショートカットを設定できる場合があります。頻繁に使用するプロンプトやプロンプトの組み合わせにショートカットを割り当てることで、入力の手間を大幅に削減できます。
4. プロンプト生成ツールの活用
プロンプト生成を支援するツールやAIを利用することで、より効率的にプロンプトを作成できます。これらのツールは、キーワードや概要から適切なプロンプトを提案してくれます。
おわりに
Stable Diffusionのプロンプト(呪文)は、AIによる画像生成の可能性を大きく広げる重要な要素です。本記事で紹介した様々なテクニックや活用事例を参考に、自分なりのプロンプト作成スキルを磨いていくことで、より創造的で効果的な画像生成が可能になります。プロンプトの作成は、技術と創造性が融合する領域です。試行錯誤を重ねながら、自分の表現したいイメージを的確にAIに伝える方法を見つけていくことが、Stable Diffusionを使いこなす鍵となるでしょう。