画像生成AIで重要なプロンプトですが、何も考えずに単語を並べていけばいいわけではありません。
生成したい画像に少しでも近づけたいなら覚えて欲しいコツがあります。
本日はプロンプトを入力するコツを解説してきます。
優先度の高い言葉から入力する
Stable Diffusionにプロンプト(呪文)を入力するときは、優先度の高いプロンプトから入力しましょう。
Stable Diffusionは上から順にプロンプトを認識するため、優先順位が先に入力されたプロンプトになります。
同じプロンプトを入力していても、プロンプトの順番が変われば生成される画像も変わることがあります。
括弧や数字を使って単語の重み付けをする
プロンプトの影響力を強くしたり弱くしたりする方法として、プロンプトを括弧で囲って重み付けをします。
Stable Diffusionでは、プロンプトを入力する際にAIに注目させたいワードの目印として括弧を用います。
括弧を使用しないとどうなるか?
プロンプトとして入力する単語量が増えれば増えるほど、AIがどの指示を優先すべきか重点をおくべきか分かりづらくなってしまいます。
プロンプトで指示したからといって、確実にその単語の内容を反映してくれるわけではありません。
細かいところで間違えて画像を生成してしまいます。
そこで括弧を使用することで、優先してほしい目印を残してあげます。
例えば、「blond hair」と指示したのにもかかわらず他の色で生成されてしまった場合です。
ここに「(blond hair)」と括弧を付けて生成すると、括弧が目印になりblond hairで生成してくれます。
括弧の種類と効果
括弧には種類があります。
5種類の括弧と効果を紹介します。
(word)
上記でも説明しました括弧です。
括弧内の言葉を優先させやすくする効果があります。
括弧を付けない場合、AIの言葉への注目率は「1.0」ですが、括弧をつけると「1.1」に上がります。
((word))
(word)の2重の効果があります。
注目率は1.1×1.1の「1.21」となります。
(word:数字)
((word))の注目率「1.21」以上に倍率を上げたいときに使います。
括弧を複数つけるのは大変なので、(word:1.3)のように表記します。
倍率は1.5までがよく使われます。
倍率を上げるだけではなく、下げることもできます。
(word:0.5)で注目率は半分になります。
[word]
(word:0.5)で注目率を下げることもできますが、[word]でも下げることができます。
(word)の逆の効果が得られますので、注目率が「1.1」下がります。
[[word]]のような使い方も同じです。
\(word\)
何かの理由で括弧を注目率に関係ない「ただの言葉」として使うときバックスラッシュを使用します。
単語数(トークン : Token)
Stable Diffusionの単語数は、トークンという単位でカウントされます。
トークン数は75を超えて入力することはあまりオススメできません。
75トークンを超えると思い通りの画像が生成されにくくなるため注意が必要になります。
単語1つで1トークンですが、カンマ( , )で区切った際にもカンマを1トークンとしてカウントされます。
AND構文
プロンプトを入力すれば必ず使うことになるカンマ( , )で1トークン使われるのが勿体無いと感じると思います。
そこで、「AND」を単語と単語の間に入力してみましょう。
「単語 , 単語」で3トークンです。
「単語 AND 単語」になると1トークンになります。
単語と単語の間に「AND」を入力することでトークン数を減らすことができます。
ネガティブプロンプトを活用する
ネガティブプロンプトは、描いてほしくない要素を指定するためのプロンプトです。
不要な要素を排除してハイクオリティな画像を生成できる可能性が高くなります。
よく入力するネガティブプロンプトは「品質の低下を防ぐためのネガティブプロンプト」「不要な要素を排除するネガティブプロンプト」が多いと思います。
まとめ
思い通りに画像を生成できるようにプロンプト入力のコツを解説しました。
- プロンプトを入力する優先度
- 単語の重み付け
- 単語数
- ネガティブプロンプト
画像生成を始めたばかりの方やこれから始めようとしている方は、これらのコツを念頭に置きながら画像生成してみてください。
最後までお読みいただきありがとうございました。