この章では、画像のスタイルを調整するためにプロンプトを使用する方法を紹介します。同時に、より効率的な方法も紹介します。
この画像は AI によって生成されました
ComfyUI の基本的なノードと操作を理解したら、ComfyUI を使用して画像を生成できるはずです。
しかし、生成された画像の効果があなたが望むものではないかもしれません。例えば、アニメスタイルの画像を生成したいのに、生成された画像は実際の人物のスタイルになっているかもしれません。この時点で、AI が特定のスタイルの画像を生成するためにいくつかの手段を使用する必要があります。画像のスタイルを調整する方法はいくつかあります:
まず、前の章で Flux は t5xxl_fp16 モデルを使用していると述べました。これは Stable Diffusion モデルよりもはるかに優れた意味理解能力を持っています。しかし、このモデルは Flux のプロンプトを書くことを Stable Diffusion よりも複雑にします。
私の実験と Flux ユーザーからのいくつかのフィードバックに基づいて、以下の洞察をまとめました:
Stable Diffusion のプロンプトを書くとき、プロンプトが短すぎると、生成された画像の内容が比較的単純で、いくつかの内容が不足している可能性があります。そのため、多くの人は画像の内容を非常に詳細に記述し、非常に長いプロンプトを書く傾向があります。しかし、Flux では:
Flux が Stable Diffusion より賢いもう一つの点は、単語の構文と意味を理解できることです。
そのため、画像のキー情報を個々のキーワードに分割し、特定の単語の重みを増加させるために様々な記号を使用する必要はありません。代わりに、自然に意図を記述できます。言い換えれば、通常通りに意図を記述するだけです。
Stable Diffusion が “left”, “right”, “top”, “bottom” を理解できないのに対し、Flux ではそれらを自然に使用でき、理解できます。例えば、以下の画像のプロンプトは:
結果、位置情報はほぼ正確で、絵文字を認識します:
私はそれが私の個人的な錯覚かもしれないと思っていますが、特定の単語と明確な単語がモデルに与える影響が大きいことを発見しました。
あなたがする必要があるのは、意図をできるだけ具体的かつ明確に記述することです。画像に必要な要素を記述します。曖昧な概念を使用するのではなく。同時に、積極的な単語を使用して、“Remove” や “Not Include” などの否定的な単語を避けます。これらの単語は基本的に Flux では効果がありません。
Flux のプロンプトは非常に賢いですが、プロンプトを整理するためにプロンプトテンプレートを使用することもできます。一般的に、プロンプトには以下の要素が必要です:
上記の3つの要素が含まれていれば、かなり良い画像を生成できます。
もし、より細かい制御が必要な場合は、以下の要素を追加することもできます:
上記の内容を読んで、Flux のプロンプトを書くのは非常に簡単だと思うかもしれません。しかし、多くの人(私を含む)は実際には一度にあなたが望む画像を生成できません。理由は:
そのため、他の人がプロンプトをどのように書いているかを見て、それを模倣することをお勧めします。誰もが学習と参照を容易にするために、Flux プロンプトライブラリ で優れたプロンプトを共有します。
最後に、いくつかのプロンプトアシスタント拡張機能をお勧めします。
最初のプラグインは Bilbox ComfyUI です。このプラグインは、プロンプトをより適切に整理するのに役立ちます。
ComfyUI マネージャーまたは Git Clone を通じてこのプラグインをインストールできます。詳細なインストール方法については、ComfyUI 拡張機能のインストールを参照してください。
このプラグインは、写真のようなイメージのプロンプトを作成するのに適していることに注意してください。
使用方法は非常に簡単です。まず、CLIP Text Encode
ノード(図の①)の前に BilboX
ノード(図の②)を挿入し、CLIP Text Encode
ノードの text
端子に接続します。次に、プラグインのプロンプトに従って、必要なプロンプトを入力または選択します。例えば、以下の図では、ストリートフォトグラフィーを選択し、いくつかの光のオプションを追加しました。生成された画像は非常に完璧です:
また、CLIP Text Encode
ノードの text
端子を表示する方法がわからない場合は、CLIP Text Encode
ノード(図の①)を右クリックし、Convert Widget to Input
(図の②)を選択し、Convert text to input
(図の③)を選択します。
最初のプラグインは写真のようなプロンプトを生成するのに適していますが、2番目のプラグインはより完全な Flux プロンプトを生成できる Flux Prompt Generator です。
プラグインをインストールしたら、ワークフローに追加し、最初のプラグインよりもオプションが多いことがわかります:
最後のプラグインは ComfyUI Portrait Master です。このプラグインは、フェイスの詳細に関する設定が多く、ポートレートシーンに適したプロンプトを作成するのに役立ちます。
この章では、画像のスタイルを調整するためにプロンプトを使用する方法を紹介します。同時に、より効率的な方法も紹介します。
この画像は AI によって生成されました
ComfyUI の基本的なノードと操作を理解したら、ComfyUI を使用して画像を生成できるはずです。
しかし、生成された画像の効果があなたが望むものではないかもしれません。例えば、アニメスタイルの画像を生成したいのに、生成された画像は実際の人物のスタイルになっているかもしれません。この時点で、AI が特定のスタイルの画像を生成するためにいくつかの手段を使用する必要があります。画像のスタイルを調整する方法はいくつかあります:
まず、前の章で Flux は t5xxl_fp16 モデルを使用していると述べました。これは Stable Diffusion モデルよりもはるかに優れた意味理解能力を持っています。しかし、このモデルは Flux のプロンプトを書くことを Stable Diffusion よりも複雑にします。
私の実験と Flux ユーザーからのいくつかのフィードバックに基づいて、以下の洞察をまとめました:
Stable Diffusion のプロンプトを書くとき、プロンプトが短すぎると、生成された画像の内容が比較的単純で、いくつかの内容が不足している可能性があります。そのため、多くの人は画像の内容を非常に詳細に記述し、非常に長いプロンプトを書く傾向があります。しかし、Flux では:
Flux が Stable Diffusion より賢いもう一つの点は、単語の構文と意味を理解できることです。
そのため、画像のキー情報を個々のキーワードに分割し、特定の単語の重みを増加させるために様々な記号を使用する必要はありません。代わりに、自然に意図を記述できます。言い換えれば、通常通りに意図を記述するだけです。
Stable Diffusion が “left”, “right”, “top”, “bottom” を理解できないのに対し、Flux ではそれらを自然に使用でき、理解できます。例えば、以下の画像のプロンプトは:
結果、位置情報はほぼ正確で、絵文字を認識します:
私はそれが私の個人的な錯覚かもしれないと思っていますが、特定の単語と明確な単語がモデルに与える影響が大きいことを発見しました。
あなたがする必要があるのは、意図をできるだけ具体的かつ明確に記述することです。画像に必要な要素を記述します。曖昧な概念を使用するのではなく。同時に、積極的な単語を使用して、“Remove” や “Not Include” などの否定的な単語を避けます。これらの単語は基本的に Flux では効果がありません。
Flux のプロンプトは非常に賢いですが、プロンプトを整理するためにプロンプトテンプレートを使用することもできます。一般的に、プロンプトには以下の要素が必要です:
上記の3つの要素が含まれていれば、かなり良い画像を生成できます。
もし、より細かい制御が必要な場合は、以下の要素を追加することもできます:
上記の内容を読んで、Flux のプロンプトを書くのは非常に簡単だと思うかもしれません。しかし、多くの人(私を含む)は実際には一度にあなたが望む画像を生成できません。理由は:
そのため、他の人がプロンプトをどのように書いているかを見て、それを模倣することをお勧めします。誰もが学習と参照を容易にするために、Flux プロンプトライブラリ で優れたプロンプトを共有します。
最後に、いくつかのプロンプトアシスタント拡張機能をお勧めします。
最初のプラグインは Bilbox ComfyUI です。このプラグインは、プロンプトをより適切に整理するのに役立ちます。
ComfyUI マネージャーまたは Git Clone を通じてこのプラグインをインストールできます。詳細なインストール方法については、ComfyUI 拡張機能のインストールを参照してください。
このプラグインは、写真のようなイメージのプロンプトを作成するのに適していることに注意してください。
使用方法は非常に簡単です。まず、CLIP Text Encode
ノード(図の①)の前に BilboX
ノード(図の②)を挿入し、CLIP Text Encode
ノードの text
端子に接続します。次に、プラグインのプロンプトに従って、必要なプロンプトを入力または選択します。例えば、以下の図では、ストリートフォトグラフィーを選択し、いくつかの光のオプションを追加しました。生成された画像は非常に完璧です:
また、CLIP Text Encode
ノードの text
端子を表示する方法がわからない場合は、CLIP Text Encode
ノード(図の①)を右クリックし、Convert Widget to Input
(図の②)を選択し、Convert text to input
(図の③)を選択します。
最初のプラグインは写真のようなプロンプトを生成するのに適していますが、2番目のプラグインはより完全な Flux プロンプトを生成できる Flux Prompt Generator です。
プラグインをインストールしたら、ワークフローに追加し、最初のプラグインよりもオプションが多いことがわかります:
最後のプラグインは ComfyUI Portrait Master です。このプラグインは、フェイスの詳細に関する設定が多く、ポートレートシーンに適したプロンプトを作成するのに役立ちます。