この章では、Flux Redux を使用して類似画像を生成する方法を紹介します。
この画像は AI によって生成されました
/models/style_models
ディレクトリに配置します。style_models ディレクトリであることに注意してください。diffusion_models ディレクトリではありません。
さらに、sigclip_vision_patch14_384
というモデルをダウンロードする必要があります。このモデルは Flux が画像を Conditioning に変換するために使用されます。ここ からこのモデルをダウンロードし、/models/clip_vision
ディレクトリに配置します。
Apply Style Model
ノード (図 ①) です。そして、このノードの出力は Conditioning であるため、BasicGuider ノードに接続する必要があります。
そして、Apply Style Model
ノードには以下の入力ノードがあります:
Load Style Model
ノード (図 ②) を検索し、ワークフローに追加し、それを Apply Style Model
ノードに接続し、前述した Flux Redux モデルを選択します。Clip Vision Encode
ノード (図 ③) を検索し、ワークフローに追加し、それを Load CLIP Vision
ノード (図 ④) と Load Image
ノード (図 ⑤) に接続します。Clip Vision Encode
ノードには追加の crop
パラメータがあることに注意してください。これは何を意味しますか?これは画像をトリミングし、そのトリミングされた画像のみをエンコードします。Center
を選択すると、画像の中央部分をトリミングすることを意味します。なぜトリミングが必要なのですか?Redux モデルは正方形の画像しか受け入れられないためです。そのため、入力画像は正方形である必要があります。そうしないと、生成された画像に画像のすべての要素が含まれない可能性があります。Clip Vision Encode
ノードには追加の crop
パラメータがあることに注意してください。これは何を意味しますか?これは画像をトリミングし、そのトリミングされた画像のみをエンコードします。Center
を選択すると、画像の中央部分をトリミングすることを意味します。なぜトリミングが必要なのですか?Redux モデルは正方形の画像しか受け入れられないためです。そのため、入力画像は正方形である必要があります。そうしないと、生成された画像に画像のすべての要素が含まれない可能性があります。
このプロセスを簡単に理解すると、Flux Redux モデルを翻訳機能として使用することができます。画像内の様々な要素を Conditioning データに変換し、それを Flux モデルに入力して画像を生成します。
Batch Images
ノード (図 ①) を追加し、それを 2 番目の Load Image
ノード (図 ②) に接続するだけです。
そして、融合したい 2 つの画像を選択します。例えば、ソファと森の画像を融合して、とても興味深い画像が生成されます。
Apply Style Model
ノードを削除し、図 ① の Redux Advanced
ノードに置き換えます。Redux Advanced
ノードの downsampling_factor
パラメータを調整する必要があります。値が大きいほど、Image Prompt の重みが低くなります。3 はおおよそ中程度の強度です。状況に応じて異なる値の効果をテストできます。downsampling_factor
パラメータを調整するだけでなく、downsampling_function
パラメータを調整することもできます。異なるパラメータを切り替えて試してみることができます。Load Image
ノードの Mask
端子を Redux Advanced
ノードの Mask
端子に接続し、いくつかの領域を円形にするだけです:
図 | 説明 |
---|---|
① | ConditioningSetTimestepRange ノードを追加し、より区別しやすくするために Prompt Conditioning と名付けました。それを FluxGuidance ノードに接続し、開始値を 0、終了値を 0.1 に設定します。これは、最終生成過程で Text Prompt の割合が 10% に達することを意味します。Prompt の重みをより高くしたい場合は、終了値をより大きく設定します。 |
② | もう 1 つ ConditioningSetTimestepRange ノードを追加し、より区別しやすくするために Image Conditioning と名付けました。それを Apply Style Model ノードに接続し、開始値を 0.1、終了値を 1 に設定します。これは、最終生成過程で Image Conditioning の割合が 90% に達することを意味します。ここで、開始値は Prompt Conditioning の終了値よりも大きくなければなりません。 |
③ | Conditioning Combine ノードを追加し、それを Prompt Conditioning ノードと Image Conditioning ノードに接続します。Prompt Conditioning が最初の入力であることに注意してください。 |
④ | そして、Text Prompt に「running shoes」を入力しました。 |
⑤ | 生成された画像は主にランニングシューズですが、スタイルは入力画像のレゴスタイルです。 |
Prompt Conditioning
と Image Conditioning
の割合をどのように割り当てるかに依存します。要件に応じて調整してください。