FLUX1-KontextがComfyUIに対応!RTX 5090でテスト結果

Black Forest Labsが開発したAI画像生成技術の新たな可能性を示す革新的なモデルFLUX1-Kontextが、ついにComfyUIでの利用が可能になりました。今回は、最新のRTX 5090を使用して実際の性能を検証し、効果的なプロンプト技法についても詳しく解説します。

FLUX1-Kontextとは

FLUX1-Kontextは、従来のFLUXモデルの進化版として位置づけられる画像生成モデルです。特に画像の編集や変換において優れた性能を発揮し、既存の画像に対して精密な修正や風格変換を行うことができます。このモデルの最大の特徴は、原画像の構図や重要な要素を保持しながら、指定された部分のみを自然に変更できる点にあります。

必要なモデルファイル

ComfyUIでFLUX1-Kontextを使用するには、以下のファイルが必要です:

Diffusion Model

メインとなる拡散モデルは、Hugging Faceから2つの選択肢があります:

VAE(Variational Autoencoder)

ae.safetensors

https://huggingface.co/Comfy-Org/Lumina_Image_2.0_Repackaged/blob/main/split_files/vae/ae.safetensors

text encoder

Model Storage Location

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 diffusion_models/
│   │   └── flux1-dev-kontext_fp8_scaled.safetensors
│   ├── 📂 vae/
│   │   └── ae.safetensor
│   └── 📂 text_encoders/
│       ├── clip_l.safetensors
│       └── t5xxl_fp16.safetensors 或者 t5xxl_fp8_e4m3fn_scaled.safetensors

RTX 5090でテスト結果

最新のRTX 5090を使用して、FLUX1-Kontextの性能を実際に測定しました。テスト条件は以下の通りです:

テスト環境

結果

1枚の画像生成に要する時間は約25秒でした。この結果は、RTX 4090と比較して約30%の性能向上を示しており、RTX 5090の大幅な性能アップが実感できます。特に32GBという大容量VRAMにより、オリジナル版のモデルを安定して動作させることができる点は大きなアドバンテージです。メモリ使用量については、オリジナル版で約32GB、FP8圧縮版で約20GBとなっており、RTX 5090の32GB VRAMを最大限活用できる設計となっています。

効果的なプロンプト技法

FLUX1-Kontextを最大限活用するためには、適切なプロンプト作成が重要です。以下に、実践的なテクニックを紹介します。

基本的な修正指示

最もシンプルな使用方法は、直接的な変更指示です:

これらの指示では、変更したい要素を明確に指定し、保持したい要素についても言及することが重要です。

風格転換の技法

FLUX1-Kontextの真価が発揮されるのが風格転換機能です。効果的な風格転換を行うためのポイントは以下の通りです:

具体的な風格名の指定 単に「アート風に」ではなく、「バウハウス様式に変換」のように具体的な風格名を使用します。

特徴的な要素の描写 「厚い絵具のテクスチャーが見える油絵風に変換」のように、その風格の特徴的な要素を詳しく記述します。

構図の保持 「オリジナルの構図を保ちながらバウハウス様式に変更」のように、保持したい要素を明確に指定します。

キャラクター一貫性の維持

人物が含まれる画像の編集において、キャラクターの一貫性を保つことは特に重要です:

具体的な描写 「彼女」のような代名詞ではなく、「短い黒髪の女性」のように具体的に描写します。

特徴の保持 「同じ顔立ち、髪型、表情を保ちながら」のように、保持したい特徴を列挙します。

段階的な編集 複雑な変更の場合は、まず背景を変更し、次に動作を調整するなど、段階的にアプローチします。

テキスト編集機能

FLUX1-Kontextは画像内のテキストの編集も可能です:

プロンプトテンプレート

以下は、様々な編集タスクに対応するプロンプトテンプレートです:

オブジェクト修正

「[オブジェクト]を[新しい状態]に変更し、[保持したい内容]は変更しない」

`Change to daytime while maintaining the same style of the painting,while maintaining the same facial features,The hairstyle, height, hair length, character, height, and all elements of the picture should remain unchanged.

"...while preserving his exact facial features, eye color, and facial expression"

"..while maintaining the same facial features, hairstyle, and expression""

...keeping the same identity and personality"

"..preserving their distinctive appearance"

Color the picture

風格転換

「[具体的な風格]に変換し、[構図/キャラクター/その他]は変更しない」

Using this style, create a portrait of a girl

"Transform to [specific style], while maintaining [composition/character/other] unchanged"

transform image into Ghibli Art

その他

Extract lines and convert them into line drawing

workflow

https://drive.google.com/file/d/1rzwNfIAPfDWWfXSkf3uHE1dnxNWX450R/view?usp=sharing

FLUX1-Kontextを効果的に使用するための4つの核心原則:

  1. 具体性の重視:曖昧な表現を避け、精確な描写を心がける
  2. 段階的編集:複雑な修正は複数の簡単なステップに分割する
  3. 保持要素の明確化:変更しない要素を明確に指定する
  4. 適切な動詞選択:「変更」「置換」などの明確な動詞を使用する

コメントを残す

必須項目 *