RTX5090でFlux Kontextモデルの3枚画像を1枚に融合して、素晴らしい!

RTX5090でFlux Kontextモデルの3枚画像を1枚に融合して、素晴らしい!

RTX5090でFlux Kontextモデルの複数画像を1枚に融合するワークフローを試してみましたが、効果は素晴らしいです! ワークフロー: https://drive.google.com/file/d/19ex1yWXEedkCYiMKNXKJ0lqOIKeXnvdc/view?usp=sharing プロンプト技法 1枚目と2枚目の画像はキャラクターとアイテムにして、3枚目の画像は背景にするのがベストです。プロンプトには画像内の英語と「in the photo」を含めるのがよく、最後に「background on the right」を付けてください。 マルチ画像融合 一貫した表示効果を確保するため、以下の例では画像とプロンプトを統一して使用します: The woman is holding the gun in...

Flux Kontext 複数画像融合
FLUX1-KontextがComfyUIに対応!RTX 5090でテスト結果

FLUX1-KontextがComfyUIに対応!RTX 5090でテスト結果

Black Forest Labsが開発したAI画像生成技術の新たな可能性を示す革新的なモデルFLUX1-Kontextが、ついにComfyUIでの利用が可能になりました。今回は、最新のRTX 5090を使用して実際の性能を検証し、効果的なプロンプト技法についても詳しく解説します。 FLUX1-Kontextとは FLUX1-Kontextは、従来のFLUXモデルの進化版として位置づけられる画像生成モデルです。特に画像の編集や変換において優れた性能を発揮し、既存の画像に対して精密な修正や風格変換を行うことができます。このモデルの最大の特徴は、原画像の構図や重要な要素を保持しながら、指定された部分のみを自然に変更できる点にあります。 必要なモデルファイル ComfyUIでFLUX1-Kontextを使用するには、以下のファイルが必要です: Diffusion Model メインとなる拡散モデルは、Hugging Faceから2つの選択肢があります: VAE(Variational Autoencoder) ae.safetensors https://huggingface.co/Comfy-Org/Lumina_Image_2.0_Repackaged/blob/main/split_files/vae/ae.safetensors text encoder Model Storage...

FLUX1-Kontext
Google ColabでFlux LoRAモデルをトレーニングの実践手順紹介!

Google ColabでFlux LoRAモデルをトレーニングの実践手順紹介!

はじめに Comfyuiで、LoRAモデルの重要性はますます高まっています。特にFluxモデルでのLoRAトレーニングは、個性的なキャラクターや独特なアーティスティックスタイルを再現するために欠かせない技術となっています。 私は自宅にRTX 5090を所有していますが、LoRAモデルのトレーニングにおいてGoogle Colabを選択している理由があります。RTX 5090は間違いなく強力なGPUですが、消費電力が非常に高く、長時間のトレーニングセッションでは電気代が気になります。さらに、数時間連続で動作させると発熱も相当なものになり、負荷が心配になります。 そこで、Google ColabのA100 GPUを活用することで、これらの問題を解決しながら効率的にLoRAモデルをトレーニングする方法をご紹介します。 Ⅰ:写真選択 数量15ー50 キャラクターLoRAの場合 キャラクターLoRAを作成する際の写真選択は、最終的な品質を決定する最も重要な要素の一つです。以下の基準を厳密に守ることで、原人物に非常に近いLoRAモデルを作成できます。 背景除去の重要性 まず、すべての写真から背景を完全に除去し、人物のみを残すことが重要です。背景が残っていると、モデルが人物の特徴ではなく背景の要素を学習してしまう可能性があります。この作業は手間がかかりますが、最終的な品質に大きく影響するため妥協できません。 comfyuiで背景を除去方法: https://shiokoto.com/archives/72 解像度とサイズの最適化 写真の解像度は可能な限り高品質を維持し、理想的には1024×1024ピクセルのサイズに統一します。これより小さいサイズでも訓練は可能ですが、あまりに小さすぎたりぼやけた写真は避けるべきです。解像度が低い写真を使用すると、生成される画像の品質も低下してしまいます。 多角度撮影の重要性...

Flux LoRA Google Colab LoRAトレーニング
AI時代─検索に取って代わり、人間は本当に不要になるのか?これからどうなる?

AI時代─検索に取って代わり、人間は本当に不要になるのか?これからどうなる?

AI時代の「検索」と「創造」、これからどうなる?──人間がいなくちゃ始まらない理由 インターネットが普及し始めた頃を覚えていますか?検索エンジンで調べ物をして、「情報の海」にどっぷり浸かった経験。キーワードを打ち込んで、リンクをひとつずつ開いて、「これ本当かな?」って自分で判断しながら知識を身に着けていく。そんな「自分で探す」体験が、生成AIの登場で大きく変わろうとしています。 今やチャットボットに質問すれば、きちんとまとまった答えがパッと返ってくる。もうリンクを開いて回る必要もない。でも「AIが検索を完全に置き換えて、人間は要らなくなるの?」って聞かれたら、私は絶対に「そんなことない!」と答えます。 むしろ、オリジナルのデータを作り出せる人間こそ、これからのAI時代でもっと価値が高まっていくと思うんです。その理由を3つのポイントで説明してみますね。 1. いいデータがなければ、AIも困ってしまう 生成AIの答えって、結局は学習したデータを統計的に組み合わせ直しているだけなんです。例えば人物の絵を描かせようとしても、その人の写真がネット上になければ、AIは「それっぽく」描くことすら難しい。 現実世界で写真を撮ったり、紙にスケッチしたり、体験したことをメモに残したり。こういう「生の情報」こそが、AIの栄養源なわけです。 もし世界から「人間が作った本物のデータ」がなくなって、AIが過去にAIが作ったものだけを学習するようになったらどうでしょう?フィードバックがどんどん悪くなって、ノイズやバイアスが増えて、最終的には「コピーのコピー」みたいな意味のないものになってしまいます。MP3を何度も圧縮すると音がどんどん悪くなるのと同じですね。 いい検索結果を得るには、やっぱり質の高いオリジナルが必要不可欠なんです。 2. 本当の創造性は「予想外」と「想い」が生み出す AIが文章やプログラムを作る仕組みって、確率的に「次に来そうな言葉」を選び続けることです。でも素晴らしい作品って、「ありそうでなかった」アイデアの組み合わせから生まれますよね。一方でAIの本質は「ありそう」なものを出力することにあります。 人間の創造性には二つの要素があります: 経験と知識の積み重ね(これはAIも得意) 意図的な飛躍と感情(これはAIには真似できない) 後者は、「この問題をなんとか解決したい!」っていう内からわいてくる動機や、失敗の痛みから学んだ教訓みたいな「背景のある想い」によって生まれます。AIが過去の作品を参考にして素早く試作品を作れたとしても、「なぜそれを作るのか」という問いへの答えは、やっぱり人間の体験からしか生まれないんです。 3. AI+人間のコラボが当たり前の時代 検索や創造の現場では、もう「AI+人間」のチームワークが主流になってきています。私が感じている実際の役割分担はこんな感じです:...

AIと人間 AIと検索
Photoshop不要!ComfyUIでOneクリック完璧無料写真背景消す

Photoshop不要!ComfyUIでOneクリック完璧無料写真背景消す

RMBG-2.0・INSPYRENET・BEN・BEN2の画像切り抜きモデル を徹底比較 背景を瞬時に抜き、被写体だけをくっきり残す――そんな夢のワークフローが、生成 AI ノードベース GUI「ComfyUI」を紹介します。GitHub の 1038lab/ComfyUI-RMBG プラグインを導入すれば、RMBG-2.0・INSPYRENET・BEN・BEN2 の 4 方式をボタン 1 つで試せます。実際に 4 つを検証したところ、筆者環境では INSPYRENET が最も優秀。逆光や複雑な髪の毛も驚くほど自然に切り抜き、頭頂部の細い毛先まで完璧に保持しました。 RMBG プラグインのインストール...

comfyui INSPYRENET 写真背景消す 画像切り抜き
RTX5090でオープンソース無料動画生成モデル 「Wanvace」完全ガイド

RTX5090でオープンソース無料動画生成モデル 「Wanvace」完全ガイド

Wanvaceとは何か Wanvaceは14BパラメータのオープンソースモデルでHD動画生成を行い、開始フレームと終了フレームから動画を生成する技術として設計されている。VACEという名称は「Video Auto Creative Engine」の略称と推測され、その名の通り動画制作における自動化と創造性を両立させた画期的なシステムである。 関連リンク Wanvace 必要モデルファイル 拡散モデル VAE テキストエンコーダー 以下のモデルから一つを選択してください: fp16またはfp8から選択できます。私はkijaiのラッパーとの互換性に合わせてfp16を使用しました。 ファイル保存場所 WanVACEワークフロー このワークフローは少し処理が遅いですが、いくつかテストした結果、この効果が最も安定しています。 今回のComfyUIワークフローは、記事末尾のGoogleドライブからダウンロードできます。 wanvace_i2v-rtx5090.json

ai comfyui wanvace 画像生成動画