Z-Imageで「イラスト風」のLoRAを作ってみる

Z-Imageで「イラスト風」のLoRAを作ってみる

今回は、Z-Imageをベースにして、qingman_style というトリガーワードで呼び出せるイラスト風LoRAを作る設定について、ざっくり話していきます。 結果: 今回の目的は、キャラクターそのものを覚えさせるというより、絵柄を覚えさせることです。なので、設定の中でも content_or_style: "style" になっています。ここがけっこう大事で、「この子を再現したい」ではなく、「この雰囲気の絵を出したい」という方向ですね。 データセットは D:\lora\ai-toolkit\datasets/qingman に置いていて、解像度は 1024。Z-Imageは高解像度のイラスト表現とも相性を見たいので、最初から1024で学習する形になっています。キャプションは .txt を読む設定で、caption_dropout_rate は 0.15。つまり、たまにキャプションを落として、モデルがテキストに頼りすぎないようにしている感じです。 LoRAのネットワーク設定は、linear: 64、conv: 32。わりとしっかりめにスタイルを入れる設定ですね。軽いLoRAというより、「ちゃんと絵柄を乗せたい」方向です。linear_alpha も 64、conv_alpha...

LoRAトレーニング Z-Image イラスト風
AI-Toolkitで顔の一貫性が高いLoRAを作る方法(Z-Image-base bf16 / RTX5090)

AI-Toolkitで顔の一貫性が高いLoRAを作る方法(Z-Image-base bf16 / RTX5090)

今回は、AI-Toolkit + Z-Image baseを使って「顔の一貫性(identity consistency)が高いLoRA」を作る方法を解説します。 実際に私は以下の条件でトレーニングを行い、かなり安定した結果が出ました: 1. 使用した全体設定(重要) まずは今回のコア設定をまとめます。 ■ JOB / MODEL 👉 トリガーワードは必ず一意な名前にしてください(超重要) ■ TRAINING設定 ■ LoRA設定 👉...

AI-Toolkit LoRAトレーニング Z-Image
RTX 5090環境でのZ-Image Base + AI Toolkit LoRA生成テスト記録

RTX 5090環境でのZ-Image Base + AI Toolkit LoRA生成テスト記録

最近は仕事が立て込んでいて、なかなかモデル検証に時間を割けていませんでした。 それでも合間を見ていくつかのモデルを触ってみたところ、Z-Image系の出力が思った以上に良かったので、備忘録も兼ねてまとめておこうと思います。 生成結果のサンプル 全体的に見て、第一印象は「かなり安定している」というもの。 特に肌の表現が自然で、違和感の少ない仕上がりになる点が印象的でした。 結論(まとめ) 今回の検証をざっくりまとめると、以下のようになります。 つまり、 👉「雰囲気・質感重視ならZ-Image」 👉「厳密なキャラ再現なら他モデル(Wanなど)」 という棲み分けがしっくりきます。 実行環境と生成速度 今回の検証環境は以下の通りです。 この構成で、 👉 1枚あたり約40秒という結果でした。 正直なところ、 このクラスのモデルとしては「悪くない速度感」です。 極端に速いわけではないですが、 品質とのバランスはかなり良好だと感じました。...

AI Toolkit comfyui LoRAトレーニング Z-Image