AI-Toolkitで顔の一貫性が高いLoRAを作る方法(Z-Image-base bf16 / RTX5090)

今回は、AI-Toolkit + Z-Image baseを使って
「顔の一貫性(identity consistency)が高いLoRA」を作る方法を解説します。

実際に私は以下の条件でトレーニングを行い、かなり安定した結果が出ました:

1. 使用した全体設定(重要)

まずは今回のコア設定をまとめます。

■ JOB / MODEL

👉 トリガーワードは必ず一意な名前にしてください(超重要)

■ TRAINING設定

■ LoRA設定

👉 顔LoRAでは Rank 16はバランス良好
(低すぎると情報不足、高すぎると過学習)

■ 保存設定

2. Dataset設定(ここが一番重要)

顔の一貫性はデータセット品質で9割決まると言ってもいいです。

■ 今回の設定

3. サンプリング設定(見落とされがち)

トレーニング中の確認用サンプル設定:

👉 Walk Seed ONはかなり重要
→ 同じ顔のバリエーション確認がしやすい

4. 実際のトレーニング進行

ログを見ると:

途中ログ例:

👉 顔LoRAとしてはかなり安定した収束

5. 顔の一貫性を上げるためのコツ(核心)

ここがこの記事の一番大事な部分です。

✅ ① データは「同一人物」だけにする

NG:

OK:

✅ ② 顔の比率を揃える

理想:

NG:

✅ ③ 角度バリエーションは必要

最低限:

👉 これがないと「特定角度だけ強いLoRA」になる

✅ ④ キャプションはシンプルに

今回のおすすめ:

songze, 1person

余計な情報は入れない

👉 顔LoRAでは情報を絞るほど安定

✅ ⑤ ステップ数は多すぎない

今回:

目安:

枚数ステップ
20枚3000前後
30枚3500〜4500
50枚5000前後

👉 多すぎると顔が崩れる(過学習)


6. よくある失敗

❌ 顔が安定しない

原因:


❌ 似てるけど別人になる

原因:


❌ 画風が混ざる

原因:


7. 今回の設定のポイントまとめ

今回の成功要因はこの3つ:

  1. 1024解像度で統一
  2. EMA ONで安定化
  3. Repeat 25で十分な学習量確保

8. 結論

この構成(30枚・1024px・4000steps)でも:

👉 顔の一貫性はかなり高いLoRAが作れる

特にZ-Image + FlowMatchの組み合わせは:


もしさらに精度を上げたいなら

ただし:

👉 まずは今回の設定がベースとして最適

コメントを残す

必須項目 *