LoRAトレーニング | 汐言備忘録

漫画LoRA用のキャラ素材を作る

May 23, 2026

漫画LoRA用のキャラ素材を作るために、まず anima でキャラを1体作ってみた。そのあと GPT にいろんな表情・ポーズ差分を作ってもらったんだけど、これが意外とかなり使える。参考プロンプトはこんな感じ👇 1:1サイズ。同じキャラクターで、表情・ポーズ・服装を必要に応じて変えながら、以下の表情や動作の画像を8枚作成。表情差分：ぐるぐる目 / 豆目、滝みたいな涙、冷や汗＋黒線、糸目、照れ顔、高飛車・見下し顔、腹黒・悪い笑顔、ハート目。基本感情：喜び、怒り、悲しみ、驚き。ポーズ差分：JOJO立ち、片足ぴょんのカワイイポーズ、ツンデレ腕組み、OTZ / 跪いて絶望、頭を抱えてしゃがむ防御ポーズ。漫画っぽいLoRA用の表情・ポーズ素材を作るなら、こういう指定かなり相性いいかも。anima → GPT で差分作成、普通にアリ。表情差分：ぐるぐる目...

LoRAトレーニング漫画

Z-Imageで「イラスト風」のLoRAを作ってみる

May 7, 2026

今回は、Z-Imageをベースにして、qingman_style というトリガーワードで呼び出せるイラスト風LoRAを作る設定について、ざっくり話していきます。結果: 今回の目的は、キャラクターそのものを覚えさせるというより、絵柄を覚えさせることです。なので、設定の中でも content_or_style: "style" になっています。ここがけっこう大事で、「この子を再現したい」ではなく、「この雰囲気の絵を出したい」という方向ですね。データセットは D:\lora\ai-toolkit\datasets/qingman に置いていて、解像度は 1024。Z-Imageは高解像度のイラスト表現とも相性を見たいので、最初から1024で学習する形になっています。キャプションは .txt を読む設定で、caption_dropout_rate は 0.15。つまり、たまにキャプションを落として、モデルがテキストに頼りすぎないようにしている感じです。 LoRAのネットワーク設定は、linear: 64、conv: 32。わりとしっかりめにスタイルを入れる設定ですね。軽いLoRAというより、「ちゃんと絵柄を乗せたい」方向です。linear_alpha も 64、conv_alpha...

LoRAトレーニング Z-Image イラスト風

AI-Toolkitで顔の一貫性が高いLoRAを作る方法（Z-Image-base bf16 / RTX5090）

April 10, 2026

今回は、AI-Toolkit + Z-Image baseを使って「顔の一貫性（identity consistency）が高いLoRA」を作る方法を解説します。実際に私は以下の条件でトレーニングを行い、かなり安定した結果が出ました： 1. 使用した全体設定（重要）まずは今回のコア設定をまとめます。 ■ JOB / MODEL 👉 トリガーワードは必ず一意な名前にしてください（超重要） ■ TRAINING設定 ■ LoRA設定 👉...

AI-Toolkit LoRAトレーニング Z-Image

RTX 5090環境でのZ-Image Base + AI Toolkit LoRA生成テスト記録

February 27, 2026

最近は仕事が立て込んでいて、なかなかモデル検証に時間を割けていませんでした。それでも合間を見ていくつかのモデルを触ってみたところ、Z-Image系の出力が思った以上に良かったので、備忘録も兼ねてまとめておこうと思います。生成結果のサンプル全体的に見て、第一印象は「かなり安定している」というもの。特に肌の表現が自然で、違和感の少ない仕上がりになる点が印象的でした。結論（まとめ）今回の検証をざっくりまとめると、以下のようになります。つまり、 👉「雰囲気・質感重視ならZ-Image」 👉「厳密なキャラ再現なら他モデル（Wanなど）」という棲み分けがしっくりきます。実行環境と生成速度今回の検証環境は以下の通りです。この構成で、 👉 1枚あたり約40秒という結果でした。正直なところ、このクラスのモデルとしては「悪くない速度感」です。極端に速いわけではないですが、品質とのバランスはかなり良好だと感じました。...

AI Toolkit comfyui LoRAトレーニング Z-Image

RTX 5090 で Musubi-Tuner をインストールし、Wan 2.2 の LoRA の作成方法

August 12, 2025

1. はじめに Wan 2.2 は静止画でも動画でも他モデルを上回る仕上がりを見せます。これまで flux 系のモデルを多く作ってきましたが、人物の一貫性を保つため、今回は Wan 2.2 を試してみました。環境はメモリ 64GB／GPU：RTX 5090（VRAM 32GB）。学習にかかった時間は以下の画像のとおりです。先に結論：高ノイズ／低ノイズの特性が異なるため、モデルは高ノイズ用と低ノイズ用をそれぞれ学習します（= 従来と違い 2 回学習）。 1...

LoRAトレーニング Musubi-Tuner Wan 2.2

Google ColabでFlux LoRAモデルをトレーニングの実践手順紹介！

June 16, 2025

はじめに Comfyuiで、LoRAモデルの重要性はますます高まっています。特にFluxモデルでのLoRAトレーニングは、個性的なキャラクターや独特なアーティスティックスタイルを再現するために欠かせない技術となっています。私は自宅にRTX 5090を所有していますが、LoRAモデルのトレーニングにおいてGoogle Colabを選択している理由があります。RTX 5090は間違いなく強力なGPUですが、消費電力が非常に高く、長時間のトレーニングセッションでは電気代が気になります。さらに、数時間連続で動作させると発熱も相当なものになり、負荷が心配になります。そこで、Google ColabのA100 GPUを活用することで、これらの問題を解決しながら効率的にLoRAモデルをトレーニングする方法をご紹介します。 Ⅰ：写真選択数量15ー50 キャラクターLoRAの場合キャラクターLoRAを作成する際の写真選択は、最終的な品質を決定する最も重要な要素の一つです。以下の基準を厳密に守ることで、原人物に非常に近いLoRAモデルを作成できます。背景除去の重要性まず、すべての写真から背景を完全に除去し、人物のみを残すことが重要です。背景が残っていると、モデルが人物の特徴ではなく背景の要素を学習してしまう可能性があります。この作業は手間がかかりますが、最終的な品質に大きく影響するため妥協できません。 comfyuiで背景を除去方法: https://shiokoto.com/archives/72 解像度とサイズの最適化写真の解像度は可能な限り高品質を維持し、理想的には1024×1024ピクセルのサイズに統一します。これより小さいサイズでも訓練は可能ですが、あまりに小さすぎたりぼやけた写真は避けるべきです。解像度が低い写真を使用すると、生成される画像の品質も低下してしまいます。多角度撮影の重要性...

Flux LoRA Google Colab LoRAトレーニング