anima base1で90年代レトロアニメ風の画像を作ってみた記録

anima base1で90年代レトロアニメ風の画像を作ってみた記録

最近、anima base1を使って、90年代のレトロアニメっぽい雰囲気の画像を何枚か作ってみました。思っていたよりもけっこう安定していて、全体的な仕上がりもかなり好みでした。 画面の雰囲気としては、昔のOVAっぽい感じです。線はすっきりしていて、光は少し冷たく、色味は柔らかいけどほんのり粒子感がある。キャラクターの表情もやりすぎていなくて、セル画時代のアニメっぽい空気が出ていると思います。 今回ちょっと意外だったのは、LoRAを使わなかったことです。キャラの一貫性を出すためにLoRAを入れるのではなく、プロンプトだけを調整して、できるだけ雰囲気や人物がブレないようにしました。 最初は、LoRAなしだと人物が安定しないかなと思っていたんですが、実際に出してみると、見た目はけっこういい感じでした。顔立ち、髪型、服装、全体の雰囲気も、ある程度まとまってくれました。もちろん完全に固定できるわけではないですが、連続して出しても、急に別の作風に飛ぶような感じはあまりありませんでした。 前にLoRAを使って試したときは、なぜかいろいろ瑕疵が出てしまいました。顔のバランスが崩れたり、目や手、服のディテールが不自然になったり、画面が妙にシャープになりすぎたり。レトロアニメに欲しい柔らかさが少し消えてしまうこともありました。 たぶん、LoRAとベースモデルの相性があまりよくなかったのかもしれません。あるいは、重みやトリガーワード、プロンプト同士の相性が原因だった可能性もあります。なので今回は、無理にLoRAを使わずに、スタイル、光、質感、キャラクター設定をプロンプト側でしっかり書く方向にしました。 結果的には、そのほうが自分の欲しかった雰囲気に近づきました。 このスタイル、かなり好きです。最近のきれいで高精細な二次元イラストというより、少し古いフィルム感や手描き感があるところがいい。キャラの表情も大げさすぎず、画面もエフェクトを盛りすぎていないので、構図や空気感、感情がちゃんと前に出てくる感じがあります。 特に、朝の少し冷たい光、部屋の紙っぽい質感、壁いっぱいの付箋、キャラの顔に落ちる影。そういう細かい要素が重なると、静かだけど少し不穏で、物語の始まりみたいな雰囲気になります。 この系統は、ストーリー性のある短編、絵コンテ、キャラクターのコンセプトアート、あるいは少しミステリアスで内面描写の多いアニメ風のカットにかなり合いそうです。単に「きれいな絵」を作るというより、ひとつの感情や場面を見せるのに向いていると思います。 以下が、今回使ったスタイル用のプロンプトと、ざっくりしたワークフローです。 スタイルプロンプト masterpiece, best quality, beautiful detailed, (classic 1990s...

anima 漫画
漫画LoRA用のキャラ素材を作る

漫画LoRA用のキャラ素材を作る

漫画LoRA用のキャラ素材を作るために、まず anima でキャラを1体作ってみた。そのあと GPT にいろんな表情・ポーズ差分を作ってもらったんだけど、これが意外とかなり使える。 参考プロンプトはこんな感じ👇 1:1サイズ。同じキャラクターで、表情・ポーズ・服装を必要に応じて変えながら、以下の表情や動作の画像を8枚作成。 表情差分:ぐるぐる目 / 豆目、滝みたいな涙、冷や汗+黒線、糸目、照れ顔、高飛車・見下し顔、腹黒・悪い笑顔、ハート目。 基本感情:喜び、怒り、悲しみ、驚き。 ポーズ差分:JOJO立ち、片足ぴょんのカワイイポーズ、ツンデレ腕組み、OTZ / 跪いて絶望、頭を抱えてしゃがむ防御ポーズ。 漫画っぽいLoRA用の表情・ポーズ素材を作るなら、こういう指定かなり相性いいかも。anima → GPT で差分作成、普通にアリ。 表情差分: ぐるぐる目...

LoRAトレーニング 漫画
anima base1モデルによる手描き感の試み

anima base1モデルによる手描き感の試み

anima base1が公開されてから、いろいろな設定を試してきました。全体的な表現力は高いものの、デフォルト設定のままだと、個人的には線の質感がpreview版ほどしっくりこない印象がありました。特に手描き感を重視したい場合、線の強弱や輪郭の出方が少し物足りなく感じることがあります。 そんな中で、いくつか試行錯誤しているうちに、以下のような設定では線の雰囲気がかなり良くなることに気づきました。 この設定では、高めのCFGと低めのノイズによって、輪郭線が比較的はっきり出やすく、手描き風の線のまとまりもかなり良好になります。キャラクターの髪や服の境界、細かな線の情報も残りやすく、anima base1の中でもかなり好みの質感に近づきました。 ただし、問題もあります。この設定だと全体的に画像が暗くなりやすく、色の抜けや明るさの面では少し扱いにくい結果になることが多いです。線の質感は良いのに、完成絵として見るとトーンが沈んでしまい、そのままでは使いづらい場面もありました。 そこで偶然見つけたのが、anima llliteを組み合わせる方法です。 anima base1で生成した、線の質感は良いけれど暗くなってしまった画像を、anima llliteで修正してみたところ、かなり自然に明るさや色味を整えることができました。単なる補正だけでなく、元の線の雰囲気を残したまま、全体の印象をより見やすく仕上げられる点がとても良いと感じました。 実際に比較してみると、anima base1側で得られた手描き感のある線を活かしつつ、anima lllite側で暗さを補正し、色のバランスや画面全体の見栄えを整えることができます。結果として、線画の良さと完成度の両方を取りやすくなりました。 また、この組み合わせは修復用途だけでなく、スタイル変換やポーズ変更にも使えそうです。anima base1でベースとなる雰囲気や線の方向性を作り、その後anima llliteで仕上げや調整を行うことで、かなり柔軟なワークフローが組める印象です。 ワークフロー https://drive.google.com/file/d/1Z6aitdUCk63DgAXoEjm7eoB6HalerfPg/view?usp=sharing まず、anima...

anima
線画と水彩が混ざり合う、あたたかい手描き

線画と水彩が混ざり合う、あたたかい手描き

このイラストの雰囲気が本当に好きです。少しラフな黒い線で形をとり、その上に淡い水彩の色がふわっと重なっている。完璧すぎない線、にじんだ色、紙の質感まで感じられるような仕上がりが、とても自然であたたかい印象を与えてくれます。 特に魅力的なのは、線画の勢いと水彩のやわらかさが同時に存在しているところです。料理のイラストでは、肉の赤みやソースの色が水彩らしく広がり、食べ物の香りまで伝わってくるようです。一方で猫のイラストは、シンプルな線と明るい色づかいによって、少しユーモラスで親しみやすいキャラクターになっています。 このスタイルは、きれいに描き込みすぎないからこそ魅力があります。余白が多く、線も少し揺れていて、色も完全には塗りつぶされていない。その不完全さが、まるでスケッチブックの一ページを見ているような心地よさを生み出しています。 デジタルでありながら、手描きの温度を感じられる表現。線画と水彩が混ざり合ったこのスタイルは、日常の小さなものをやさしく、少し特別に見せてくれる素敵な表現だと思います。 プロンプト例

watercolor 水彩
Z-Imageで「イラスト風」のLoRAを作ってみる

Z-Imageで「イラスト風」のLoRAを作ってみる

今回は、Z-Imageをベースにして、qingman_style というトリガーワードで呼び出せるイラスト風LoRAを作る設定について、ざっくり話していきます。 結果: 今回の目的は、キャラクターそのものを覚えさせるというより、絵柄を覚えさせることです。なので、設定の中でも content_or_style: "style" になっています。ここがけっこう大事で、「この子を再現したい」ではなく、「この雰囲気の絵を出したい」という方向ですね。 データセットは D:\lora\ai-toolkit\datasets/qingman に置いていて、解像度は 1024。Z-Imageは高解像度のイラスト表現とも相性を見たいので、最初から1024で学習する形になっています。キャプションは .txt を読む設定で、caption_dropout_rate は 0.15。つまり、たまにキャプションを落として、モデルがテキストに頼りすぎないようにしている感じです。 LoRAのネットワーク設定は、linear: 64、conv: 32。わりとしっかりめにスタイルを入れる設定ですね。軽いLoRAというより、「ちゃんと絵柄を乗せたい」方向です。linear_alpha も 64、conv_alpha...

LoRAトレーニング Z-Image イラスト風
AI-Toolkitで顔の一貫性が高いLoRAを作る方法(Z-Image-base bf16 / RTX5090)

AI-Toolkitで顔の一貫性が高いLoRAを作る方法(Z-Image-base bf16 / RTX5090)

今回は、AI-Toolkit + Z-Image baseを使って「顔の一貫性(identity consistency)が高いLoRA」を作る方法を解説します。 実際に私は以下の条件でトレーニングを行い、かなり安定した結果が出ました: 1. 使用した全体設定(重要) まずは今回のコア設定をまとめます。 ■ JOB / MODEL 👉 トリガーワードは必ず一意な名前にしてください(超重要) ■ TRAINING設定 ■ LoRA設定 👉...

AI-Toolkit LoRAトレーニング Z-Image
RTX 5090環境でのZ-Image Base + AI Toolkit LoRA生成テスト記録

RTX 5090環境でのZ-Image Base + AI Toolkit LoRA生成テスト記録

最近は仕事が立て込んでいて、なかなかモデル検証に時間を割けていませんでした。 それでも合間を見ていくつかのモデルを触ってみたところ、Z-Image系の出力が思った以上に良かったので、備忘録も兼ねてまとめておこうと思います。 生成結果のサンプル 全体的に見て、第一印象は「かなり安定している」というもの。 特に肌の表現が自然で、違和感の少ない仕上がりになる点が印象的でした。 結論(まとめ) 今回の検証をざっくりまとめると、以下のようになります。 つまり、 👉「雰囲気・質感重視ならZ-Image」 👉「厳密なキャラ再現なら他モデル(Wanなど)」 という棲み分けがしっくりきます。 実行環境と生成速度 今回の検証環境は以下の通りです。 この構成で、 👉 1枚あたり約40秒という結果でした。 正直なところ、 このクラスのモデルとしては「悪くない速度感」です。 極端に速いわけではないですが、 品質とのバランスはかなり良好だと感じました。...

AI Toolkit comfyui LoRAトレーニング Z-Image
WAN2.2のT2Vモデルで画像生成 – Fluxの「プラスチック肌」問題を解決!

WAN2.2のT2Vモデルで画像生成 – Fluxの「プラスチック肌」問題を解決!

WAN2.2のT2V(Text-to-Video)モデルを使って画像生成を試してみたところ、驚くべき結果が得られました。なんと、Fluxモデルで問題となっていた肌のプラスチック感を完全に解消できたのです! RTX5090での検証結果、効果は特に素晴らしいものでした! 使用モデル wan2.2_t2v_low_noise_14B_fp16.safetensors 使用ノード構成 生成速度 処理時間の内訳は以下の通りです: 処理段階設定所要時間基本生成40ステップ約60秒アップスケール2048×204890秒合計処理時間-150秒 Fluxとの比較優位性 従来のFluxモデルでは、特に人物の肌質表現において「プラスチックのような不自然な質感」が課題となっていました。しかし、WAN2.2のT2Vモデルを使用することで: これらの改善により、画像生成の品質が大幅に向上しました。 ワークフローのダウンロード https://drive.google.com/file/d/102b0Lw9JJ80J8xVnNY08e5d2OMhvPYwX/view?usp=sharing まとめ WAN2.2のT2Vモデルは、従来のFluxモデルの弱点を克服した画期的なモデルです。RTX5090との組み合わせにより、高品質な画像を短時間で生成できる実用的なソリューションとなっています。 特に人物画像の生成において、自然な肌質表現を求めるクリエイターにとって、このモデルは非常に価値のあるツールになるでしょう。 総処理時間150秒で高品質な2048×2048の画像が生成できる効率性も、実用面での大きなメリットです。

comfyui wan2.2
自分で訓練した線画風Flux LoRA- fluxlinesun

自分で訓練した線画風Flux LoRA- fluxlinesun

私は以前からminimalist、線画風のアート作品にとても魅力を感じていました。そのシンプルでありながら表現力豊かな線の美しさに惹かれ、自分でもそのような作品を作ってみたいと思っていました。 LoRAについて https://drive.google.com/file/d/1JeFMQ8JGv0WjOD0V_GynFR1h3VX0YSDL/view?usp=sharing ここから fluxlinesun をダウンロードして!トリガーワード:linesun prompt:change the characters in the photo to line drawings,lineart style,linesun change the subjects in the...

minimalist 線画 線画風Flux LoRA
Kontext LoRAを再訓練しない場合、FLUX-devのLoRAを使ってキャラクターの一貫性を向上させる方法

Kontext LoRAを再訓練しない場合、FLUX-devのLoRAを使ってキャラクターの一貫性を向上させる方法

Kontextは改めてLoRAを訓練し直す必要があるのでしょうか?KontextとFLUX-devのLoRAを組み合わせるとどのような結果が得られるのでしょうか? Kontextとプロンプトを直接使用することでも、ある程度顔の一貫性を持った画像を生成できますが、確実性に欠けます。 ワークフロー 以下のワークフローを使用することで、 https://drive.google.com/file/d/1U8Ci13QfGpEv3upjpdZeC0V1Yk7lyCtQ/view?usp=sharing キャラクターLoRAがKontextと連携し、参考画像のポーズや表情、服装、動作を参照して画像を生成し、結果的に参考画像の顔を差し替える効果を得ることができることが分かりました。 核心原理: テスト結果: 効果があるようです。ポーズや表情は読み込まれた画像を参考にし、顔部分はLoRAを使用しています。 このプロンプトでLoRAトリガーワードを除去した後、スタイルも読み込まれた画像を参考にしました。LoRAトリガーワードを追加した後は、ポーズや表情は読み込まれた画像を参考にし、かつ顔部分はLoRAを使用しています。完璧です。

FLUX Kontext ラクターの一貫性
RTX5090でFlux Kontextモデルの3枚画像を1枚に融合して、素晴らしい!

RTX5090でFlux Kontextモデルの3枚画像を1枚に融合して、素晴らしい!

RTX5090でFlux Kontextモデルの複数画像を1枚に融合するワークフローを試してみましたが、効果は素晴らしいです! ワークフロー: https://drive.google.com/file/d/1Fhdej5no_fn4xZmGuii9jTQvkc5dE2bp/view?usp=sharing プロンプト技法 1枚目と2枚目の画像はキャラクターとアイテムにして、3枚目の画像は背景にするのがベストです。プロンプトには画像内の英語と「in the photo」を含めるのがよく、最後に「background on the right」を付けてください。 マルチ画像融合 一貫した表示効果を確保するため、以下の例では画像とプロンプトを統一して使用します: The woman is holding the gun in...

Flux Kontext Kontext 複数画像融合
FLUX1-KontextがComfyUIに対応!RTX 5090でテスト結果

FLUX1-KontextがComfyUIに対応!RTX 5090でテスト結果

Black Forest Labsが開発したAI画像生成技術の新たな可能性を示す革新的なモデルFLUX1-Kontextが、ついにComfyUIでの利用が可能になりました。今回は、最新のRTX 5090を使用して実際の性能を検証し、効果的なプロンプト技法についても詳しく解説します。 FLUX1-Kontextとは FLUX1-Kontextは、従来のFLUXモデルの進化版として位置づけられる画像生成モデルです。特に画像の編集や変換において優れた性能を発揮し、既存の画像に対して精密な修正や風格変換を行うことができます。このモデルの最大の特徴は、原画像の構図や重要な要素を保持しながら、指定された部分のみを自然に変更できる点にあります。 必要なモデルファイル ComfyUIでFLUX1-Kontextを使用するには、以下のファイルが必要です: Diffusion Model メインとなる拡散モデルは、Hugging Faceから2つの選択肢があります: VAE(Variational Autoencoder) ae.safetensors https://huggingface.co/Comfy-Org/Lumina_Image_2.0_Repackaged/blob/main/split_files/vae/ae.safetensors text encoder Model Storage...

FLUX1-Kontext Kontext