5090でLTX 2.3を試してみた:安定性は高いが細部はまだ改善余地あり
5090でLTX 2.3を軽く試してみたけど、全体的にはけっこう安定していて良い感じ。以前の画像→動画よりもだいぶ手間が減った。 一番感じたのは、安定性がかなり上がっていること。前みたいにフレームごとに崩れる感じはほぼなくて、結果もある程度予測できるようになった。 ただ、問題もあって、動きがたまにスライドショーっぽくなる。動いてはいるけど、あまり自然な連続性がない感じ。 自分は線画が好きなのでそこも試したけど、やっぱり線画→動画は難しい。線がブレたり、構造が安定しなかったりして、色付きの絵より難易度が高い印象。 音声まわりもまだシンプルで、基本はプログラムの自動音声に頼る形。自分で音声を作ると映像との同期が難しいし、環境音まではなかなか手が回らない。 ワークフローはLTX公式のものをそのまま使用。普通に使えるけど、特別賢い感じはない。 あとやっぱり一番重要なのはプロンプト。具体的に書くほど結果に差が出る。動画だと特にその差が大きい。 まとめると、もう実用レベルには来ていて、以前よりかなり安定。ただ細かい部分はまだ改善の余地あり、という感じ。 ちなみに、5090環境でdevモデルを使った場合、10秒の動画生成はだいたい3〜5分くらいで完了する。