【第3弾】Claude CodeでFlux.1モデル6種比較!RunPodで悪戦苦闘した結果…

AI

前回の記事では、SDXL系3モデルとFlux.1のQ4量子化版で春夏秋冬の画像を比較した。

【第2弾】Claude CodeにStable Diffusion SDXL+Flux.1で可愛い女の子を描かせてみた!4モデル比較
Stable DiffusionのSDXL系3モデル(AnythingXL・fudukiMix・Animagine XL 4.0)と次世代Flux.1-devで、同じプロンプトから可愛い女の子を生成して比較。Claude Codeで全自動生成した結果、アニメ絵ならSDXL系の圧勝でした。

Flux.1は「SDXLの次世代」として話題になったモデルだが、前回はMacのローカル環境でGGUF量子化版(Q4_K_S)を使ったこともあり、正直微妙な結果だった。「量子化のせいでは?」「フル精度なら違うのでは?」という疑問が残っていた。

そこで今回は、Flux.1をフル精度(fp16)で動かして本気のモデル比較をやってみることにした。ついでに、Civitaiで人気のFlux系ファインチューンモデルも複数試してみた。

結論から言うと、期待したほどの結果は出なかった。ただし、リアル系モデルは想像以上に良かったし、色々わかったこともある。悪戦苦闘の記録も含めて共有する。

今回もClaude Codeに全部丸投げ。モデルのダウンロード、ComfyUI APIの操作、画像生成まで全てチャットで指示するだけ。ただし今回はローカルではなくクラウドGPUを使ったので、環境構築の苦労が加わっている。

今回のポイント

  • Flux.1をフルスペック(fp16、24GB)で動かすためにRunPod(クラウドGPU)を使用
  • RTX 4090(24GB VRAM)で6モデル×4シーズン=24枚を生成
  • アニメ系モデルは軒並み期待外れ、リアル系は意外と良かった
  • 設定周りでいくつかハマりポイントがあり、追加検証も行った

なぜRunPodを使ったのか

Flux.1-devのfp16モデルは約24GB。前回使ったGGUF Q4版(約6GB)とは桁違いのサイズだ。

Mac(Apple Silicon M4 Pro)のユニファイドメモリでも理論上は動くが、Q8版(12GB)でも1枚の生成に数分かかり、実用的ではなかった。fp16で6モデル×4シーズン=24枚を生成するなら、GPU環境は必須だ。

そこでRunPodを使うことにした。RunPodはクラウドGPUのレンタルサービスで、RTX 4090(24GB VRAM)が約$0.59/時間で使える。ComfyUIのテンプレートが用意されているので、Podを起動するだけでほぼ環境が整う。

RunPodのセットアップで苦労したこと

「起動するだけ」と書いたが、実際にはそこそこ苦労した。

  • ディスク容量不足:最初50GBのVolume Diskで始めたが、Flux.1 fp16(24GB)+ファインチューンモデル複数で全然足りず。途中でダウンロード中のファイルが破損するトラブルも発生し、結局200GBに拡張した
  • SSHが繋がらない:SSHキーを設定したが最後まで繋がらなかった。結局JupyterLabのターミナルとComfyUI APIで全作業を行った
  • Civitai APIが不安定:CivitaiのAPIキー発行画面がずっとローディングで止まり、一部モデルのダウンロードに苦戦。最終的にAPIキーが取れたのは翌日だった
  • 課金が時間ベース:画像を生成していなくてもGPUの課金は走る。こまめにPodを止めないと無駄に課金される。これは要注意

生成条件

共通設定

項目 設定値
GPU RTX 4090(24GB VRAM)via RunPod
ツール ComfyUI(API経由でClaude Codeが操作)
解像度 896×1152
ステップ数 25
サンプラー Euler / Simple
CFG 1.0
Seed 42(固定)

プロンプト

第1弾の記事と基本的に同じプロンプトを使用。日本人女性の春夏秋冬4シーン。Flux向けにネガティブプロンプトは使わず、ポジティブプロンプトのみで生成している。

比較するモデル

モデル名 種別 サイズ 特徴
Flux.1-dev fp16 ベースライン 24GB 公式のフル精度版
Flux.1-dev fp8 ベースライン 12GB 8bit量子化版
blue_pencil-flux v0.2.1 アニメ系 24GB アニメイラスト特化
AnimePro FLUX アニメ系 12GB Flux.1 Schnellベースのアニメ特化
WAI-Ani-Flux アニメ系 11GB Civitai人気のアニメ特化FP8
CyberRealistic Flux V2.5 リアル系 24GB 実写風特化

生成結果

1. Flux.1-dev fp16(ベースライン)

まずは公式モデルのフル精度版。これを基準に各モデルを比較する。

Flux dev fp16 春
Flux dev fp16 夏
Flux dev fp16 秋
Flux dev fp16 冬

アニメ調の仕上がり。プロンプトに忠実で安定感はある。ただ、前回のSDXL系モデル(AnimagineXLやfudukiMixなど)と比べると、正直「普通」という印象。悪くはないが、感動もない。

2. Flux.1-dev fp8(軽量版)

fp16の半分のサイズ(12GB)。品質に差はあるのか?

Flux dev fp8 春
Flux dev fp8 夏
Flux dev fp8 秋
Flux dev fp8 冬

fp16とほぼ見分けがつかない。並べて見比べてもどっちがどっちかわからないレベル。量子化の影響はこの用途ではほとんど感じない。VRAMに余裕がなければfp8で十分だ。

3. blue_pencil-flux v0.2.1(アニメ系)

アニメイラスト特化のFluxファインチューンモデル。期待していたが…

blue_pencil 秋
blue_pencil 冬

掲載できるのは秋と冬だけ。春と夏は露出が強すぎてブログに載せられない画像になった。モデル自体がNSFW方向に学習されているようで、普通のプロンプトでも攻めた表現になってしまう。ブログ用途には不向き。

4. AnimePro FLUX(アニメ系)

Flux.1 Schnellベースのアニメ特化モデル。Apache 2.0ライセンスで商用利用可能が売り。

AnimePro 春
AnimePro 夏
AnimePro 秋
AnimePro 冬

3DCG風のアニメ調で、目が大きめ。後から判明したのだが、このモデルはSchnellベースで推奨ステップ数が4〜8。今回は25ステップで生成してしまったため、過剰にディテールが追加されて不自然な仕上がりになった可能性がある(この検証は後述)。

5. WAI-Ani-Flux(アニメ系)

Civitaiで人気のアニメ系Fluxモデル。APIキー取得に苦戦した末にようやくダウンロードできた一品。

WAI-Ani-Flux 春
WAI-Ani-Flux 夏
WAI-Ani-Flux 秋
WAI-Ani-Flux 冬

blue_pencilと似た傾向で体型の誇張が強い。アニメ系Fluxモデル全般に言えることだが、SDXLのアニメ系モデルほどの完成度は感じられなかった

6. CyberRealistic Flux V2.5(リアル系)

リアル系特化モデル。今回一番の当たり。

CyberRealistic 春
CyberRealistic 夏
CyberRealistic 秋
CyberRealistic 冬

完全に写真レベル。実在の人物のポートレートと言われても違和感がない。特に冬の雪景色や秋の紅葉との組み合わせが自然で美しい。Fluxの本領はリアル系にあることがよくわかる結果だった。

追加検証:設定を間違えていたのか?

アニメ系モデルが軒並み微妙だったので、「何か根本的に設定を間違えているのでは?」と思い、いくつか検証してみた。

検証1:ステップ数の影響(AnimePro)

AnimePro FLUXはSchnellベースなので推奨ステップ数は4〜8。25ステップで生成してしまったのが問題だったのでは?

AnimePro 4steps
4ステップ
AnimePro 6steps
6ステップ
AnimePro 8steps
8ステップ
AnimePro 25steps
25ステップ

確かに4〜8ステップの方が体型が自然で、服のデザインもバランスが良い。25ステップだとデフォルメが強くなりすぎる。Schnell系モデルは「ステップ数が多ければいい」わけではないという罠があった。

ただし、根本的なクオリティが劇的に上がったわけではない。「マシになった」レベルだ。

検証2:FluxGuidanceの影響

Flux.1-devの推奨ガイダンス値は3.5だが、今回のワークフローではFluxGuidanceノードを入れていなかった。これが原因では?

結果:ほぼ変わらなかった。Flux.1-devは「guidance-distilled」モデルなので、ガイダンスの効果が既にモデルに焼き込まれている。外から値をいじっても劇的な変化は出なかった。

検証3:LoRA追加とSeedガチャ

SNSで「AnimePro FLUXはLoRAを入れてこそ」という情報を見つけ、Akira Anime LoRAを追加して試した。さらにSeedを変えて10枚連続生成(Seedガチャ)もやってみた。

結果:どちらも劇的な改善にはならなかった。LoRAで画風は若干変わるが、クオリティの底上げではない。Seedガチャは構図のバリエーションは出るが、品質のブレが少ない。Fluxは「安定して70点」を出すタイプで、SDXLのように当たり外れが大きくない分、大当たりも出にくい。

おまけ:CyberRealisticで色々なシーンを生成

アニメ系が微妙だったので、今回一番出来が良かったCyberRealisticで追加の画像を生成してみた。

カフェ
カフェ
夕焼け屋上
夕焼け屋上
雨の日
雨の日
図書館
図書館
夜の東京
夜の東京
ラベンダー畑
ラベンダー畑

どれも写真と見分けがつかないレベル。特に雨の日のネオン反射夜の東京のストリートスナップ風がかなり映える。リアル系に関してはFluxのポテンシャルは間違いなく高い。

まとめ

モデル評価一覧

モデル 評価 コメント
Flux.1-dev fp16 ★★★☆☆ 安定してるが無難。アニメとしては70点
Flux.1-dev fp8 ★★★☆☆ fp16とほぼ同じ。VRAMが厳しいならこちらで十分
blue_pencil ★★☆☆☆ NSFW方向に偏りすぎ。一般ブログ用途はNG
AnimePro FLUX ★★☆☆☆ ステップ数の罠あり。根本的な品質は微妙
WAI-Ani-Flux ★★☆☆☆ 体型誇張が強い
CyberRealistic ★★★★★ 写真レベル。リアル系なら文句なし

わかったこと

  • Fluxはリアル系が得意、アニメ系は発展途上。アニメ系の画像生成ならまだSDXLの方が上
  • fp16とfp8の差はほぼない。高価なGPUでfp16を動かすメリットは薄い
  • モデルごとに推奨設定が違う。特にSchnell系は低ステップが必須で、知らずに高ステップで回すと逆効果
  • 設定を間違えている可能性もまだ残っている。Civitaiの作例を見るともっと良い画像が出ているので、プロンプトの書き方やワークフローの組み方にまだ改善の余地はありそう

RunPodの感想

  • ComfyUIテンプレートのおかげでセットアップは比較的簡単
  • GPUは画像を生成していなくても課金が走る(時間課金)。こまめにPodを止めるのが重要
  • Volume Diskの容量は最初から大きめ(100GB〜)にしておくべき
  • SSHが不安定なことがある。JupyterLabのターミナルを使えるようにしておくと安心
  • RTX 4090でFlux fp16の画像1枚あたり約1〜2分。24枚の生成に約40分かかった

正直、Fluxのアニメ系は何か根本的に間違えている気がしてならない。もし第4弾をやるなら、ComfyUIのワークフローをもっと研究してからリベンジしたい。

あわせて読みたい

Claude CodeにStable Diffusionで可愛い女の子を描かせてみた!7モデル比較
Claude CodeとComfyUIを使って、Stable Diffusionの人気モデル7種類で可愛い女の子の画像を一括生成。Beautiful Realistic、MeinaMix、Counterfeit、Animagine XLなど、同じプロンプトでモデルごとの違いを春夏秋冬4シーンで徹底比較しました。
【第2弾】Claude CodeにStable Diffusion SDXL+Flux.1で可愛い女の子を描かせてみた!4モデル比較
Stable DiffusionのSDXL系3モデル(AnythingXL・fudukiMix・Animagine XL 4.0)と次世代Flux.1-devで、同じプロンプトから可愛い女の子を生成して比較。Claude Codeで全自動生成した結果、アニメ絵ならSDXL系の圧勝でした。

コメント

タイトルとURLをコピーしました