前回の記事では、SDXL系3モデルとFlux.1のQ4量子化版で春夏秋冬の画像を比較した。

Flux.1は「SDXLの次世代」として話題になったモデルだが、前回はMacのローカル環境でGGUF量子化版(Q4_K_S)を使ったこともあり、正直微妙な結果だった。「量子化のせいでは?」「フル精度なら違うのでは?」という疑問が残っていた。
そこで今回は、Flux.1をフル精度(fp16)で動かして本気のモデル比較をやってみることにした。ついでに、Civitaiで人気のFlux系ファインチューンモデルも複数試してみた。
結論から言うと、期待したほどの結果は出なかった。ただし、リアル系モデルは想像以上に良かったし、色々わかったこともある。悪戦苦闘の記録も含めて共有する。
今回もClaude Codeに全部丸投げ。モデルのダウンロード、ComfyUI APIの操作、画像生成まで全てチャットで指示するだけ。ただし今回はローカルではなくクラウドGPUを使ったので、環境構築の苦労が加わっている。
今回のポイント
- Flux.1をフルスペック(fp16、24GB)で動かすためにRunPod(クラウドGPU)を使用
- RTX 4090(24GB VRAM)で6モデル×4シーズン=24枚を生成
- アニメ系モデルは軒並み期待外れ、リアル系は意外と良かった
- 設定周りでいくつかハマりポイントがあり、追加検証も行った
なぜRunPodを使ったのか
Flux.1-devのfp16モデルは約24GB。前回使ったGGUF Q4版(約6GB)とは桁違いのサイズだ。
Mac(Apple Silicon M4 Pro)のユニファイドメモリでも理論上は動くが、Q8版(12GB)でも1枚の生成に数分かかり、実用的ではなかった。fp16で6モデル×4シーズン=24枚を生成するなら、GPU環境は必須だ。
そこでRunPodを使うことにした。RunPodはクラウドGPUのレンタルサービスで、RTX 4090(24GB VRAM)が約$0.59/時間で使える。ComfyUIのテンプレートが用意されているので、Podを起動するだけでほぼ環境が整う。
RunPodのセットアップで苦労したこと
「起動するだけ」と書いたが、実際にはそこそこ苦労した。
- ディスク容量不足:最初50GBのVolume Diskで始めたが、Flux.1 fp16(24GB)+ファインチューンモデル複数で全然足りず。途中でダウンロード中のファイルが破損するトラブルも発生し、結局200GBに拡張した
- SSHが繋がらない:SSHキーを設定したが最後まで繋がらなかった。結局JupyterLabのターミナルとComfyUI APIで全作業を行った
- Civitai APIが不安定:CivitaiのAPIキー発行画面がずっとローディングで止まり、一部モデルのダウンロードに苦戦。最終的にAPIキーが取れたのは翌日だった
- 課金が時間ベース:画像を生成していなくてもGPUの課金は走る。こまめにPodを止めないと無駄に課金される。これは要注意
生成条件
共通設定
| 項目 | 設定値 |
|---|---|
| GPU | RTX 4090(24GB VRAM)via RunPod |
| ツール | ComfyUI(API経由でClaude Codeが操作) |
| 解像度 | 896×1152 |
| ステップ数 | 25 |
| サンプラー | Euler / Simple |
| CFG | 1.0 |
| Seed | 42(固定) |
プロンプト
第1弾の記事と基本的に同じプロンプトを使用。日本人女性の春夏秋冬4シーン。Flux向けにネガティブプロンプトは使わず、ポジティブプロンプトのみで生成している。
比較するモデル
| モデル名 | 種別 | サイズ | 特徴 |
|---|---|---|---|
| Flux.1-dev fp16 | ベースライン | 24GB | 公式のフル精度版 |
| Flux.1-dev fp8 | ベースライン | 12GB | 8bit量子化版 |
| blue_pencil-flux v0.2.1 | アニメ系 | 24GB | アニメイラスト特化 |
| AnimePro FLUX | アニメ系 | 12GB | Flux.1 Schnellベースのアニメ特化 |
| WAI-Ani-Flux | アニメ系 | 11GB | Civitai人気のアニメ特化FP8 |
| CyberRealistic Flux V2.5 | リアル系 | 24GB | 実写風特化 |
生成結果
1. Flux.1-dev fp16(ベースライン)
まずは公式モデルのフル精度版。これを基準に各モデルを比較する。




アニメ調の仕上がり。プロンプトに忠実で安定感はある。ただ、前回のSDXL系モデル(AnimagineXLやfudukiMixなど)と比べると、正直「普通」という印象。悪くはないが、感動もない。
2. Flux.1-dev fp8(軽量版)
fp16の半分のサイズ(12GB)。品質に差はあるのか?




fp16とほぼ見分けがつかない。並べて見比べてもどっちがどっちかわからないレベル。量子化の影響はこの用途ではほとんど感じない。VRAMに余裕がなければfp8で十分だ。
3. blue_pencil-flux v0.2.1(アニメ系)
アニメイラスト特化のFluxファインチューンモデル。期待していたが…


掲載できるのは秋と冬だけ。春と夏は露出が強すぎてブログに載せられない画像になった。モデル自体がNSFW方向に学習されているようで、普通のプロンプトでも攻めた表現になってしまう。ブログ用途には不向き。
4. AnimePro FLUX(アニメ系)
Flux.1 Schnellベースのアニメ特化モデル。Apache 2.0ライセンスで商用利用可能が売り。




3DCG風のアニメ調で、目が大きめ。後から判明したのだが、このモデルはSchnellベースで推奨ステップ数が4〜8。今回は25ステップで生成してしまったため、過剰にディテールが追加されて不自然な仕上がりになった可能性がある(この検証は後述)。
5. WAI-Ani-Flux(アニメ系)
Civitaiで人気のアニメ系Fluxモデル。APIキー取得に苦戦した末にようやくダウンロードできた一品。




blue_pencilと似た傾向で体型の誇張が強い。アニメ系Fluxモデル全般に言えることだが、SDXLのアニメ系モデルほどの完成度は感じられなかった。
6. CyberRealistic Flux V2.5(リアル系)
リアル系特化モデル。今回一番の当たり。




完全に写真レベル。実在の人物のポートレートと言われても違和感がない。特に冬の雪景色や秋の紅葉との組み合わせが自然で美しい。Fluxの本領はリアル系にあることがよくわかる結果だった。
追加検証:設定を間違えていたのか?
アニメ系モデルが軒並み微妙だったので、「何か根本的に設定を間違えているのでは?」と思い、いくつか検証してみた。
検証1:ステップ数の影響(AnimePro)
AnimePro FLUXはSchnellベースなので推奨ステップ数は4〜8。25ステップで生成してしまったのが問題だったのでは?




確かに4〜8ステップの方が体型が自然で、服のデザインもバランスが良い。25ステップだとデフォルメが強くなりすぎる。Schnell系モデルは「ステップ数が多ければいい」わけではないという罠があった。
ただし、根本的なクオリティが劇的に上がったわけではない。「マシになった」レベルだ。
検証2:FluxGuidanceの影響
Flux.1-devの推奨ガイダンス値は3.5だが、今回のワークフローではFluxGuidanceノードを入れていなかった。これが原因では?
結果:ほぼ変わらなかった。Flux.1-devは「guidance-distilled」モデルなので、ガイダンスの効果が既にモデルに焼き込まれている。外から値をいじっても劇的な変化は出なかった。
検証3:LoRA追加とSeedガチャ
SNSで「AnimePro FLUXはLoRAを入れてこそ」という情報を見つけ、Akira Anime LoRAを追加して試した。さらにSeedを変えて10枚連続生成(Seedガチャ)もやってみた。
結果:どちらも劇的な改善にはならなかった。LoRAで画風は若干変わるが、クオリティの底上げではない。Seedガチャは構図のバリエーションは出るが、品質のブレが少ない。Fluxは「安定して70点」を出すタイプで、SDXLのように当たり外れが大きくない分、大当たりも出にくい。
おまけ:CyberRealisticで色々なシーンを生成
アニメ系が微妙だったので、今回一番出来が良かったCyberRealisticで追加の画像を生成してみた。






どれも写真と見分けがつかないレベル。特に雨の日のネオン反射と夜の東京のストリートスナップ風がかなり映える。リアル系に関してはFluxのポテンシャルは間違いなく高い。
まとめ
モデル評価一覧
| モデル | 評価 | コメント |
|---|---|---|
| Flux.1-dev fp16 | ★★★☆☆ | 安定してるが無難。アニメとしては70点 |
| Flux.1-dev fp8 | ★★★☆☆ | fp16とほぼ同じ。VRAMが厳しいならこちらで十分 |
| blue_pencil | ★★☆☆☆ | NSFW方向に偏りすぎ。一般ブログ用途はNG |
| AnimePro FLUX | ★★☆☆☆ | ステップ数の罠あり。根本的な品質は微妙 |
| WAI-Ani-Flux | ★★☆☆☆ | 体型誇張が強い |
| CyberRealistic | ★★★★★ | 写真レベル。リアル系なら文句なし |
わかったこと
- Fluxはリアル系が得意、アニメ系は発展途上。アニメ系の画像生成ならまだSDXLの方が上
- fp16とfp8の差はほぼない。高価なGPUでfp16を動かすメリットは薄い
- モデルごとに推奨設定が違う。特にSchnell系は低ステップが必須で、知らずに高ステップで回すと逆効果
- 設定を間違えている可能性もまだ残っている。Civitaiの作例を見るともっと良い画像が出ているので、プロンプトの書き方やワークフローの組み方にまだ改善の余地はありそう
RunPodの感想
- ComfyUIテンプレートのおかげでセットアップは比較的簡単
- GPUは画像を生成していなくても課金が走る(時間課金)。こまめにPodを止めるのが重要
- Volume Diskの容量は最初から大きめ(100GB〜)にしておくべき
- SSHが不安定なことがある。JupyterLabのターミナルを使えるようにしておくと安心
- RTX 4090でFlux fp16の画像1枚あたり約1〜2分。24枚の生成に約40分かかった
正直、Fluxのアニメ系は何か根本的に間違えている気がしてならない。もし第4弾をやるなら、ComfyUIのワークフローをもっと研究してからリベンジしたい。
あわせて読みたい




コメント