【第2弾】Claude CodeにStable Diffusion SDXL+Flux.1で可愛い女の子を描かせてみた!4モデル比較

AI

前回の記事(Claude CodeにStable Diffusionで可愛い女の子を描かせてみた!7モデル比較)では、SD1.5中心の7モデルで春夏秋冬の画像を比較しました。

今回はその第2弾。前回の環境・ノウハウをそのまま使い回して、SDXL系3モデル+話題のFlux.1で同じことをやってみます。

前回同様、Claude Codeに全部丸投げです。モデルのダウンロードからワークフロー作成、生成まで全部チャットで指示するだけ。前回の仕組みがあるので、今回の作業時間はダウンロード待ちを除けばほぼゼロでした。

今回のポイント

  • SDXL系3モデルで比較(AnythingXL、fudukiMix、Animagine XL 4.0)
  • さらに次世代モデルFlux.1-devも参戦
  • 解像度は全モデル896×1152(SDXL世代の標準)
  • プロンプト・シーン・キャラ設定は前回と同じ(比較しやすいように)

Flux.1って何?

Stable Diffusionの生みの親たちがStability AIを離れて設立したBlack Forest Labsが、2024年8月にリリースした次世代画像生成モデルです。

Stable Diffusionとはアーキテクチャが根本的に違い(U-Net → Diffusion Transformer)、プロンプトの理解力が段違いと言われています。タグ羅列ではなく自然な文章で指示を出せるのが特徴。Midjourney・DALL-E 3クラスの品質とも評されています。

ただしアニメ系のファインチューンモデルが主流のSD/SDXL界隈とは方向性が違うので、「可愛いアニメ女の子」というお題でどう出るかは未知数。そこも含めて比較してみます。

生成条件

SDXL系モデル(共通)

UIComfyUI(API経由)
サンプラーDPM++ 2M Karras
ステップ数28
CFG Scale7
解像度896×1152
Seed42(前回と同じ・固定)

Flux.1-dev

UIComfyUI(API経由・GGUF版)
サンプラーEuler / Simple
ステップ数20
CFG Scale1.0(Flux推奨値)
解像度896×1152
Seed42

※Flux.1はSD/SDXLとは設計思想が異なるため、サンプラー・CFG等の設定が違います。ネガティブプロンプトも不要(使えない)です。

プロンプト

SDXL系は前回の記事と同じタグ羅列形式のプロンプトを使用しています。詳しくは前回の記事をご覧ください。

Flux.1はタグ羅列が苦手なため、同じ内容を自然な英語の文章で書き直して入力しています。

キャラ設定は共通で、「肩につくくらいのダークブラウンの髪、茶色い瞳の日本人の女の子」を春(桜+ワンピース)・夏(ビーチ+白ビキニ)・秋(紅葉+セーター)・冬(雪の街+ニット帽)の4シーンで生成しています。

比較するモデル

モデル名ベース特徴
AnythingXLSDXLAnything系のSDXL版。幅広いスタイルに対応する万能型
fudukiMix v2.0SDXL日本人クリエイター製のSDXLミックスモデル。柔らかい色彩が特徴
Animagine XL 4.0SDXL840万枚のアニメ画像で学習した最新版。解剖学的精度と色彩が大幅向上
Flux.1-devFlux(GGUF Q4)次世代アーキテクチャ。自然言語プロンプトに強い。リアル寄り

生成結果

AnythingXL

Anything系のSDXL版。SD1.5時代からある超定番シリーズのSDXL移植で、アニメ系からセミリアルまで幅広く対応。安定感のある優等生。

春 - AnythingXL
夏 - AnythingXL
秋 - AnythingXL
冬 - AnythingXL

fudukiMix v2.0

日本人クリエイターが作ったSDXLミックスモデル。柔らかい色合いと繊細な描き込みが特徴で、日本人好みの絵柄が出やすい。

春 - fudukiMix
夏 - fudukiMix
秋 - fudukiMix
冬 - fudukiMix

Animagine XL 4.0

840万枚のアニメ画像で学習したAnimagineシリーズの最新版(2025年リリース)。前バージョン3.1から解剖学的な精度・色彩の安定性が大幅に向上。SDXL系アニメモデルの中ではトップクラス。

春 - Animagine XL 4.0
夏 - Animagine XL 4.0
秋 - Animagine XL 4.0
冬 - Animagine XL 4.0

Flux.1-dev(GGUF Q4)

話題の次世代モデル。SD/SDXLとはまったく別のアーキテクチャで、自然言語プロンプトの理解力が売り。今回はMac(Apple Silicon)で動かすためにGGUF量子化版を使用。同じお題でも、SDXL系とは明らかに画風が違うので注目。ちなみに1枚の生成に約8分かかります(SDXL系は1〜2分)。時間かかる割には…まあ見てください笑

春 - Flux.1-dev
夏 - Flux.1-dev
秋 - Flux.1-dev
冬 - Flux.1-dev

まとめ

SDXL系3モデル+Flux.1の計4モデルで同じお題を比較してみました。

個人的な印象:

  • AnythingXL → 安定の万能型。破綻が少なく、プロンプトの反応も素直。迷ったらこれ
  • fudukiMix v2.0 → 柔らかい色彩が魅力。日本人好みの雰囲気が出やすい
  • Animagine XL 4.0 → さすが最新版。描き込みの精度と色の安定感が一段上。SDXL系ならイチオシ
  • Flux.1-dev → リアル寄りの画風で、「可愛いアニメ女の子」とは方向性が違う。生成にも時間がかかる(SDXL系の4〜5倍)。ただしプロンプトの理解力は確かに高く、ポテンシャルは感じる

正直、「可愛い女の子」という用途ならSDXL系アニメモデルの圧勝です。Flux.1はフォトリアル系やテキスト描画では評判通り強いのですが、今回のようなアニメ調のお題だと持ち味が出にくい印象でした。

ただFlux.1はまだベースモデルでの勝負なので、今後アニメ特化のLoRAやファインチューンが出てくれば化ける可能性は十分あります。

Apple Silicon(Mac)でFluxを動かす場合の注意

今回はM1 Max(メモリ32GB)のMacで全モデルを動かしました。SDXL系は問題なく動きますが、Flux.1はfp8形式のモデルがApple Silicon(MPS)非対応なので注意が必要です。

解決策としてGGUF量子化版を使いました。ComfyUI-GGUFというカスタムノードをインストールすれば、GGUF形式のモデルをそのまま読み込めます。品質もほとんど劣化なしで、メモリ消費も抑えられるのでMacユーザーにはおすすめです。

Claude Codeの便利さ(再確認)

前回のワークフローがあるおかげで、今回はモデルを差し替えるだけで済みました。Flux.1のような新しいアーキテクチャでも、Claude Codeがワークフローの違い(サンプラー設定やプロンプト形式)を自動で対応してくれるので、自分で調べる手間がほぼゼロ。

「モデル追加して比較したいな」→ チャットで指示 → 生成完了、という流れが確立できたのは大きい。前回の記事と合わせて、合計11モデル×4シーン=44枚の画像を全自動で生成しています。

前回の記事はこちら → Claude CodeにStable Diffusionで可愛い女の子を描かせてみた!7モデル比較

おまけ

Claude Codeに適当にプロンプトを考えさせて生成してみました。

おまけ - Animagine XL 4.0(星空と和服の少女)

Animagine XL 4.0 — 星空の下で水面に立つ和服の少女

おまけ - Flux.1-dev(雨の日のカフェ)

Flux.1-dev — 雨の日のカフェでコーヒーを持つ女性

おまけ2:キャラ特化LoRAで遊んでみた

Animagine XL 4.0に特定キャラクターに特化したLoRAを組み合わせて、シチュエーション違いの4枚を生成してみました。LoRAを使うと、同じキャラクターを一貫した見た目でいろんな場面に登場させられます。

LoRA - 雨の帰り道

雨の帰り道 — 透明傘と濡れた路面のネオン反射

LoRA - 冬のイルミネーション

冬のイルミネーション — 赤マフラーとイルミのボケ味

LoRA - 夕暮れのビーチ

夕暮れのビーチ — 逆光と風になびく髪

LoRA - 朝のカフェ

朝のカフェ — 窓からの光とポニーテール

ベースモデルの画力+LoRAのキャラ再現力の合わせ技で、プロンプトだけでは出せない一貫性のあるキャラクター表現ができるのがLoRAの強み。CivitAIなどで様々なLoRAが公開されているので、好みのキャラやスタイルを探してみると面白いです。

コメント

タイトルとURLをコピーしました