画像生成AIの比較まとめ!同じプロンプトで人気ツールを比べてみた!
近年、AI 画像生成技術は驚異的な進化を遂げ、誰でも簡単に美しいイラストやリアルなキャラクターを作り出すことが可能になりました。中でも「AI 美女」の生成は、そのビジュアルの完成度や多様性が話題を呼び、多くのユーザーに親しまれています。ですが、さまざまな AI 画像生成サービスが提供されている中で、実際にはどのサービスがどんな特徴を持ち、どのような表現が得意なのか、違いを知るのは意外と難しいものです。
本記事では、特に人気の AI 画像生成サービス 4 つを選び、同じテーマやプロンプトで生成された「美女」たちを比較しながら、それぞれの特性や仕上がりの違いを徹底解説していきます。「都会的で洗練されたファッションモデル」から「ファンタジーのエルフ」「伝統的な和装の女性」まで、多彩なテーマを通じて、AI がどれほど個性豊かでクリエイティブな表現が可能かを探ります。
今回、比較してみたのは、「Stable Diffusion」「Midjourney」「Flux」「ImageFX」で、生成したテーマは以下の通りです。
- 都会的で洗練された印象の女性
- ファンタジーのエルフ美女
- レトロなハリウッド女優
- フィットネスインフルエンサー
- サイバーパンクの美女
- 伝統的な和装の女性
- 高校生の日常風景
- クールなビジネスウーマン
- 100 メートルを全力で走る女性アスリート
- 夏のビーチと水着美女
- エレガントなランジェリーモデル
- セクシーな下着姿の女性
事前にお伝えしたいことは、Stable Diffusion は、モデルは「Beautiful Realistic Asians」「XXMix_9realistic」を使い分けました。Lora や品質プロンプトを使用していないので、リアル感はあまり出せないと思います。他のツールにしても適したプロンプトを使用できませんので、本来の力を出せていない可能性があります。
あくまで人気 AI ツールで AI 美女グラビアを生成する時の雰囲気が伝わればいいかなと思っています。
ちなみに Stable Diffusion は、使いやすいSeaArt AI、Flux については、KREAを使用しました。
各サービスで、品質、服装、髪型、照明を同じプロンプトにして AI 美女を出力してみた記事もあります!
都会的で洗練された印象の女性
最初のテーマは、モダンファッションモデルです。「都会的で洗練された印象の女性。ニューヨークの街並みを背景に、黒のタートルネックセーターとロングコートを着ている。短いボブヘア、シャープな表情。」をプロンプトにしたいと思います。
意図: ファッションや細部の描写、背景との調和を見る。
Stable Diffusion
とりあえず1番プロンプトに近い年齢20歳に見えますね。 結構枚数を出力してみたんですけど、黄色いタクシーというプロンプトに引っ張られて、黒いはずのタートルネックが黄色になる写真がかなり多かったですね。作品的には1番好きな感じになりました。
プロンプトを強調すれば黒いタートルネックもで出力できます。この中では1番自信に満ち溢れたと言う雰囲気がいいニュアンスで出ているんじゃないかと思います。
Midjourney
あー、なんか、やっぱりさすがMidjourneyと言う感じの画像ですね。あんまりファッションは得意じゃないんですが、やっぱり1番センスが良いような感じの出力が出ますね。
今回はプロンプトが共通ということで、ちょっと調整が効かないので仕方ないのかもしれませんが、気になるのは一番イラストっぽい雰囲気になってることですね。
表情もあんまり自信に満ち溢れている感はないですね。
Flux
さすがFlux。かなりリアルだと思います。 何も言わなければ写真だと思ってしまうくらいのクオリティーですね。 生成された美女も美人過ぎず、ほんとにいそうなというか現実的な人物です。
服装のプロンプト再現については、タートルぽくはないですが、他の画像はタートルになっていたので良好だと思います。
表情については、「鋭く自信に満ちた表情」というプロンプトの「鋭く」に引っ張られているのかも知れませんね。
ImageFX
ImageFXもかなりリアル。GoogleのAIには当初ガッカリ感がありましたが、最近はGemniniといいかなり使える感じですね。
服装のプロンプトも再現性はいい感じです。表情はFlux同様に「鋭い」に引っ張られている雰囲気はありますね。
このテーマで本物っぽいとか現実感を求めるならば一番いいと思います。
ファンタジーのエルフ美女
テーマは、ファンタジーです。「エルフの女性。輝く金色の髪、エメラルド色の目。美しい森を背景に、光沢のある銀の鎧と緑のローブをまとっている。穏やかな微笑み。」をプロンプトにしたいと思います。
意図: ファンタジー要素や繊細なデザイン力を比較。
Stable Diffusion
エルフというよりも森の中で学園祭の演劇衣装を着て休憩してる感じになりましたね。
もちろんファンタジーが得意なモデルを使えば大丈夫ですけど、さすがにBRAではきつかったのかも知れません。
プロンプトがシンプルなんで、着ているもののデザインはちゃちいですね。
Midjourney
圧倒的なクオリティですね。Midjourneyはファンタジーには強いだろうと思っていましたが、こんなに圧倒的だとは思いませんでした。
今回は一番リアル調のものを選択したんですが、イラスト寄りの出力はもっとファンタジーにもってこいのクオリティでした。
Flux
こちらもかなりいい感じです。最初に思ったのは、意外に露出高めの画像もさらっと生成するんだなってことです。
衣装も雰囲気があって、もっとプロンプトで調整すれば、クオリティが上がると思います。
ImageFX
ImageFXは、ファンタジー入ると、実写風の画像は出ませんでした。何か方法はあるかも知れませんが、苦手っぽいですね。
実写形ファンタジーは、他のサービスを使ったほうがいいと思います。
レトロなハリウッド女優
テーマは、レトロです。「1950 年代のハリウッド女優風の女性。黒髪ウェーブ、真っ赤なリップ、オフショルダーのドレス。背景は白黒の映画撮影スタジオ。」をプロンプトにしたいと思います。
意図: 時代設定やレトロなスタイルの再現力を比較。
Stable Diffusion
何かいい感じですね。古い雰囲気も出てますし、美人な感じで出てますので、なんか昔の女優さん感がすごい出てますよね。いいと思います。この中では1番好きな作品です。
ライティングプロンプトの影響が強いせいか、イラストよりの出力になってますね。
Midjourney
昔っぽさは全然ない感じで、相変わらずMidjourneyっていうクオリティーですね。 色の出方がすごく特徴ありますよね。やっぱり抜け感がある感じがします。
こちらもイラストよりの出力になってる気がします。
Flux
Fluxもレトロ感は出ています。 やっぱりライティングのオレンジのせいですかね。こちらもイラストよりの出力になってる感じです。
ImageFX
レトロさと良い時代感といい一番出てるんじゃないかと思います。 出力した瞬間、思わず「古っ」と言ってしまいました。
他の出力も合わせてみると、一番、実写感があったのはImageFXでした。
フィットネスインフルエンサー
テーマは、健康美です。「スポーツウェアを着た女性。健康的な笑顔、引き締まった体。ジムの中でヨガマットの上に座っている。自然光が差し込む爽やかな雰囲気。」をプロンプトにしたいと思います。
意図: リアルな日常シーンと健康的な美しさの表現。
Stable Diffusion
20代後半にしてはちょっと若い感じですね。手とか足の指の修正はかけてなかったので、ちょっと変ですが、これもちゃんと調整を入れればきれいに出力されると思います。
普通はヨガパンツはロングが一般的なんじゃないかなぁと思いますが、短距離走の選手のスポーツウェアみたい出てます。
Midjourney
画像比率を調整したので、ての指とか足の指が写ってませんが、こちらもちょっと変になってました。
Midjourneyにしてはちょっと落ち着いた出力になっていますが、すごくいい感じだと思います。
Flux
手の指や足の指もきれいに生成されています。さすがFluxですね。この辺はずば抜けていました。もちろん指が変な感じに出力されることもあるんですが、他のサービスに比べて圧倒的に良かったと思います。
ImageFX
ImageFXもすごく指とかはきれいに出る感じでした。かなりリアルな出力でこれもいいと思います。ほんとに近所のヨガスタジオのチラシとかに使えそうな雰囲気ですよね。
サイバーパンクの美女
テーマは、サイバーパンクです。「近未来都市のネオン街を背景にした女性。メタリックなスーツ、片目にはサイバネティックな眼帯。クールな表情と短いピンクの髪。」をプロンプトにしたいと思います。
意図: SF 要素やディテールの作り込みをチェック。
Stable Diffusion
モデルは「XXMix_9realistic」を使いました。かなりかっこよくて艶のある表情がいい感じですが、シルバーのスーツは無視傾向でした。キーワードのウェイト調整でなんとかなると思いますが。
Midjourney
かなりの数を出力しましたが、ポージングをする出力は得られませんでした。プロンプトに工夫が必要ですが、今回は共通というのがルールですので仕方ありません。
Midjourneyの良さは出てます。
Flux
サイバーパンク感を出すには、ちょっとプロンプトがいまいちだったかもしれませんね。何か物足りない感じがします。
でも「青く光るシルバーのスーツ」という部分は、難しいと思いますが忠実に再現されています。
ImageFX
ImageFXは、非日常の要素があるとイラスト感が全面に出ますね。あまりこだわって使わないので何か方法があるのか知りませんが、Realisticなどの指定が必要かも知れません。
伝統的な和装の女性
テーマは、伝統です。「桜の花が舞う庭園で微笑む女性。白と赤の華やかな着物をまとい、きっちりと結い上げた髪。伝統美を感じさせる。」をプロンプトにしたいと思います。
意図: 文化的な衣装や細かい装飾の再現力。
Stable Diffusion
いくつかのモデルで出力を試してみたんですが、なんとなく日本の着物とは違う感じがします。
日本の文化に強いモデルは聞いたことがないので、着物のプロンプトに関しては、工夫が必要かもしれません。
Midjourney
かなりAIっぽさが残る出力になりましたが、やはりMidjourneyらしい作品になっていると思います。
もっと実写よりになるようなプロンプトをたくさん書いた方が良いのかもしれません。
Flux
やっぱりFluxは非常に実写っぽい感じですね。親戚のお姉ちゃんの写真だと言われても、ほんとに疑いようがないくらいリアルです。
ImageFX
こちらもかなりリアルな感じです。これも実写だと言われたらわからないです。日本の文化に強いと言われているImageFXですが、小物の感じもすごくいいですね。
高校生の日常風景
テーマは、日常です。「制服を着た女子高校生。教室の窓辺に座りながら本を読んでいる。肩までの黒髪とリボンが特徴的。夕日が窓から差し込んでいる。」をプロンプトにしたいと思います。
意図: シンプルな日常の表現力と背景の描写。
Stable Diffusion
本を読む気はサラサラないというくらい本を読んでる画像は出ませんでしたが、一番実写っぽいのを出したのは、Stable Diffusion。
手がおかしいのは残念ですが、手を修正するプロンプトや拡張機能で修正すれば大丈夫でしょう。
Midjourney
かなりイラスト寄りの出力ばかりでした。女子高生というテーマは学習データにイラストが多いのでしょうか?プロンプトの調整が必要そうです。
こちらも本を読むしくさのものは、ほとんど出ませんでした。
Flux
プロンプトにかなり忠実ですが、イラストしか出ませんでした。FluxはKREAで使っているのですが、実写系のStyleをあててやっと、実写っぽい画像が生成されましたが、あまり出来が良くなかったので、イラストを採用。
ImageFX
ImageFXもイラストしか出ませんでした。試しに写真関連のキーワードも入れてみましたが、全く機能しませんでした。
それ以外は、プロンプト通りに本も読んでるし、古い感じですが、制服もまともですね。
クールなビジネスウーマン
テーマは、クールな女性です。「オフィスを背景に立つ女性。黒のスーツを着て微笑む。ロングヘアをまとめたエレガントなスタイル。」をプロンプトにしたいと思います。
意図: 現代的なプロフェッショナルの表現力を見る。
Stable Diffusion
30枚位出力しましたが、意外にもなかなか黒いスーツが出なかったです。Stable Diffusionは出したい要素の重みづけを工夫してプロンプト作らないと、思ったようなAI美女を作りづらいですね。
Midjourney
かなりイラスト感のある出力になりました。品質アップ系のプロンプトや肌の質感に関するプロンプトを入れてやれば改善するかもしれません。雰囲気は一番好きです。
Flux
このテーマでも実写感が一番あります。プロンプトはテーマからChatGPTが出力してくれた自然言語に近いものですが、再現力はFlux凄いですね。使いやすいです。
ImageFX
ImageFXも実写感はありますね。ただシードを変更してもさほど図案的なものは変わらないので、バリエーション出すにはプロンプトを変えるしかなさそうです。
100 メートルを全力で走る女性アスリート
テーマは、動きのある描写です。「トラックで 100 メートルを全力疾走する女性アスリート。引き締まった筋肉、躍動感あるフォーム、集中した真剣な表情。背景にはスタジアムの観客席が広がる。」をプロンプトにしたいと思います。
意図: 動きの表現、筋肉やフォームのリアリズム、スポーツの緊張感を比較。
Stable Diffusion
確実に100メートル走ではないですね。 躍動感はありますが、走ってる画像出すのはできませんでした。筋肉の感じは出てます。
Midjourney
汗というか、これ雨が降ってますね。 このプロンプトでは、こちらも走ってる画像は出すことができませんでした。
Flux
さすがFlux再現性が高いですね。筋肉の感じからいうと、長距離走の選手みたいな印象があります。肩周りの筋肉が歪な出力が多く出ました。
ImageFX
躍動感があります!一番プロンプトに忠実な画像が出ました。それでも手足が変だったりする出力が多かったので、20枚くらい出力しました。筋肉の感じは自然ですね。
夏のビーチと水着美女
テーマは、水着です。「青い空と透き通る海を背景に、ビキニを着た女性。ヘルシーな日焼け肌、肩までのウェーブヘア。砂浜に立ちながら明るい笑顔でカメラを見つめている。」をプロンプトにしたいと思います。
意図: 水着や肌の質感、夏らしい背景の再現度を比較。
Stable Diffusion
Stable Diffusionはこういうのは得意です。ほぼほぼ使えそうな画像をじゃんじゃん生成してくれました。
Midjourney
「bikini」がNGのようで、生成できませんした。なので、bikiniを削除して生成。Midjourneyは肌の露出には厳しいようです。
Flux
なんか古い感じがするのは、プロンプトのせいでしょう。日焼け感も一番出てますし、プロンプトの再現性はNo.1でしょう。
ImageFX
白飛びしたような画像ばかり出ました。露出には厳しいという認識でしたが、bikiniは大丈夫そうですね。でも4枚出力中3枚とか2枚出力も多く、やはり規制は多少入ってるっぽいですね。
エレガントなランジェリーモデル
テーマは、露出です。「高級感のあるクラシックな室内を背景に、ランジェリーを身につけた女性。シルク素材のネグリジェ、繊細なレースのディテール。柔らかな表情と上品なポーズ。」をプロンプトにしたいと思います。
意図: 繊細な素材感、肌の質感、ポーズの優雅さを検証。
Stable Diffusion
レースのランジェリーのデザインは、ちゃんと作った方がいいとして、普通に生成できたのは、Stable Diffusionだけでした。
セクシー要素が入る場合は、Stable DiffusionでAI美女を生成する方が良さそうですね。
Midjourney
当然、「ランジェリー」というキーワードがNGで生成できず。「clothes」にキーワードを置き換えて生成。
ただ、プロのモデルさんのような佇まいはさすが。Midjourneyです。表紙のデザインにもぴったり。
Flux
こちらも「ランジェリー」というキーワードがNG。clothesに変えて生成。やっぱりレースというキーワードがランジェリーっぽい生成を可能にしているんでしょうね。
ImageFX
もちろん「ランジェリー」というキーワードがNG。clothesで生成。ImageFXはレースがあっても服っぽい解釈で生成しました。
セクシーな下着姿の女性
テーマは、セクシーです。「高級感のあるクラシックな室内のベッドに、セクシーなランジェリーを身につけて座る女性。繊細なレースのディテール。柔らかな表情と色っぽいポーズ。」をプロンプトにしたいと思います。
意図: セクシーさの表現力、ポーズや表情の自然さ、細部のディテール(下着や背景)の再現性を比較。
Stable Diffusion
セクシーグラビアをAI美女を生成するならStable Diffusion一択になりますね。プロンプトやLoRAを調整してリアルに仕上げることができます。
Midjourney
NG。プロンプトを変更して、生成しました。服は変ですが、いい雰囲気のAI美女です。
Flux
NG。こちらもプロンプトを変更。自然言語に近いプロンプトで一番リアルに生成できますね。
ImageFX
NG。プロンプト変更。セクシーグラビアでは今のところImageFXは使えないですね。
まとめ
Stable Diffusion、Midjourney、Flux、ImageFX の 4 つの AI ツールを用いて、12 種類のテーマで美女画像を生成し、各ツールの特徴や傾向を見てみました。
- 実写的な表現は Flux と ImageFX が優れていて、特に Flux は手や指などの細部の再現性が高いです。
- ファンタジーやアート性の高い表現は Midjourney が得意で、独特の美的センスがありますね。
- 露出度の高い画像生成については、Midjourney、Flux、ImageFX は制限が厳しく、Stable Diffusion が最も自由度が高いです。
- プロンプトへの忠実度は Flux が最も高く、自然言語に近い指示でも意図した画像を生成できます。
- 美人や可愛い女性を生成しやすいのは、Stable Diffusion と Midjourney ですね。
ちょっと文章ではわかりにくいので、AI 美女グラビアを生成する観点から画像生成 AI の比較表を作ってみました。個人的な意見を含みますので、参考までに。
Stable Diffusion | Midjourney | Flux | ImageFX | |
美女の生成しやすさ | ◎ | ◎ | ○ | ○ |
指などの正確性 | △ | △ | ◎ | ◎ |
プロンプトへの忠実さ | ○ | ○ | ◎ | ○ |
映え感 | ○ | ◎ | ○ | △ |
リアル感の出しやすさ | ○ | ○ | ◎ | ○ |
セクシーグラビア | ◎ | ○ | △ | × |
自由度 | ◎ | ○ | ○ | △ |
使いやすさ | △ | ○ | ○ | ◎ |
編集機能 | ◎ | ◎ | ○ | △ |
各ツールには得意分野があり、用途に応じて使い分けることで最適な結果が得られることがわかりました。また、画像生成 AI はものすごい速度で進化・アップグレードされているので、定期的に比較して楽しみたいと思います。