公開日

画像生成AIの比較まとめ!同じプロンプトで人気ツールを比べてみた!

画像生成AIの比較まとめ!同じプロンプトで人気ツールを比べてみた!

近年、AI 画像生成技術は驚異的な進化を遂げ、誰でも簡単に美しいイラストやリアルなキャラクターを作り出すことが可能になりました。中でも「AI 美女」の生成は、そのビジュアルの完成度や多様性が話題を呼び、多くのユーザーに親しまれています。ですが、さまざまな AI 画像生成サービスが提供されている中で、実際にはどのサービスがどんな特徴を持ち、どのような表現が得意なのか、違いを知るのは意外と難しいものです。

本記事では、特に人気の AI 画像生成サービス 4 つを選び、同じテーマやプロンプトで生成された「美女」たちを比較しながら、それぞれの特性や仕上がりの違いを徹底解説していきます。「都会的で洗練されたファッションモデル」から「ファンタジーのエルフ」「伝統的な和装の女性」まで、多彩なテーマを通じて、AI がどれほど個性豊かでクリエイティブな表現が可能かを探ります。

今回、比較してみたのは、「Stable Diffusion」「Midjourney」「Flux」「ImageFX」で、生成したテーマは以下の通りです。

  • 都会的で洗練された印象の女性
  • ファンタジーのエルフ美女
  • レトロなハリウッド女優
  • フィットネスインフルエンサー
  • サイバーパンクの美女
  • 伝統的な和装の女性
  • 高校生の日常風景
  • クールなビジネスウーマン
  • 100 メートルを全力で走る女性アスリート
  • 夏のビーチと水着美女
  • エレガントなランジェリーモデル
  • セクシーな下着姿の女性

事前にお伝えしたいことは、Stable Diffusion は、モデルは「Beautiful Realistic Asians」「XXMix_9realistic」を使い分けました。Lora や品質プロンプトを使用していないので、リアル感はあまり出せないと思います。他のツールにしても適したプロンプトを使用できませんので、本来の力を出せていない可能性があります。

あくまで人気 AI ツールで AI 美女グラビアを生成する時の雰囲気が伝わればいいかなと思っています。

ちなみに Stable Diffusion は、使いやすいSeaArt AI、Flux については、KREAを使用しました。

各サービスで、品質、服装、髪型、照明を同じプロンプトにして AI 美女を出力してみた記事もあります!

関連記事
【2024年版】AI美女を作れる人気サイト5選!同じプロンプトで美女の生成比較!

都会的で洗練された印象の女性

最初のテーマは、モダンファッションモデルです。「都会的で洗練された印象の女性。ニューヨークの街並みを背景に、黒のタートルネックセーターとロングコートを着ている。短いボブヘア、シャープな表情。」をプロンプトにしたいと思います。

意図: ファッションや細部の描写、背景との調和を見る。

プロンプト
a Japanese beautiful woman,20yo, with short bob haircut, wearing a black turtleneck sweater and a long black coat, sharp and confident facial expression, standing on a street in New York City, blurred urban background with modern skyscrapers and yellow taxis
プロンプトの日本語訳
ニューヨークの街並みを背景に立つ日本人の美しい女性。年齢は20歳、ショートボブヘア。黒いタートルネックセーターとロングの黒いコートを着ており、鋭く自信に満ちた表情。背景にはぼかされた近代的な高層ビルと黄色いタクシーが見える。

Stable Diffusion

とりあえず1番プロンプトに近い年齢20歳に見えますね。 結構枚数を出力してみたんですけど、黄色いタクシーというプロンプトに引っ張られて、黒いはずのタートルネックが黄色になる写真がかなり多かったですね。作品的には1番好きな感じになりました。

プロンプトを強調すれば黒いタートルネックもで出力できます。この中では1番自信に満ち溢れたと言う雰囲気がいいニュアンスで出ているんじゃないかと思います。

Midjourney

あー、なんか、やっぱりさすがMidjourneyと言う感じの画像ですね。あんまりファッションは得意じゃないんですが、やっぱり1番センスが良いような感じの出力が出ますね。

今回はプロンプトが共通ということで、ちょっと調整が効かないので仕方ないのかもしれませんが、気になるのは一番イラストっぽい雰囲気になってることですね。

表情もあんまり自信に満ち溢れている感はないですね。

Flux

さすがFlux。かなりリアルだと思います。 何も言わなければ写真だと思ってしまうくらいのクオリティーですね。 生成された美女も美人過ぎず、ほんとにいそうなというか現実的な人物です。

服装のプロンプト再現については、タートルぽくはないですが、他の画像はタートルになっていたので良好だと思います。

表情については、「鋭く自信に満ちた表情」というプロンプトの「鋭く」に引っ張られているのかも知れませんね。

ImageFX

ImageFXもかなりリアル。GoogleのAIには当初ガッカリ感がありましたが、最近はGemniniといいかなり使える感じですね。

服装のプロンプトも再現性はいい感じです。表情はFlux同様に「鋭い」に引っ張られている雰囲気はありますね。

このテーマで本物っぽいとか現実感を求めるならば一番いいと思います。

ファンタジーのエルフ美女

テーマは、ファンタジーです。「エルフの女性。輝く金色の髪、エメラルド色の目。美しい森を背景に、光沢のある銀の鎧と緑のローブをまとっている。穏やかな微笑み。」をプロンプトにしたいと思います。

意図: ファンタジー要素や繊細なデザイン力を比較。

プロンプト
a beautiful female elf with long, 20 yo, flowing golden hair shimmering softly in the dappled sunlight, emerald green eyes glowing gently with a mystical aura, wearing a simple and elegant green robe made of light, ethereal fabric, standing gracefully in an enchanted forest, surrounded by soft glowing lights like fireflies, delicate wildflowers and moss covering the ground, beams of sunlight filtering through ancient trees, her gentle smile radiating calm and wisdom, magical and dreamlike atmosphere
プロンプトの日本語訳
20歳の美しい女性エルフで、長く流れるような金髪が木漏れ日の中で柔らかく輝き、エメラルドグリーンの瞳が神秘的なオーラを優しく放つ。軽やかで幻想的な布で作られたシンプルで優雅な緑のローブをまとい、魔法の森の中に優雅に佇む。周囲にはホタルのように柔らかく輝く光、繊細な野花、苔むした地面が広がり、古木を通して差し込む光の筋に包まれている。彼女の優しい微笑みは穏やかさと知恵を放ち、魔法のように夢のような雰囲気を作り出している。

Stable Diffusion

エルフというよりも森の中で学園祭の演劇衣装を着て休憩してる感じになりましたね。

もちろんファンタジーが得意なモデルを使えば大丈夫ですけど、さすがにBRAではきつかったのかも知れません。

プロンプトがシンプルなんで、着ているもののデザインはちゃちいですね。

Midjourney

圧倒的なクオリティですね。Midjourneyはファンタジーには強いだろうと思っていましたが、こんなに圧倒的だとは思いませんでした。

今回は一番リアル調のものを選択したんですが、イラスト寄りの出力はもっとファンタジーにもってこいのクオリティでした。

Flux

こちらもかなりいい感じです。最初に思ったのは、意外に露出高めの画像もさらっと生成するんだなってことです。

衣装も雰囲気があって、もっとプロンプトで調整すれば、クオリティが上がると思います。

ImageFX

ImageFXは、ファンタジー入ると、実写風の画像は出ませんでした。何か方法はあるかも知れませんが、苦手っぽいですね。

実写形ファンタジーは、他のサービスを使ったほうがいいと思います。

レトロなハリウッド女優

テーマは、レトロです。「1950 年代のハリウッド女優風の女性。黒髪ウェーブ、真っ赤なリップ、オフショルダーのドレス。背景は白黒の映画撮影スタジオ。」をプロンプトにしたいと思います。

意図: 時代設定やレトロなスタイルの再現力を比較。

プロンプト
a 1950s Hollywood movie scene featuring a stunning Japanese actress, 20yo,wavy black hair glowing under studio lights, vivid red lips, wearing a glamorous off-shoulder dress, intense and captivating gaze directed at the camera, surrounded by vintage film studio equipment such as large Fresnel lights and an old movie camera, dramatic spotlight illuminating her face and upper body
プロンプトの日本語訳
1950年代のハリウッド映画のシーンで、美しい20歳の日本人女優が登場する。スタジオライトの下で輝く波打つ黒髪、鮮やかな赤い唇を持ち、魅力的なオフショルダードレスを着ている。カメラに向けた強く魅惑的な視線が印象的で、周囲には大型のフレネルライトや古い映画用カメラなどのヴィンテージな映画スタジオの機材が並んでいる。劇的なスポットライトが彼女の顔と上半身を照らしている。

Stable Diffusion

何かいい感じですね。古い雰囲気も出てますし、美人な感じで出てますので、なんか昔の女優さん感がすごい出てますよね。いいと思います。この中では1番好きな作品です。

ライティングプロンプトの影響が強いせいか、イラストよりの出力になってますね。

Midjourney

昔っぽさは全然ない感じで、相変わらずMidjourneyっていうクオリティーですね。 色の出方がすごく特徴ありますよね。やっぱり抜け感がある感じがします。

こちらもイラストよりの出力になってる気がします。

Flux

Fluxもレトロ感は出ています。 やっぱりライティングのオレンジのせいですかね。こちらもイラストよりの出力になってる感じです。

ImageFX

レトロさと良い時代感といい一番出てるんじゃないかと思います。 出力した瞬間、思わず「古っ」と言ってしまいました。

他の出力も合わせてみると、一番、実写感があったのはImageFXでした。

フィットネスインフルエンサー

テーマは、健康美です。「スポーツウェアを着た女性。健康的な笑顔、引き締まった体。ジムの中でヨガマットの上に座っている。自然光が差し込む爽やかな雰囲気。」をプロンプトにしたいと思います。

意図: リアルな日常シーンと健康的な美しさの表現。

プロンプト
a healthy and fit Japanese woman in her late 20s, sitting cross-legged on a yoga mat, wearing stylish sportswear in pastel tones, natural light streaming through large gym windows, toned body with flawless skin, soft and genuine smile, clean and organized gym interior with modern equipment in the background,shallow depth of field, even and soft natural lighting, highlights the serene and refreshing atmosphere, perfect skin texture and details
プロンプトの日本語訳
健康的でフィットした20代後半の日本人女性、ヨガマットの上に足を組んで座っている。パステル調のスタイリッシュなスポーツウェアを着用し、大きなジムの窓から自然光が差し込んでいる。引き締まった体と無垢な肌、柔らかく自然な笑顔。背景には整然とした現代的なジムの設備が配置されている。浅い被写界深度で、全体に均一で柔らかな自然光が広がり、穏やかでリフレッシュした雰囲気を強調している。肌の質感と細部が完璧に描写されている。

Stable Diffusion

20代後半にしてはちょっと若い感じですね。手とか足の指の修正はかけてなかったので、ちょっと変ですが、これもちゃんと調整を入れればきれいに出力されると思います。

普通はヨガパンツはロングが一般的なんじゃないかなぁと思いますが、短距離走の選手のスポーツウェアみたい出てます。

Midjourney

画像比率を調整したので、ての指とか足の指が写ってませんが、こちらもちょっと変になってました。

Midjourneyにしてはちょっと落ち着いた出力になっていますが、すごくいい感じだと思います。

Flux

手の指や足の指もきれいに生成されています。さすがFluxですね。この辺はずば抜けていました。もちろん指が変な感じに出力されることもあるんですが、他のサービスに比べて圧倒的に良かったと思います。

ImageFX

ImageFXもすごく指とかはきれいに出る感じでした。かなりリアルな出力でこれもいいと思います。ほんとに近所のヨガスタジオのチラシとかに使えそうな雰囲気ですよね。

サイバーパンクの美女

テーマは、サイバーパンクです。「近未来都市のネオン街を背景にした女性。メタリックなスーツ、片目にはサイバネティックな眼帯。クールな表情と短いピンクの髪。」をプロンプトにしたいと思います。

意図: SF 要素やディテールの作り込みをチェック。

プロンプト
a stylish Japanese woman in her early 20s, short neon pink hair styled with sharp edges, wearing a silver suit with glowing blue accents, posing confidently with one hand on her hip, neon lights casting vibrant reflections on her suit, a futuristic urban backdrop featuring holographic signs, and a dark rainy atmosphere, cinematic lighting with strong blue and pink hues, rain effects creating reflective surfaces, skin rendered with perfect detail and subtle cyberpunk textures
プロンプトの日本語訳
20代前半のスタイリッシュな日本人女性、ネオンピンクのショートヘアをシャープなエッジでスタイリング、青く光るアクセントのシルバーのスーツを着用、片手を腰に当て自信たっぷりにポーズ、ネオンライトが彼女のスーツに鮮やかな反射を映し出す、ホログラムの看板が特徴的な近未来的な都市の背景、暗い雨の雰囲気、強い青とピンクの色調のシネマティックな照明、反射面を作り出す雨のエフェクト、完璧なディテールと繊細なサイバーパンクのテクスチャでレンダリングされた肌。

Stable Diffusion

モデルは「XXMix_9realistic」を使いました。かなりかっこよくて艶のある表情がいい感じですが、シルバーのスーツは無視傾向でした。キーワードのウェイト調整でなんとかなると思いますが。

Midjourney

かなりの数を出力しましたが、ポージングをする出力は得られませんでした。プロンプトに工夫が必要ですが、今回は共通というのがルールですので仕方ありません。

Midjourneyの良さは出てます。

Flux

サイバーパンク感を出すには、ちょっとプロンプトがいまいちだったかもしれませんね。何か物足りない感じがします。

でも「青く光るシルバーのスーツ」という部分は、難しいと思いますが忠実に再現されています。

ImageFX

ImageFXは、非日常の要素があるとイラスト感が全面に出ますね。あまりこだわって使わないので何か方法があるのか知りませんが、Realisticなどの指定が必要かも知れません。

伝統的な和装の女性

テーマは、伝統です。「桜の花が舞う庭園で微笑む女性。白と赤の華やかな着物をまとい、きっちりと結い上げた髪。伝統美を感じさせる。」をプロンプトにしたいと思います。

意図: 文化的な衣装や細かい装飾の再現力。

プロンプト
a Japanese woman,23 years old, smiling softly with grace, wearing a luxurious white and red kimono adorned with intricate floral patterns, her hair styled in an elegant traditional updo with kanzashi hair ornaments, standing in a serene Japanese garden filled with cherry blossoms, petals gently falling around her, a stone path and traditional wooden structures visible in the background, natural soft lighting with warm tones highlighting her features,shallow depth of field creating a soft bokeh effect, precise details in the fabric texture of the kimono and her skin, vibrant pink and white tones of the cherry blossoms, traditional and serene atmosphere
プロンプトの日本語訳
23歳の日本人女性、優雅に柔らかく微笑んでいる。白と赤の豪華な着物を着ており、繊細な花柄の模様が施されている。髪は伝統的な上品な結い上げに整えられ、かんざしの髪飾りがあしらわれている。桜が咲き誇る静かな日本庭園に立ち、花びらが彼女の周りにそっと舞い散っている。背景には石の小道や伝統的な木造建築が見える。自然で柔らかな暖かみのある光が彼女の特徴を引き立てており、浅い被写界深度が柔らかなボケ効果を生み出している。着物の生地や彼女の肌の質感が精密に描写され、桜の鮮やかなピンクと白の色合いが際立っている。伝統的で穏やかな雰囲気。

Stable Diffusion

いくつかのモデルで出力を試してみたんですが、なんとなく日本の着物とは違う感じがします。

日本の文化に強いモデルは聞いたことがないので、着物のプロンプトに関しては、工夫が必要かもしれません。

Midjourney

かなりAIっぽさが残る出力になりましたが、やはりMidjourneyらしい作品になっていると思います。

もっと実写よりになるようなプロンプトをたくさん書いた方が良いのかもしれません。

Flux

やっぱりFluxは非常に実写っぽい感じですね。親戚のお姉ちゃんの写真だと言われても、ほんとに疑いようがないくらいリアルです。

ImageFX

こちらもかなりリアルな感じです。これも実写だと言われたらわからないです。日本の文化に強いと言われているImageFXですが、小物の感じもすごくいいですね。

高校生の日常風景

テーマは、日常です。「制服を着た女子高校生。教室の窓辺に座りながら本を読んでいる。肩までの黒髪とリボンが特徴的。夕日が窓から差し込んでいる。」をプロンプトにしたいと思います。

意図: シンプルな日常の表現力と背景の描写。

プロンプト
a Japanese high school girl sitting by the classroom window reading a book, short shoulder-length black hair, wearing a neatly pressed school uniform with a ribbon, soft sunset light pouring through the window, illuminating her face and creating warm tones, the classroom is detailed with wooden desks and chairs, blurred background outside the window with an orange-hued sky, delicate skin texture with fine detail, calm and focused expression, cinematic composition, soft and diffused lighting from the setting sun, natural shadows enhancing the atmosphere
プロンプトの日本語訳
教室の窓際に座って本を読んでいる日本の女子高生。肩まである黒髪のショートヘアで、リボンのついたきちんとプレスされた制服を着ている。窓から差し込む柔らかな夕日の光が彼女の顔を照らし、暖かな色調を作り出している。教室には木製の机と椅子が細かく配置され、窓の外にはオレンジ色に染まった空がぼかされた背景。繊細な肌の質感と細かいディテール、穏やかで集中した表情、映画のような構図、夕日による柔らかく拡散された照明、自然な影が雰囲気を高めている。

Stable Diffusion

本を読む気はサラサラないというくらい本を読んでる画像は出ませんでしたが、一番実写っぽいのを出したのは、Stable Diffusion。

手がおかしいのは残念ですが、手を修正するプロンプトや拡張機能で修正すれば大丈夫でしょう。

Midjourney

かなりイラスト寄りの出力ばかりでした。女子高生というテーマは学習データにイラストが多いのでしょうか?プロンプトの調整が必要そうです。

こちらも本を読むしくさのものは、ほとんど出ませんでした。

Flux

プロンプトにかなり忠実ですが、イラストしか出ませんでした。FluxはKREAで使っているのですが、実写系のStyleをあててやっと、実写っぽい画像が生成されましたが、あまり出来が良くなかったので、イラストを採用。

ImageFX

ImageFXもイラストしか出ませんでした。試しに写真関連のキーワードも入れてみましたが、全く機能しませんでした。

それ以外は、プロンプト通りに本も読んでるし、古い感じですが、制服もまともですね。

クールなビジネスウーマン

テーマは、クールな女性です。「オフィスを背景に立つ女性。黒のスーツを着て微笑む。ロングヘアをまとめたエレガントなスタイル。」をプロンプトにしたいと思います。

意図: 現代的なプロフェッショナルの表現力を見る。

プロンプト
a professional Japanese woman standing in a modern office environment,25yo, wearing a sleek black suit, smiling confidently, her long black hair elegantly tied back in a low ponytail, subtle makeup enhancing her natural beauty, bright and clean office background with large windows and soft daylight, polished wooden floor and glass partitions, flawless skin texture with intricate detail
プロンプトの日本語訳
洗練された黒のスーツを身にまとい、自信に満ちた笑みを浮かべた25歳日本人女性、長い黒髪をエレガントに後ろで結んで低いポニーテールにし、自然な美しさを引き立てる繊細なメイクアップ、大きな窓から柔らかな日差しが差し込む明るく清潔なオフィスの背景、磨き上げられた木製の床とガラスのパーティション、細部まで精巧に仕上げられた完璧な肌の質感

Stable Diffusion

30枚位出力しましたが、意外にもなかなか黒いスーツが出なかったです。Stable Diffusionは出したい要素の重みづけを工夫してプロンプト作らないと、思ったようなAI美女を作りづらいですね。

Midjourney

かなりイラスト感のある出力になりました。品質アップ系のプロンプトや肌の質感に関するプロンプトを入れてやれば改善するかもしれません。雰囲気は一番好きです。

Flux

このテーマでも実写感が一番あります。プロンプトはテーマからChatGPTが出力してくれた自然言語に近いものですが、再現力はFlux凄いですね。使いやすいです。

ImageFX

ImageFXも実写感はありますね。ただシードを変更してもさほど図案的なものは変わらないので、バリエーション出すにはプロンプトを変えるしかなさそうです。

100 メートルを全力で走る女性アスリート

テーマは、動きのある描写です。「トラックで 100 メートルを全力疾走する女性アスリート。引き締まった筋肉、躍動感あるフォーム、集中した真剣な表情。背景にはスタジアムの観客席が広がる。」をプロンプトにしたいと思います。

意図: 動きの表現、筋肉やフォームのリアリズム、スポーツの緊張感を比較。

プロンプト
a Japanese female sprinter, mid-20s, perfectly toned and athletic body, sharp muscle definition, sprinting at full speed on a track, dynamic and energetic pose, intense and focused facial expression, clear skin texture with visible sweat glistening in the light, wearing a fitted athletic uniform, background showing blurred stadium seats filled with spectators, vivid lighting emphasizing muscle contours and facial focus, shot with a DSLR camera, fast shutter speed, shallow depth of field, natural daylight, motion blur in the legs to highlight speed, captured from a low angle to emphasize power and movement.
プロンプトの日本語訳
日本人女性スプリンター、20代半ば、完璧に引き締まったアスリートボディ、シャープな筋肉の輪郭、トラックで全速力で疾走する姿、ダイナミックでエネルギッシュなポーズ、集中した強い表情、光を受けて輝く汗が見えるクリアな肌の質感、 フィットしたユニフォームを着用、背景は観客で埋まったスタジアムの客席をぼかしたもの、筋肉の輪郭と顔の焦点を強調する鮮やかな照明、デジタル一眼レフカメラで撮影、速いシャッタースピード、浅い被写界深度、自然光、スピードを強調するために脚をモーションブラー、パワーと動きを強調するためにローアングルから撮影。

Stable Diffusion

確実に100メートル走ではないですね。 躍動感はありますが、走ってる画像出すのはできませんでした。筋肉の感じは出てます。

Midjourney

汗というか、これ雨が降ってますね。 このプロンプトでは、こちらも走ってる画像は出すことができませんでした。

Flux

さすがFlux再現性が高いですね。筋肉の感じからいうと、長距離走の選手みたいな印象があります。肩周りの筋肉が歪な出力が多く出ました。

ImageFX

躍動感があります!一番プロンプトに忠実な画像が出ました。それでも手足が変だったりする出力が多かったので、20枚くらい出力しました。筋肉の感じは自然ですね。

夏のビーチと水着美女

テーマは、水着です。「青い空と透き通る海を背景に、ビキニを着た女性。ヘルシーな日焼け肌、肩までのウェーブヘア。砂浜に立ちながら明るい笑顔でカメラを見つめている。」をプロンプトにしたいと思います。

意図: 水着や肌の質感、夏らしい背景の再現度を比較。

プロンプト
a Japanese woman in her late 20s, healthy sun-kissed tan skin, shoulder-length wavy hair gently blowing in the sea breeze, wearing a stylish bikini in pastel colors, standing barefoot on soft golden sand, bright and cheerful smile, direct eye contact with the camera, vibrant blue sky and crystal-clear ocean as the background, sunlight reflecting off the water, DSLR camera settings, wide aperture for soft background blur, natural light enhancing the skin tone and hair texture, warm and sunny ambiance, slight lens flare for a dreamy effect.
プロンプトの日本語訳
20代後半の日本人女性、健康的な日焼け肌、肩までのウェーブヘアが潮風にそよぎ、パステルカラーのスタイリッシュなビキニを着て、柔らかな黄金色の砂の上に裸足で立っている、 明るく陽気な笑顔、カメラとの直接のアイコンタクト、背景は鮮やかな青空と透き通った海、水面に反射する太陽光、デジタル一眼レフカメラの設定、背景をソフトにぼかすための絞り開放、肌の色と髪の質感を引き立てる自然光、暖かく日差しの強い雰囲気、夢のような効果を出すためのわずかなレンズフレア。

Stable Diffusion

Stable Diffusionはこういうのは得意です。ほぼほぼ使えそうな画像をじゃんじゃん生成してくれました。

Midjourney

「bikini」がNGのようで、生成できませんした。なので、bikiniを削除して生成。Midjourneyは肌の露出には厳しいようです。

Flux

なんか古い感じがするのは、プロンプトのせいでしょう。日焼け感も一番出てますし、プロンプトの再現性はNo.1でしょう。

ImageFX

白飛びしたような画像ばかり出ました。露出には厳しいという認識でしたが、bikiniは大丈夫そうですね。でも4枚出力中3枚とか2枚出力も多く、やはり規制は多少入ってるっぽいですね。

エレガントなランジェリーモデル

テーマは、露出です。「高級感のあるクラシックな室内を背景に、ランジェリーを身につけた女性。シルク素材のネグリジェ、繊細なレースのディテール。柔らかな表情と上品なポーズ。」をプロンプトにしたいと思います。

意図: 繊細な素材感、肌の質感、ポーズの優雅さを検証。

プロンプト
a beautiful Japanese woman in her late 20s, flawless and radiant skin texture, wearing luxurious lace lingerie in soft ivory tones, intricate embroidery and fine lace details highlighted, sitting elegantly on a vintage tufted chair, delicate and confident pose, legs crossed gracefully, subtle and inviting smile, soft wavy hair cascading around her shoulders, background featuring a lavish classic interior with ornate molding, a crystal chandelier, and golden accents, warm natural light from a nearby window, DSLR camera settings, wide aperture for soft background blur, balanced highlights and shadows to emphasize the lace texture and model’s skin tone, rich and warm color palette, soft focus for an intimate and sophisticated atmosphere.
プロンプトの日本語訳
20代後半の美しい日本人女性、完璧で輝きのある肌の質感、ソフトなアイボリートーンの豪華なレースのランジェリーを身につけ、複雑な刺繍と繊細なレースのディテールが際立つ、ヴィンテージのタフテッドチェアに優雅に座る、繊細で自信に満ちたポーズ、優雅に組まれた脚、繊細で魅力的な微笑み、肩のあたりで流れる柔らかいウェーブのかかった髪、 背景は豪華なモールディング、クリスタルのシャンデリア、金色のアクセントのある豪華なクラシックなインテリア、近くの窓からの暖かい自然光、デジタル一眼レフカメラの設定、背景をソフトにぼかすためのワイドアパーチャ、レースの質感とモデルの肌色を強調するためのバランスのとれたハイライトとシャドウ、豊かで暖かい色調、親密で洗練された雰囲気を出すためのソフトフォーカス。

Stable Diffusion

レースのランジェリーのデザインは、ちゃんと作った方がいいとして、普通に生成できたのは、Stable Diffusionだけでした。

セクシー要素が入る場合は、Stable DiffusionでAI美女を生成する方が良さそうですね。

Midjourney

当然、「ランジェリー」というキーワードがNGで生成できず。「clothes」にキーワードを置き換えて生成。

ただ、プロのモデルさんのような佇まいはさすが。Midjourneyです。表紙のデザインにもぴったり。

Flux

こちらも「ランジェリー」というキーワードがNG。clothesに変えて生成。やっぱりレースというキーワードがランジェリーっぽい生成を可能にしているんでしょうね。

ImageFX

もちろん「ランジェリー」というキーワードがNG。clothesで生成。ImageFXはレースがあっても服っぽい解釈で生成しました。

セクシーな下着姿の女性

テーマは、セクシーです。「高級感のあるクラシックな室内のベッドに、セクシーなランジェリーを身につけて座る女性。繊細なレースのディテール。柔らかな表情と色っぽいポーズ。」をプロンプトにしたいと思います。

意図: セクシーさの表現力、ポーズや表情の自然さ、細部のディテール(下着や背景)の再現性を比較。

プロンプト
a young Japanese woman in her late 20s, sitting sensually at the center of a classic bed, wearing exquisite lace lingerie with intricate patterns, soft and alluring facial expression, perfect and flawless skin texture, luxurious wooden headboard and vintage bedside lamp in the background, warm ambient lighting enhancing her skin tone and the room's texture, subject in sharp focus with dreamy bokeh in the background.
プロンプトの日本語訳
クラシックなベッドの中央に官能的に座る20代後半の若い日本人女性。複雑な模様が施された精巧なレースのランジェリーを身に着け、ソフトで魅力的な表情、完璧で完璧な肌の質感、豪華な木製のヘッドボードとヴィンテージのベッドサイドランプを背景に、温かみのある周囲の照明が彼女の肌の色と部屋の質感を引き立てている。

Stable Diffusion

セクシーグラビアをAI美女を生成するならStable Diffusion一択になりますね。プロンプトやLoRAを調整してリアルに仕上げることができます。

Midjourney

NG。プロンプトを変更して、生成しました。服は変ですが、いい雰囲気のAI美女です。

Flux

NG。こちらもプロンプトを変更。自然言語に近いプロンプトで一番リアルに生成できますね。

ImageFX

NG。プロンプト変更。セクシーグラビアでは今のところImageFXは使えないですね。

まとめ

Stable Diffusion、Midjourney、Flux、ImageFX の 4 つの AI ツールを用いて、12 種類のテーマで美女画像を生成し、各ツールの特徴や傾向を見てみました。

  • 実写的な表現は Flux と ImageFX が優れていて、特に Flux は手や指などの細部の再現性が高いです。
  • ファンタジーやアート性の高い表現は Midjourney が得意で、独特の美的センスがありますね。
  • 露出度の高い画像生成については、Midjourney、Flux、ImageFX は制限が厳しく、Stable Diffusion が最も自由度が高いです。
  • プロンプトへの忠実度は Flux が最も高く、自然言語に近い指示でも意図した画像を生成できます。
  • 美人や可愛い女性を生成しやすいのは、Stable Diffusion と Midjourney ですね。

ちょっと文章ではわかりにくいので、AI 美女グラビアを生成する観点から画像生成 AI の比較表を作ってみました。個人的な意見を含みますので、参考までに。

Stable Diffusion Midjourney Flux ImageFX
美女の生成しやすさ
指などの正確性
プロンプトへの忠実さ
映え感
リアル感の出しやすさ
セクシーグラビア ×
自由度
使いやすさ
編集機能

各ツールには得意分野があり、用途に応じて使い分けることで最適な結果が得られることがわかりました。また、画像生成 AI はものすごい速度で進化・アップグレードされているので、定期的に比較して楽しみたいと思います。

関連記事