お世話になります。株式会社縁countです。今回はMidjourneyで使うプロンプトの生成を4つの人工知能モデルを使い比較していこうと思います。実際の画像やプロンプトも用いながら進めていきます。
各モデルに対する質問条件について
今回の質問条件は二段階方式です。①は構成②は詳細指示という内容で作っていきます。
①ミッドジャーニーで画像を生成するためのプロンプトを考えてください。
②アニメはじめの一歩の様なボクシング漫画のイラストを描きたいです。構図は体勢を低く取り、カウンターを狙っています。背景は黒で臨場感あふれるイラストにしたいです。グローブは赤。肌の色は少し日に焼けた小麦色。
上記の質問をしたときに各モデルはどのような反応をするのでしょうか?
Chatgptの場合
①の質問に対しての回答
もちろんです!どんな画像を作りたいですか?スタイル(リアル、アニメ、サイバーパンクなど)や構図、色合い、具体的な要素などを教えていただければ、最適なプロンプトを作成します。
②の質問に対して
以下のようなMidjourneyのプロンプトが適しています。
プロンプト(英語)
“A dynamic anime-style boxing illustration, inspired by ‘Hajime no Ippo.’ The boxer is in a low stance, preparing for a counterattack. He wears red boxing gloves, and his skin is slightly tanned. The background is black, creating a dramatic and intense atmosphere. High detail, cinematic lighting, motion blur, and sweat droplets add realism and impact. –ar 16:9 –v 5”
このプロンプトは、あなたの要望を反映しつつ、MidjourneyのAIが適切に解釈できるように調整しています。さらにリアルなディテールを求める場合は、「ultra-detailed」や「4K resolution」などのワードを加えてもよいでしょう。
できた画像

Geminiの場合
①の質問に対しての回答
Midjourneyで画像を生成するためのプロンプトですね。どのような画像を生成したいかによって、プロンプトは大きく変わります。いくつか例を挙げて、プロンプトの作成方法とコツを説明します。
- 具体的にイメージを伝える
Midjourneyは、あなたが与えたテキストに基づいて画像を生成します。そのため、できるだけ具体的にイメージを伝えることが重要です。
- 例:
- 「A cat sitting on a windowsill, looking out at a rainy city street. –ar 16:9 –v 5.2」
- (雨の降る街の通りを眺めながら窓辺に座っている猫。 –ar 16:9 –v 5.2)
- 「A futuristic cityscape with flying cars and neon lights, in the style of cyberpunk. –ar 1:1 –v 5.2」
- (サイバーパンクスタイルの、空飛ぶ車とネオンライトのある未来的な都市景観。 –ar 1:1 –v 5.2)
- –ar:画像の縦横比
- –v:バージョン
⒉スタイルを指定する
Midjourneyは、さまざまな画風で画像を生成できます。特定のアーティストやスタイルを指定することで、よりイメージに近い画像を生成できます。
- 例:
- 「A portrait of a woman, in the style of Van Gogh. –ar 2:3 –v 5.2」
- (ゴッホスタイルの女性の肖像画。 –ar 2:3 –v 5.2)
- 「A landscape painting, in the style of Japanese ink wash. –ar 3:2 –v 5.2」
- (日本の水墨画スタイルの風景画。 –ar 3:2 –v 5.2)
⒊パラメータを調整する
Midjourneyには、画像の生成を調整するためのさまざまなパラメータがあります。これらのパラメータを調整することで、より細かくイメージを伝えることができます。
- 主なパラメータ:
- –ar : 画像の縦横比
- –v : Midjourneyのバージョン
- –q : 画像の品質
- –s : スタイル強度
- –chaos : 生成される画像のバリエーション
⒋否定的なプロンプトを使用する
否定的なプロンプトを使用することで、画像に含めたくない要素を指定できます。
- 例:
- 「A beautiful landscape, –no people, buildings –ar 16:9 –v 5.2」
- (美しい風景、人物や建物は含めない。 –ar 16:9 –v 5.2)
プロンプト作成のコツ
- (美しい風景、人物や建物は含めない。 –ar 16:9 –v 5.2)
- キーワードを組み合わせる:複数のキーワードを組み合わせることで、より複雑なイメージを伝えることができます。
- 具体的な言葉を使う:抽象的な言葉よりも、具体的な言葉を使う方が、Midjourneyはイメージを理解しやすくなります。
- さまざまなプロンプトを試す:同じイメージでも、プロンプトの書き方によって生成される画像は大きく異なります。さまざまなプロンプトを試して、理想の画像を見つけましょう。
その他
Midjourneyの公式ドキュメントやコミュニティフォーラムには、プロンプト作成に関する情報がたくさんあります。これらの情報を参考にすることで、より効果的なプロンプトを作成できます。
もしよろしければ、どのような画像を生成したいか教えていただけますでしょうか?より具体的なプロンプトの作成をお手伝いします。
②の質問に対して
はい、こちらです。

これを画像ではなく、再現性の高いプロンプトにしてください。と制御を入れる。
はい、承知いたしました。
アニメ「はじめの一歩」のようなボクシング漫画のイラストを再現性の高い英語プロンプトに変換します。
プロンプト例:
“A dynamic illustration of a boxer in a low stance, coiled and ready to deliver a counter punch, in the style of the anime Hajime no Ippo. The background is a stark, intense black, emphasizing the drama of the moment. The boxer wears bright red boxing gloves, and their skin is a slightly sun-tanned wheat tone. Capture the intensity and energy of a crucial moment in a boxing match, with a focus on powerful lines and dynamic shading.”
プロンプトの要素解説:
- “A dynamic illustration of a boxer in a low stance, coiled and ready to deliver a counter punch”:
- ボクサーのポーズと動きを具体的に描写しています。
- 「dynamic」は動きのある様子、「coiled」はバネのように力を溜めている様子を表します。
- “in the style of the anime Hajime no Ippo”:
- 画風を「はじめの一歩」のアニメスタイルに指定しています。
- “The background is a stark, intense black, emphasizing the drama of the moment”:
- 背景の色と効果を詳細に記述しています。
- 「stark」は、際立った、厳しいなどの意味があり、背景の黒を強調する為に使っています。
- “The boxer wears bright red boxing gloves, and their skin is a slightly sun-tanned wheat tone”:
- ボクサーの装備と肌の色を具体的に指定しています。
- “Capture the intensity and energy of a crucial moment in a boxing match, with a focus on powerful lines and dynamic shading”:
- イラスト全体の雰囲気と技術的な要素を指定しています。
プロンプトのポイント: - 具体的な描写:ポーズ、背景、色、スタイルなど、詳細な情報を加えることで、Midjourneyはより正確にイメージを理解できます。
- スタイルの指定:「はじめの一歩」のような特定のアニメスタイルを指定することで、画風の統一感を出します。
- 感情の表現:単に描写するだけでなく、「intensity(激しさ)」や「drama(ドラマチック)」といった感情を表す言葉を加えることで、より臨場感のあるイラストを生成できます。
このプロンプトをMidjourneyに入力することで、よりイメージに近いイラストが生成されることを期待できます。
できた画像

copilotの場合
①の質問に対しての回答
もちろんです!ミッドジャーニーを活用して、どんなシーンやテーマの画像を生成したいかを教えていただければ、それに応じたプロンプトを考えます。以下は、いくつかの例として考えられるプロンプトです:
- ファンタジーな風景: 「神秘的な森の中に浮かぶ城、霧が立ち込め、光の魔法のかけらが舞う様子」
- 未来の都市: 「未来のメガシティ、空飛ぶ車、煌びやかなネオンライトの街並み」
- 動物のアート: 「王冠をかぶったライオン、黄金の鎧をまとい、壮大な背景に立つ様子」
- 和風の美: 「桜の花が咲き乱れる静かな湖畔、木造の家屋と鳥居が見える風景」
具体的なテーマや要素があれば、それに合わせたプロンプトを考えますので、ぜひ教えてください! 🎨
どんなシーンを思い描いていますか?
②の質問に対して
いきなり画像で回答。

その後、これを画像ではなく、再現性の高いプロンプトにしてください。と制御を入れる。
もちろんです!以下のプロンプトをミッドジャーニーで使用して、臨場感あふれるボクシング漫画のイラストを生成するのに役立ててください:
「アニメ『はじめの一歩』風のボクシング漫画イラスト。体勢を低く取り、カウンターを狙っているボクサー。背景は黒で臨場感あふれる雰囲気。赤いグローブを着けている。肌の色は少し日に焼けた小麦色。」
このプロンプトでどんな作品が生成されるか楽しみですね!何か変更点や追加の要素があれば教えてください。 🥊✨
できた画像

DeepSeekの場合
①の質問に対しての回答
もちろんです!以下は、ミッドジャーニー(MidJourney)で画像を生成するためのプロンプトの例です。テーマやスタイルに応じて自由にアレンジしてください。
1. ファンタジー風景
「A mystical forest with glowing trees, fairies flying around, and a crystal-clear lake reflecting the moonlight, in the style of Studio Ghibli, ultra-detailed, vibrant colors, 4K resolution」
2. 未来都市
「A futuristic cityscape at night, with neon lights, flying cars, and towering skyscrapers, in the style of cyberpunk, highly detailed, cinematic lighting, 8K resolution」
3. ヴィンテージポートレート
「A vintage portrait of a 1920s flapper girl, wearing a beaded dress and a feathered headband, in the style of Art Deco, soft lighting, muted colors, high detail」
4. 宇宙探検
「An astronaut exploring an alien planet with strange plants and two suns in the sky, in the style of sci-fi concept art, highly detailed, vibrant colors, 4K resolution」
5. メカニカルアニマル
「A mechanical wolf with glowing blue eyes, standing on a snowy mountain peak, in the style of steampunk, highly detailed, intricate gears, cinematic lighting」
6. サムライ戦士
「A samurai warrior standing in a bamboo forest, with cherry blossoms falling around him, in the style of traditional Japanese ink painting, highly detailed, serene atmosphere」
7. ドラゴンと城
「A massive dragon perched on a medieval castle, with flames erupting from its mouth, in the style of high fantasy art, highly detailed, dramatic lighting, 4K resolution」
8. シュールな夢
「A surreal dreamscape with floating islands, upside-down waterfalls, and giant clocks melting into the sky, in the style of Salvador Dali, highly detailed, vibrant colors」
9. アンダーウォーターワールド
「An underwater city with coral buildings, schools of colorful fish, and a sunken pirate ship, in the style of fantasy art, highly detailed, vibrant colors, 4K resolution」
10. ポストアポカリプス
「A post-apocalyptic wasteland with abandoned cars, overgrown vegetation, and a lone survivor walking through the ruins, in the style of dystopian art, highly detailed, muted colors, cinematic lighting」
これらのプロンプトは、ミッドジャーニーが生成する画像の雰囲気やディテールをコントロールするためのガイドラインとして使えます。プロンプトに「highly detailed」や「cinematic lighting」などのキーワードを加えることで、よりリアルで魅力的な画像を生成することができます。
②の質問に対して
了解しました!アニメ『はじめの一歩』のようなボクシング漫画のイラストを描くためのプロンプトを考えました。以下は、ミッドジャーニーで使用できる詳細なプロンプトです。
プロンプト:
「A dynamic boxing scene, a young boxer in a low stance, preparing to counterpunch, intense focus in his eyes, wearing red boxing gloves, slightly tanned skin, sweat dripping, dramatic lighting, black background, in the style of anime like Hajime no Ippo, highly detailed, vibrant colors, cinematic atmosphere, 4K resolution」
プロンプトのポイント:
- 構図: 「low stance, preparing to counterpunch」で、低い体勢でカウンターを狙う瞬間を表現。
- キャラクターデザイン: 「slightly tanned skin」で小麦色の肌、「red boxing gloves」で赤いグローブを指定。
- 背景: 「black background」で背景を黒にし、臨場感を強調。
- スタイル: 「in the style of anime like Hajime no Ippo」で『はじめの一歩』のようなアニメ調を指定。
- 雰囲気: 「dramatic lighting, sweat dripping, intense focus」で緊張感と臨場感を演出。
- 画質: 「highly detailed, vibrant colors, 4K resolution」で高画質かつ鮮やかな色合いを指定。
このプロンプトを使えば、『はじめの一歩』のような迫力あるボクシングシーンを再現できるはずです!
できた画像

比較結果
今回の比較結果を比べたところ、ChatGptとDeepSeekの回答精度が高いことがわかりました。Geminiとcopilotは、回答結果で画像を出そうとしてくる傾向があり会話の流れを読めていない印象と文字が多すぎて、分かりやすくまとまっていないと感じました。DeepSeekは最初の構成のところで、たくさんのことを教えてくれましたがまとまってない印象。使い勝手が良かったのはChatGptでした。
モデル | ①に対する回答(構成) | ②に対する回答(プロンプト) | 画像 |
---|---|---|---|
ChatGpt | ⚪︎簡潔にポイントをまとめている | ⚪︎簡潔にポイントをまとめている | ⚪︎ |
DeepSeek | △返答できているが、回答がまとまっていない | ⚪︎簡潔にポイントをまとめている | ⚪︎ |
Gemini | ×画像で返す | ×制御をつけないといけない | ⚪︎ |
copilot | ×画像で返す | ×制御をつけないといけない | × |




以上が今回の比較結果です。今後もAIに関する情報など発信していきますのでお楽しみにしてください。

そのほかの関連情報はこちら
コメント