
画像生成AIといえば、DALL·EやMidjourneyが有名ですが、
Googleの Gemini も最近は強力な画像生成機能を搭載しています。
しかし―
- 「日本語で指示するとアスペクト比を無視される…」
- 「構図がぐちゃぐちゃになる」
- 「なぜか違う画風になってしまう…」
こんな経験、ありませんか?
実はGeminiの画像生成は、他のAIと比べてもクセが強いのが特徴。
そのため、ネットでは「じゃじゃ馬Gemini」と呼ばれることもあります。
ただし!
Geminiは使いこなせば とても表現力豊かで、魅力的な絵を生み出せるAI なんです。
この記事では、AI初心者でも安心できるように
やさしく、丁寧に、分かりやすく
「Geminiのじゃじゃ馬性を乗りこなすプロンプト術」を解説します。
\ AIスキルを短期間で伸ばしたい方へ /
ChatGPT・動画生成AI・画像AIを体系的に学べる講座。初心者でも安心のサポート付きで、最短10日で実務レベルに到達できます。
バイテック無料カウンセリングを見るなぜGeminiの画像生成は“じゃじゃ馬”なのか?
Geminiは多言語・マルチモーダルに強いモデルですが、
画像生成においては、次のようなクセが出ることがあります。
① 日本語プロンプトを“曖昧”と認識しやすい
Geminiは英語で訓練されているデータが多いため、日本語指示を受けると
- 「横長」
- 「アスペクト比16:9」
- 「アメリカンコミック風」
などを、やわらかい願望として解釈してしまいがちです。
その結果、「あれ…全然違う構図やん!」と驚くことになります。
② 画像サイズの初期設定が強く働く
Gemini内部には“生成しやすいサイズのテンプレート”があり、
日本語での指定が弱いと、そちらが優先されてしまうことがあります。
③ スタイル指示が通る時と通らない時の差が激しい
アメコミ風、水彩風、手描き風などの調整は得意ですが、
構図指定と重なると「どちらを優先するか」で迷子になるケースがあります。
Geminiが暴走しやすいプロンプトの例
Geminiを触ったことのある人なら「あるある!」となる場面です。
アスペクト比を完全無視
日本語で
「横長で」「アスペクト比16:9」
と書いても、正方形(アスペクト比1:1)が出てくることがあります。というより、現状ではまず正方形以外出てきません。 ほぼ100%無視されます。(^_^;)
手・ポーズ・向きの指定がズレる
右手が左手になったり、指が多かったり、向きが逆だったりすることがしばしばあります。
それに、手どころか「腕が3本」だったりといった現象もたまにあります。よく見なければ違和感を感じないほど3本目の腕が画像にうまく溶け込んでいるので発見が難しく、小憎らしいところです。
背景が突拍子もなく変化
「オフィス」と書いても、カフェやSF空間になることも。
これはあまり経験したことはないですね。具体的に「図書館」とか「某企業のオフィス」などと指定すれば、期待通りの結果が得られることが多いです。
総じて、Geminiは自由さと創造性が極端に強めなんですね。
じゃじゃ馬Geminiを手なづける基本プロンプト
ここからは「AI初心者でも必ず再現できる方法」を紹介します!
基本ルール:構図や比率は“英語で書く”
Geminiは英語での構図指示に強く反応します。学習データの大半が英語でラベル付けされた画像を大量に学習しています。そのため、英語で指示すると「対応するラベル」がそのまま発動しやすいようにできているよが理由だそうです。
また、プロンプトの受け取り方も日本語と英語ではちょっと異なるようで、英語の方が素直?に受け取ってくれるのだそうですよ。
アスペクト比を従わせる最強テンプレ
Generate an illustration in 16:9 aspect ratio.
This requirement is strict.
※日本語:イラストは16:9のアスペクト比で作成してください。この要件は厳格です。
これで 9割以上の確率で横長になります。
構図・方向を安定させる英語コマンド
Wide-angle horizontal composition.
Use a 16:9 canvas.
Bright lighting.
※日本語:広角で横長の構図。16:9のキャンバスを使用。明るい照明。
「キャンバス指定」は特に強力で、Gemini側が“従わざるを得ない”形になります。
スタイルを安定させるコマンド(アメコミ風)
Bright American comic style.
Vivid colors, clear outlines.
※日本語:明るいアメリカンコミックスタイル。鮮やかな色彩、くっきりとした輪郭。
日本語より圧倒的に安定します。
用途別「Geminiでも壊れない」プロンプト例
よく使うシーン別にまとめました。うまくいくでしょうか???
① ブログのアイキャッチ(16:9)
Generate an illustration in 16:9 aspect ratio (strict requirement).
Bright and clean comic style.
Scene: A blogger working on a laptop in a bright room.
Vivid colors, soft lighting, horizontal layout.
※日本語:16:9のアスペクト比でイラストを作成してください(必須)。 明るくクリーンなコミックスタイル。 シーン:明るい部屋でノートパソコンで作業するブロガー。 鮮やかな色彩、柔らかな照明、横長レイアウト。
【結果】未だにGeminiは不機嫌なようです。(^_^;)

② アメリカンコミック風(明るめ)
Generate a 16:9 illustration (strict).
Bright American comic style.
Vivid colors, bold outlines.
Scene: A businessperson thinking in an office.
※日本語:16:9のイラストを生成します(厳密)。 明るいアメリカンコミックスタイル。 鮮やかな色彩、大胆な輪郭。 シーン:オフィスで考え事をするビジネスマン。
【結果】明るいアメリカンコミックスタイル。 鮮やかな色彩、大胆な輪郭。 シーン:オフィスで考え事をするビジネスマン。は反映されていますが、アスペクト比はやはり無視されています。

③ 恋愛・占い系(柔らかい雰囲気)
16:9 aspect ratio (strict requirement).
Soft watercolor-like style.
Warm atmosphere, gentle lighting.
Scene: A woman looking at tarot cards at a café table.
※日本語:16:9のアスペクト比(必須)。 柔らかな水彩画のようなスタイル。 温かみのある雰囲気、柔らかな照明。 シーン:カフェのテーブルでタロットカードを見ている女性。
【結果】アスペクト比16:9を(必須)としてもやはり無視されています。

④ AIツール紹介用のテック系
Generate a 16:9 illustration (strict).
Futuristic clean design.
Blue and white color palette.
Scene: A user operating an AI dashboard on a laptop.
※日本語:16:9のイラストを生成します(厳密)。 未来的でクリーンなデザイン。 青と白のカラーパレット。 シーン:ユーザーがノートパソコンでAIダッシュボードを操作している。
【結果】これもアスペクト比16:9が無視されています。

上の4例を見てもわかるとおり、現状では画像の構図指定やタッチ、雰囲気などはかなり忠実に反映されていますが、なぜかアスペクト比の指定だけ、かたくなに無視しています。
英語で指示すれば解決!というわけでもなさそうですね。残念!
とりあえずの回避方法
正方形が出ることを前提として、次のように指定すると擬似的に横長の画像を生成してもらえます。
上下に25%の白いバンドを作り、中央に残った部分に画像を生成してください。
試しに② アメリカンコミック風(明るめ)を再度生成してみました。
プロンプトは日本語で以下のようにしました。
明るいアメリカンコミックスタイル。 鮮やかな色彩、大胆な輪郭。 シーン:オフィスで考え事をするビジネスマンのイメージ画像を作成してください。
横長の画像が欲しいので上下に25%の白いバンドを作り、中央に残った部分に画像を生成してください。
【結果】擬似的にですが、結果として横長の画像を得ることができました。これを画像編集ソフトなどでトリミングすれば出来上がりです。ただし、同じように指定しても白バンドの幅が一定しない、白いバンドの中に文字を勝手に入れてくるなど、結果はまちまちになる事が多いです。
Geminiのじゃじゃ馬たる所以でしょうかね。

Geminiの“暴走”を楽しむのもアリ!
Geminiは自由度が高いため、あえてプロンプトをゆるくして“予想外の作品”を楽しむユーザーもいます。
- 意図しない色使い
- 独特なポーズ
- 抽象的な構図
これが Geminiならではの味 です。まぁ、あまり厳密に考えずに人間側が柔軟に使うことがお互いの幸せにつながるのではないかと…。
ChatGPT × Gemini が最強の理由
実はこの組み合わせが最も効率的です。
① ChatGPTで最適プロンプトを作る
ChatGPTはプロンプト生成が得意。
構図・画風・要素を整理したうえで、英語化までしてくれる。
② Geminiで画像生成
得意なジャンルを最大限引き出せる。
③ 生成結果をChatGPTに戻して調整
「この画像の改善点」をChatGPTに聞けば、次の最適プロンプトを作れる。
「AIをAIで補正する」新時代のワークフローです。
最新AI Gemini3で画像生成を試してみたところ…
Gemini3がリリースされたのを受けて、同じように画像生成を試してみました。
現在ではブラウザ版GeminiでもVer.3が利用できるようになっています。
ということで、① ブログのアイキャッチ(16:9)を同じ英語プロンプトで画像生成を行ってみました。
【結果】旧バージョンと同じくアスペクト比の指示は無視されました。(^_^;)
下が生成された画像です。笑えます。
今後どのように改善されていくのかはわかりませんが…改善されるよね?Googleさん!

白いバンドで疑似横長の場合
もう一つ、上下に白いバンドを作る方法も試してみました。
プロンプトは同じです。
【結果】一応横長のイラストになっていいますが、前回と違いなぜか左右にも細い白帯が出てしまっています。
Geminiがプロンプトをどう理解しているのかわかりませんが、同じプロンプトでも妙に違った画像が生成される事がおわかり頂けると思います。まぁ、トリミングしてしまえば問題ないのですがね。

もう一度試してみたら、左右の白いバンドが消えていました。(^_^;)
結果が気に入らない場合は、一度で諦めずに複数回試してみることが必須かもしれませんね。

よくある質問(FAQ)
- QGeminiの画像生成は日本語だけでもできますか?
- A
できますが、構図やアスペクト比の指示が通りにくくなるため、
重要な部分だけ英語で書くと安定します。
- Qアスペクト比がどうしても反映されません…?
- A
英語で
「16:9 aspect ratio (strict requirement)」
と書くと成功率が上がります。
- Q人物の手やポーズがよく崩れます。改善できますか?
- A
「right hand」「left hand」「pose」「gesture」
など英語で具体的に記述すると改善されます。
- Qアメコミ風や水彩風はどのように指定すれば良い?
- A
英語で
「American comic style」
「soft watercolor style」
などテイスト名を明記すると安定します。
- QChatGPTとGeminiを両方使う意味は?
- A
ChatGPTはプロンプト整理が得意、Geminiは生成の味わいが強い。
相性が良いため、最適なプロンプト生成 → 画像生成 → 再調整
という流れが最強になります。
まとめ:Geminiで画像生成を楽しもう!
- Geminiは画像生成の自由度が高く“じゃじゃ馬”だが、それも魅力
- 英語プロンプトを使うことで、安定性は大幅に向上する
- 画像生成AI初心者でも、テンプレを使えばすぐに扱える
- ChatGPTと併用すれば、プロンプト設計が飛躍的に楽になる
Geminiはクセが強い分、扱い方を知ると唯一無二の“味”を持つ画像を作れるAI です。
ぜひこの記事を参考に、あなたもGeminiを乗りこなしてください!
\ AIスキルを短期間で伸ばしたい方へ /
ChatGPT・動画生成AI・画像AIを体系的に学べる講座。初心者でも安心のサポート付きで、最短10日で実務レベルに到達できます。
バイテック無料カウンセリングを見る関連記事
- 【初心者応援】生成AIプロンプトの基礎と文章・画像の実例10選+改善テクニック
- 生成AIの使い方完全ガイド|初心者が成果を出すプロンプトの書き方
- 第18回:AIに「こんな絵が欲しい」と伝えるコツ:画像プロンプトの基本
参考情報
- Googleアプリヘルプ:Gemini アプリで画像を生成、編集する
- Googleアプリヘルプ:Gemini アプリを使用する
- OpenAI:OpenAI のニュース



コメント