Gemini（旧Bard）が絵を描けるように。テキストから画像生成の方法。 / メモ / いがわ

Gemini（旧Bard）が絵を描けるように。テキストから画像生成の方法。

2024.02.02 2025.09.02更新。

Contents - 目次

1 Geminiの使い方。画像生成の例。
2 Geminiによるテキストから画像生成。2024年2月。
3 Geminiによるテキストから画像生成。2024年8月。
4 Geminiによるテキストから画像生成。2025年4月。
5 Geminiによる画像から画像生成。2025年9月。
6 Gemini利用時の注意点。
7 AI 関連メモ。

Geminiの使い方。画像生成の例。

Googleの生成AI Geminiの画像生成。

テキストから画像生成。

Googleの生成AI、「Bard（現Gemini）」が画像生成をスタート。

ChatGPTやCopilotのように、テキストによる指示で画像が生成ができる。

（※2024年2月8日に、Bard（バード）からGemini（ジェミニ）に名称が変更。）

Geminiによるテキストから画像生成。2024年2月。

テキストから画像生成（Text to Image）の例。

Create a picture of puppies in a basket.

Googleの例の中の「Create a picture of puppies in a basket.」というテキストを送ってみると、次のような画像が生成された。

一回の生成は2枚だが、「さらに作成」をクリックすると、もう2枚生成される。

写真のようになっているのは、「picture」が「絵」よりも「写真」を優先させていのかもしれない。

テキストから画像生成の例その２。

Create a picture of a cat with adorable eyes.

ちょっと思ってたのと違うという場合、指示を追加していくことができる。

「マンガ風に」や、「別のパターンも」という感じでお願いできる。

「ルネサンス風」と、「印象派風」でお願いした場合。

浮世絵にはまだ対応していない様子。

ただ、生成AIは日々進化しており、近い将来、より高度な画像生成が可能になると思われる。

（※2025年2月に試したところ、浮世絵風も可能。）

Geminiによる生成画像。

テキストから画像生成の例その３。

Draw a picture of a human wearing sunglasses relaxing on the beach with the sea at sunset.

「夕暮れ時の海辺でサングラスをかけた人がリラックスしている」でお願いした場合。

「サングラスを外して」と追加すると、サングラスをかけていないバージョンが生成される。

（※人物の画像生成は、2024年中頃から不可に。2025年春頃から再開。）

生成画像の質問。2024年2月。

Bard（現Gemini）に聞いてみると、下記のような回答があった。

円、四角形、三角形などの図形。
顔、花、動物などのシンプルなイラスト。
風景、建物などの簡単な絵。

簡単な画像生成だけかと思いきや、上記のようにむしろ写実的な画像や、〇〇風のタッチ、テイストの表現もできる。

Geminiによるテキストから画像生成。2024年8月。

テキストから画像生成（Text to Image）の例。

Geminiの画像生成が再開。

一時的にストップしていたGeminiの画像生成が、2024年8月下旬から再開。以前よりバージョンアップしたImagenを使用した生成画像となっている。

（※2024年2月時と比べるため、同じプロンプトを使用。）

Create a picture of puppies in a basket.

Geminiによる生成画像。バスケットの中にいる子犬。

テキストから画像生成の例その４。

Create a picture of a cat with adorable eyes.

Geminiによる生成画像。愛らしい目をした猫。

テキストから画像生成の例その５。

可愛い２匹の猫が遊んでいる画像をお願いします。

Geminiによる生成画像。可愛い２匹の猫が遊んでいる画像。

テキストから画像生成の例その６。

可愛い2匹の猫が遊んでいる風景を、イラスト風のタッチで描いてください。

写真のような画像になるので、「イラスト風のタッチで」でと指定。

Geminiによる生成画像。可愛い２匹の猫が遊んでいる画像。

Geminiの画像生成について。

2024年8月31時点。（2025年4月時点でも。）

日本語での画像生成も可能。
一度に生成される画像は1枚。
特にスタイルなどを指定しなければ、写真のような（写実的な）画像が生成される。
枚数やサイズ、アスペクト比の指定はおそらく不可。2048px × 2048pxの正方形で1枚ずつ、生成される。

Geminiの画像生成のモデルと料金について。

画像生成のモデルと料金。

Geminiの画像生成は、2024年2月時点では「Imagen 2」を使用しており、2024年8月の再開時には「Imagen 3」、2025年には「Imagen 4」とバージョンアップしている。

現時点では無料で生成できる。

（※いずれ変更される可能性はあり。）

参照元：Imagen – Google DeepMind
参照元：Google AI Pro と Ultra で Gemini 2.5 Pro などにアクセス

Geminiの画像生成の枚数について。

画像生成の回数制限。

回数制限については、Geminiに聞いてみたところ無制限とのこと。

（※いずれ変更される可能性はあり。）

Geminiへのプロンプトについて。

指示や情報の例。

具体的な指示があれば、できる限りそれに沿って絵を描けるそう。

例えば以下の情報があると、絵を生成しやすいとのこと。

どんな絵を描いてほしいか。（例：赤い丸を描いてください。）
絵のサイズ。（例：サイズは200px × 100pxにしてください。ただし実際にはおそらく2048px × 2048pxの正方形となる。）
絵のスタイル。（例：シンプル、リアル、イラスト風、アニメ風など。）

プロンプトは自然言語によるテキスト形式。

テキストの例。

絵画の構図、色、線画、質感などの詳細を指定。

「富士山を夕焼けの背景で描いてください。」
「猫と犬を水彩画で描いてください。」
「〇〇風の抽象画を赤と青で描いてください。」
（※実在の人物やキャラクターなどを使用すると、著作権侵害などの可能性があるので注意が必要です。）

Geminiによるテキストから画像生成。2025年4月。

テキストから画像生成（Text to Image）の例。

画像生成の方法。

メッセージ（プロンプト）の入力欄に、生成した欲しい画像についてのテキストを入力すると、すぐに画像が生成される。

（※2024年の2月と8月の時と比べるため、同じプロンプトを使用。）

可愛い２匹の猫が遊んでいる画像をお願いします。

Geminiによる生成画像。可愛い２匹の猫が遊んでいる画像。

テキストから画像生成の例その７。

可愛い２匹の猫が遊んでいる画像をお願いします。枚数は2枚、サイズは400px × 300pxにしてください。

Geminiによる生成画像。可愛い２匹の猫が遊んでいる画像。

枚数の指定や、アスペクト比は指定できないかも。

Googleの公式サイトから。

Google AI for Developersによると、指定範囲内での生成画像の枚数やアスペクト比（縦横比）の指定ができるようだが、今回はできなかった。

参照元：画像を生成する | Gemini API | Google AI for Developers
参照元：Gemini モデル | Gemini API | Google AI for Developers

Geminiによる生成画像。可愛い２匹の猫が遊んでいる画像。

テキストから画像生成の例その８。

可愛いけど、版画形式の浮世絵よりもアニメに近くなってしまっている。もっと浮世絵風にできるかな？

今回の場合、最初の写実的な画像から、4回目で、浮世絵風になった。

指示をもっとうまく行えば、より早くできたかもしれない。

Geminiによる生成画像。可愛い２匹の猫が遊んでいる画像。

Geminiによる画像から画像生成。2025年9月。

※2025年8月31日追記）

Google AI StudioのGeminiの画像編集について。

Gemini 2.5 Flash Image（Nano Banana）。

2025年8月27日に、Gemini 2.5 Flash Image（Nano Banana）という新しいモデルがリリース。

URL：Google AI Studio

関連：Geminiで画像の作成と編集。人物や写真、イラストの商用利用と注意点。

※2025年9月2日追記）

Google Geminiの画像編集について。

Gemini 2.5 Flash。

その後、通常のGoogle Gemini 2.5 FlashへもNano Bananaの機能が搭載され、画像を元にした画像加工・修正が可能に。

URL：Google Gemini

画像から画像編集（Image to Image）の例。

画像編集の方法。

モデルは「Gemini 2.5 Flash」を選択。
チャット入力欄から、画像をアップロード。
入力欄から画像の加工や編集の指示文（プロンプト）を送る。

メッセージ（プロンプト）の入力欄に、編集したい画像をアップすると、それから画像編集の指示が行える。

ありがとう。いい感じです。
次にこの女性を日本人に変えることはできますか？

・髪型はドレッドではなく黒髪で、肩付近までの長さ。
・被っている帽子はとってください。

Geminiによる生成画像を利用。

画像はAIの学習データにされる可能性もある。

無料プランの場合、「Geminiアプリアクティビティ」をオフにしなければ、Geminiの学習データとして使用される可能性がある。

生成AIの法整備は遅れているため、リスクは回避する。h5>

自分や家族、友人知人はもちろん、他人であっても勝手に画像をアップすることには「肖像権」や「プライバシー権」に触れるリスクがある。

そのため、画像は2024年3月にBard（現Gemini）によって生成され、2025年8月にGoogle AI StudioのGeminiによって編集されたものを使用。

テキストだけで変わらない場合は、入力欄の「画像」ボタンを押して、改めて指示を送ると良いかも。

プロンプト入力欄と画像ボタン。

Geminiへのプロンプト入力欄と、画像ボタンのスクショ。

生成された画像。

Geminiによる人物の画像編集加工と、プロンプトのスクショ。

Gemini利用時の注意点。

Geminiの年齢制限。

年齢制限が曖昧。

※2025年2月19日追記）

Geminiアプリのプライバシーハブには、生成された画像は、18歳未満のユーザーは利用できないという記載がある。

Gemini アプリのプライバシーハブの、年齢制限についての画像。

Gemini アプリのプライバシーハブ – Gemini Apps ヘルプ

Geminiと、Googleアカウントの年齢制限。

GeminiやGoogleアカウントの利用は、13歳以上と記載あり。（日本の場合。）

2025年2月時点では、AndroidとiOSでのGeminiアプリは12歳以上となっている。

スマホアプリのGeminiの年齢制限。（Android & iOS）

今後も変更があるかもしれず、注意が必要かも。

Geminiの商用利用について。

商用利用も注意が必要。

Googleの公式サイトには明確な記載は見つからず、Geminiに商用利用について聞いてみてもはっきりとした回答がなかった。

Geminiによると、Google AIが著作権を持つ可能性や追加ライセンスの必要性、将来的に変更される可能性や画風の元の著作権の影響などがあるとのこと。

関連：ChatGPTやGeminiなど生成AIの年齢制限と、AI使用のリスク。

Geminiの使い方。Geminiによる画像生成。

Image：Gemini by Google AI

以上、参考になれば幸いです。

※Webデザインは実務数年、職業訓練校講師数年、フリーランス数年、計15年以上のキャリアがありますが、一気にがぁっと書いているので「です・ます調」ではありません。（元々はメモ書きでした。） ※事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ訂正いたします。 ※写真は主にUnsplashやPixabayのフリー素材を利用させていただいております。その他の写真や動画もフリー素材やパブリックドメイン、もしくは自前のものを使用しております。