Gemini(旧Bard)が絵を描けるように。テキストから画像生成の方法。 / いがわ

.

Memo

Geminiの画像生成。使い方について。

Geminiの使い方。画像生成の例。

Googleの生成AI Geminiの画像生成。

テキストから画像生成。

Googleの生成AI、「Bard(現Gemini)」が画像生成をスタート。

ChatGPTやCopilotのように、テキストによる指示で画像が生成ができる。

2024年2月8日に、Bard(バード)からGemini(ジェミニ)に名称が変更。)


Geminiによるテキストから画像生成。2024年2月。

テキストから画像生成(Text to Image)の例。

Create a picture of puppies in a basket.

Googleの例の中の「Create a picture of puppies in a basket.」というテキストを送ってみると、次のような画像が生成された。

一回の生成は2枚だが、「さらに作成」をクリックすると、もう2枚生成される。

Bard(Gemini)による生成画像。
Bard(Gemini)による生成画像。

写真のようになっているのは、「picture」が「絵」よりも「写真」を優先させていのかもしれない。

テキストから画像生成の例 その2。

Create a picture of a cat with adorable eyes.

ちょっと思ってたのと違うという場合、指示を追加していくことができる。

Geminiによる生成画像。
Geminiによる生成画像。

「マンガ風に」や、「別のパターンも」という感じでお願いできる。

Geminiによる生成画像。
Geminiによる生成画像。

「ルネサンス風」と、「印象派風」でお願いした場合。

Geminiによる生成画像。

浮世絵にはまだ対応していない様子。

ただ、生成AIは日々進化しており、近い将来、より高度な画像生成が可能になると思われる。

2025年2月に試したところ、浮世絵風も可能。)

Geminiによる生成画像。

テキストから画像生成の例 その3。

Draw a picture of a human wearing sunglasses relaxing on the beach with the sea at sunset.

「夕暮れ時の海辺でサングラスをかけた人がリラックスしている」でお願いした場合。

「サングラスを外して」と追加すると、サングラスをかけていないバージョンが生成される。

人物の画像生成は、2024年中頃から不可に。2025年春頃から再開。)

Geminiによる生成画像。
Geminiによる生成画像。
生成画像の質問。2024年2月。

Bard(現Gemini)に聞いてみると、下記のような回答があった。

  • 円、四角形、三角形などの図形。
  • 顔、花、動物などのシンプルなイラスト。
  • 風景、建物などの簡単な絵。

簡単な画像生成だけかと思いきや、上記のようにむしろ写実的な画像や、〇〇風のタッチ、テイストの表現もできる。


Geminiによるテキストから画像生成。2024年8月。

テキストから画像生成(Text to Image)の例。

Geminiの画像生成が再開。

一時的にストップしていたGeminiの画像生成が、2024年8月下旬から再開。以前よりバージョンアップしたImagenを使用した生成画像となっている。

2024年2月時と比べるため、同じプロンプトを使用。)

Create a picture of puppies in a basket.

Geminiによる生成画像。バスケットの中にいる子犬。

テキストから画像生成の例 その4。

Create a picture of a cat with adorable eyes.

Geminiによる生成画像。愛らしい目をした猫。

テキストから画像生成の例 その5。

可愛い2匹の猫が遊んでいる画像をお願いします。

Geminiによる生成画像。可愛い2匹の猫が遊んでいる画像。

テキストから画像生成の例 その6。

可愛い2匹の猫が遊んでいる風景を、イラスト風のタッチで描いてください。

写真のような画像になるので、「イラスト風のタッチで」でと指定。

Geminiによる生成画像。可愛い2匹の猫が遊んでいる画像。

Geminiの画像生成について。

2024年8月31時点。(2025年4月時点でも。)
  • 日本語での画像生成も可能。
  • 一度に生成される画像は1枚。
  • 特にスタイルなどを指定しなければ、写真のような(写実的な)画像が生成される。
  • 枚数やサイズ、アスペクト比の指定はおそらく不可。2048px × 2048pxの正方形で1枚ずつ、生成される。

Geminiの画像生成のモデルと料金について。

画像生成のモデルと料金。

Geminiの画像生成は、2024年2月時点では「Imagen 2」を使用しており、2024年8月の再開時には「Imagen 3」、2025年には「Imagen 4」とバージョンアップしている。

現時点では無料で生成できる。

いずれ変更される可能性はあり。)

Geminiの画像生成の枚数について。

画像生成の回数制限。

回数制限については、Geminiに聞いてみたところ無制限とのこと。

いずれ変更される可能性はあり。)

Geminiへのプロンプトについて。

指示や情報の例。

具体的な指示があれば、できる限りそれに沿って絵を描けるそう。

例えば以下の情報があると、絵を生成しやすいとのこと。

  • どんな絵を描いてほしいか。(例:赤い丸を描いてください。)
  • 絵のサイズ。(例:サイズは200px × 100pxにしてください。ただし実際にはおそらく2048px × 2048pxの正方形となる。)
  • 絵のスタイル。(例:シンプル、リアル、イラスト風、アニメ風など。)

プロンプトは自然言語によるテキスト形式。

テキストの例。

絵画の構図、色、線画、質感などの詳細を指定。

  • 「富士山を夕焼けの背景で描いてください。」
  • 「猫と犬を水彩画で描いてください。」
  • 「〇〇風の抽象画を赤と青で描いてください。」
    実在の人物やキャラクターなどを使用すると、著作権侵害などの可能性があるので注意が必要です。)


Geminiによるテキストから画像生成。2025年4月。

テキストから画像生成(Text to Image)の例。

画像生成の方法。

メッセージ(プロンプト)の入力欄に、生成した欲しい画像についてのテキストを入力すると、すぐに画像が生成される。

2024年の2月と8月の時と比べるため、同じプロンプトを使用。)

可愛い2匹の猫が遊んでいる画像をお願いします。

Geminiによる生成画像。可愛い2匹の猫が遊んでいる画像。

テキストから画像生成の例 その7。

可愛い2匹の猫が遊んでいる画像をお願いします。枚数は2枚、サイズは400px × 300pxにしてください。

Geminiによる生成画像。可愛い2匹の猫が遊んでいる画像。

枚数の指定や、アスペクト比は指定できないかも。

Googleの公式サイトから。

Google AI for Developersによると、指定範囲内での生成画像の枚数やアスペクト比(縦横比)の指定ができるようだが、今回はできなかった。

Geminiによる生成画像。可愛い2匹の猫が遊んでいる画像。

テキストから画像生成の例 その8。

可愛いけど、版画形式の浮世絵よりもアニメに近くなってしまっている。もっと浮世絵風にできるかな?

今回の場合、最初の写実的な画像から、4回目で、浮世絵風になった。

指示をもっとうまく行えば、より早くできたかもしれない。

Geminiによる生成画像。可愛い2匹の猫が遊んでいる画像。


Geminiによる画像から画像生成。2025年9月。


2025年8月31日 追記)

Google AI StudioのGeminiの画像編集について。

Gemini 2.5 Flash Image(Nano Banana)。

2025年8月27日に、Gemini 2.5 Flash Image(Nano Banana)という新しいモデルがリリース。



2025年9月2日 追記)

Google Geminiの画像編集について。

Gemini 2.5 Flash。

その後、通常のGoogle Gemini 2.5 FlashへもNano Bananaの機能が搭載され、画像を元にした画像加工・修正が可能に。

画像から画像編集(Image to Image)の例。

画像編集の方法。
  1. モデルは「Gemini 2.5 Flash」を選択。
  2. チャット入力欄から、画像をアップロード。
  3. 入力欄から画像の加工や編集の指示文(プロンプト)を送る。

メッセージ(プロンプト)の入力欄に、編集したい画像をアップすると、それから画像編集の指示が行える。

ありがとう。いい感じです。
次にこの女性を日本人に変えることはできますか?

・髪型はドレッドではなく黒髪で、肩付近までの長さ。
・被っている帽子はとってください。

Geminiによる生成画像を利用。

画像はAIの学習データにされる可能性もある。

無料プランの場合、「Geminiアプリアクティビティ」をオフにしなければ、Geminiの学習データとして使用される可能性がある。

生成AIの法整備は遅れているため、リスクは回避する。h5>

自分や家族、友人知人はもちろん、他人であっても勝手に画像をアップすることには「肖像権」や「プライバシー権」に触れるリスクがある。

そのため、画像は2024年3月にBard(現Gemini)によって生成され、2025年8月にGoogle AI StudioのGeminiによって編集されたものを使用。

Geminiによる人物の画像認識と、プロンプトのスクショ。

テキストだけで変わらない場合は、入力欄の「画像」ボタンを押して、改めて指示を送ると良いかも。

プロンプト入力欄と画像ボタン。

Geminiへのプロンプト入力欄と、画像ボタンのスクショ。

生成された画像。

Geminiによる人物の画像編集加工と、プロンプトのスクショ。


Gemini利用時の注意点。

Geminiの年齢制限。

年齢制限が曖昧。
2025年2月19日 追記)

Geminiアプリのプライバシーハブには、生成された画像は、18歳未満のユーザーは利用できないという記載がある。

Gemini アプリのプライバシー ハブの、年齢制限についての画像。

Geminiと、Googleアカウントの年齢制限。

GeminiやGoogleアカウントの利用は、13歳以上と記載あり。(日本の場合。)

2025年2月時点では、AndroidとiOSでのGeminiアプリは12歳以上となっている。

スマホアプリのGeminiの年齢制限。(Android & iOS)

今後も変更があるかもしれず、注意が必要かも。

Geminiの商用利用について。

商用利用も注意が必要。

Googleの公式サイトには明確な記載は見つからず、Geminiに商用利用について聞いてみてもはっきりとした回答がなかった。

Geminiによると、Google AIが著作権を持つ可能性や追加ライセンスの必要性、将来的に変更される可能性や画風の元の著作権の影響などがあるとのこと。

Geminiの使い方。Geminiによる画像生成。

Image:Gemini by Google AI

以上、参考になれば幸いです。


Webデザインは実務数年、職業訓練校講師数年、フリーランス数年、計15年以上のキャリアがありますが、一気にがぁっと書いているので「です・ます調」ではありません。(元々はメモ書きでした。) 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ訂正いたします。 写真は主にUnsplashPixabayのフリー素材を利用させていただいております。その他の写真や動画もフリー素材やパブリックドメイン、もしくは自前のものを使用しております。

井川 宜久 / Norihisa Igawa
デザイナー、ディレクター、講師、コーチ / 井川宜久

AI 関連メモ。

ChatGPT 関連メモ。

Gemini 関連メモ。

Copilot、Bing 関連メモ。

Llama 関連メモ。

Claude 関連メモ。


免責事項について

  • 記事ページ(Memosのページ)は当初は文字通りメモ書きでした。その後、修正や更新をしております。
  • 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ早急に対応いたします。
  • 一個人のポートフォリオサイトですので、万一損害・トラブル等が発生した場合でも、一切の責任を負いかねます。