Bard(Gemini)が絵を描けるように。テキストから画像生成の方法。 / いがわ

.

Memo

Geminiの画像生成。使い方について。

Geminiの使い方。画像生成の例。

Googleの生成AI Geminiの画像生成。

テキストから画像生成。

Googleの生成AI、「Bard(現Gemini)」が画像生成をスタート。

ChatGPTやCopilotのように、テキストによる指示で画像が生成ができる。

2024年2月8日に、BardからGemini(ジェミニ)に名称が変更。)


Geminiによるテキストから画像生成。2024年8月。

テキストから画像生成の例。

Geminiの画像生成が再開。

一時的にストップしていたGeminiの画像生成が、2024年8月下旬から再開。以前よりバージョンアップしたImagen 3を使用した生成画像となっている。

プロンプト入力欄にそのままテキストを入力すると、すぐに画像が生成される。

2024年2月時と比べるため、同じプロンプトを使用。)

Create a picture of puppies in a basket.

Geminiによる生成画像。バスケットの中にいる子犬。

テキストから画像生成の例 その2。

Create a picture of a cat with adorable eyes.

Geminiによる生成画像。愛らしい目をした猫。

テキストから画像生成の例 その3。

可愛い2匹の猫が遊んでいる画像をお願いします。

Geminiによる生成画像。可愛い2匹の猫が遊んでいる画像。

テキストから画像生成の例 その4。

可愛い2匹の猫が遊んでいる風景を、イラスト風のタッチで描いてください。

写真のような画像になるので、「イラスト風のタッチで」でと指定。

Geminiによる生成画像。可愛い2匹の猫が遊んでいる画像。

Geminiの画像生成について。

2024年8月31時点。
  • 日本語での画像生成も可能。
  • 一度に生成される画像は1枚。
  • 特にスタイルなどを指定しなければ、写真のような(写実的な)画像が生成される。
  • サイズやアスペクト比の指定は不可。2048px × 2048pxの正方形で生成される。
  • 人物の画像生成は、Gemini Advancedが必要。

Geminiの画像生成の料金について。

画像生成の料金。

Geminiの画像生成は2024年2月時点では「Imagen 2」を使用しており、2024年8月の再開時には「Imagen 3」とバージョンアップしている。現時点では無料で生成できる。

Geminiの画像生成の枚数について。

画像生成の回数制限。

回数制限については、Geminiに聞いてみたところ無制限とのこと。

Geminiへのプロンプトについて。

指示や情報の例。

具体的な指示があれば、できる限りそれに沿って絵を描けるそう。

例えば以下の情報があると、絵を生成しやすいとのこと。

  • どんな絵を描いてほしいか。(例:赤い丸を描いてください。)
  • 絵のサイズ。(例:サイズは200px × 100pxにしてください。ただし実際には2048px × 2048pxの正方形となる。)
  • 絵のスタイル。(例:シンプル、リアル、イラスト風、アニメ風など。)

プロンプトは自然言語によるテキスト形式。

テキストの例。

絵画の構図、色、線画、質感などの詳細を指定。

  • 「富士山を夕焼けの背景で描いてください。」
  • 「猫と犬を水彩画で描いてください。」
  • 「〇〇風の抽象画を赤と青で描いてください。」
    実在の人物やキャラクターなどを使用して公開すると、著作権侵害などの可能性があるので注意が必要です。)


Geminiによるテキストから画像生成。2024年2月。

テキストから画像生成の例。

Create a picture of puppies in a basket.

Googleの例の中の「Create a picture of puppies in a basket.」というテキストを送ってみると、次のような画像が生成された。

一回の生成は2枚だが、「さらに作成」をクリックすると、もう2枚生成される。

Bard(Gemini)による生成画像。
Bard(Gemini)による生成画像。

写真のようになっているのは、「picture」が「絵」よりも「写真」を優先させていのかもしれない。

テキストから画像生成の例 その2。

Create a picture of a cat with adorable eyes.

ちょっと思ってたのと違うという場合、指示を追加していくことができる。

Geminiによる生成画像。
Geminiによる生成画像。

「マンガ風に」や、「別のパターンも」という感じでお願いできる。

Geminiによる生成画像。
Geminiによる生成画像。

「ルネサンス風」と、「印象派風」でお願いした場合。

Geminiによる生成画像。

浮世絵にはまだ対応していない様子。

ただ、生成AIは日々進化しており、近い将来、より高度な画像生成が可能になると思われる。

Geminiによる生成画像。

テキストから画像生成の例 その3。

Draw a picture of a human wearing sunglasses relaxing on the beach with the sea at sunset.

「夕暮れ時の海辺でサングラスをかけた人がリラックスしている」でお願いした場合。

「サングラスを外して」と追加すると、サングラスをかけていないバージョンが生成される。

Geminiによる生成画像。
Geminiによる生成画像。

Gemini利用時の注意点。

Gemini アプリのプライバシー ハブ。

年齢制限について。

画像生成は、18歳未満のユーザーは利用できないとのこと。

Gemini アプリのプライバシー ハブ – Gemini Apps ヘルプ

また、Gemini自体の利用は、13歳以上が対象とのこと。(日本の場合。)

Gemini ウェブアプリにログインする – Gemini Apps ヘルプ
Google アカウントの年齢制限 – Google アカウント ヘルプ

生成画像の質問。2024年2月。

Bard(現Gemini)に聞いてみると、下記のような回答があった。

  • 円、四角形、三角形などの図形。
  • 顔、花、動物などのシンプルなイラスト。
  • 風景、建物などの簡単な絵。

簡単な画像生成だけかと思いきや、上記のようにむしろ写実的な画像や、〇〇風のタッチ、テイストの表現もできる。

Geminiの使い方。Geminiによる画像生成。

Image:Gemini by Google AI

以上、参考になれば幸いです。


Webデザインは実務数年、職業訓練校講師数年、フリーランス数年、計15年以上のキャリアがありますが、一気にがぁっと書いているので「です・ます調」ではありません。(元々はメモ書きでした。) 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ訂正いたします。 写真は主にUnsplashPixabayのフリー素材を利用させていただいております。その他の写真や動画もフリー素材やパブリックドメイン、もしくは自前のものを使用しております。

井川 宜久 / Norihisa Igawa
デザイナー、ディレクター、講師、コーチ / 井川宜久

AI 関連メモ。

ChatGPT 関連メモ。

DALL·E 関連メモ。

Sora 関連メモ。

Gemini 関連メモ。

Copilot、Bing 関連メモ。

Llama 関連メモ。

Claude 関連メモ。

Perplexity 関連メモ。


免責事項について

  • 記事ページ(Memosのページ)は当初は文字通りメモ書きでした。その後、修正や更新をしております。
  • 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ早急に対応いたします。
  • 一個人のポートフォリオサイトですので、万一損害・トラブル等が発生した場合でも、一切の責任を負いかねます。