Bard(Gemini)が絵を描けるように。テキストから画像生成の方法。デザイナー、コーチ、ディレクター / いがわ

.

Memo

Geminiの画像生成。使い方や意味について。

Geminiの使い方。画像生成の例。

Geminiの画像生成。

テキストから画像生成。

Googleの生成AI、「Bard」が画像生成をスタート。

ChatGPTやCopilotのように、テキストによる指示で画像が生成ができる。

2024年2月8日に、BardからGemini(ジェミニ)に名称が変更。)

使い方の注意点。

生成AIは仕様が頻繁に変わっており、特定のスタイルや、絵自体を描いてもらうことができないことがあります。

  • 2024年2月8日時点では、画像生成は英語でのテキストのみ。
  • 2024年4月7日時点では、人物の画像生成は一時的にできなくなっているが、復活する予定があるとのこと。
画像生成の料金。

Geminiの画像生成は「Imagen 2」を使用しており、無料でも画像生成が可能。

画像生成の回数制限。

回数制限については、Geminiに聞いてみたところ、現在は無制限とのこと。

開発中のため、制限が今後変更される可能性があるとのこと。)

ChatGPTだけじゃない!Bard(Gemini)へ画像生成の回数制限を確認している画像。
ChatGPTだけじゃない!Bard(Gemini)へ画像生成の回数制限を確認している画像。
指示や情報の例。

具体的な指示があれば、できる限りそれに沿って絵を描けるそう。

例えば以下の情報があると、絵を生成しやすいとのこと。

  • どんな絵を描いてほしいか。(例:赤い丸を描いてください。)
  • 絵のサイズ。(例:サイズは100px x 100pxにしてください。)
  • 絵のスタイル。(例:シンプル、リアル、アニメ風など。)

サイズを指定しない場合は、1536px × 1536pxの正方形で生成される。

テキストの例。

絵画の構図、色、線画、質感などの詳細を指定。

  • 「富士山を夕焼けの背景で描いてください。」
  • 「猫と犬を水彩画で描いてください。」
  • 「〇〇風の抽象画を赤と青で描いてください。」
    実在の人物や有名なキャラクターなどを使用して公開すると、著作権侵害などの可能性があるので注意です。)


Geminiによるテキストから画像生成。

2024年2月8日にBardからGeminiに名称が変わりましたが、画像生成の方法は同じです。

テキストから画像生成の例。

Create a picture of puppies in a basket.

Googleの例の中の「Create a picture of puppies in a basket.」というテキストを送ってみると、次のような画像が生成された。

一回の生成は2枚だが、「さらに作成」をクリックすると、もう2枚生成される。

Bard(Gemini)による生成画像。
Bard(Gemini)による生成画像。

写真のようになっているのは、「picture」が「絵」よりも「写真」を優先させていのかもしれない。

テキストから画像生成の例 その2。

Create a picture of a cat with adorable eyes.

ちょっと思ってたのと違うという場合、指示を追加していくことができる。

Geminiによる生成画像。
Geminiによる生成画像。

「マンガ風に」や、「別のパターンも」という感じでお願いできる。

Geminiによる生成画像。
Geminiによる生成画像。

「ルネサンス風」と、「印象派風」でお願いした場合。

Geminiによる生成画像。

浮世絵にはまだ対応していない様子。

ただ、生成AIは日々進化しており、近い将来、より高度な画像生成が可能になると思われる。

Geminiによる生成画像。

テキストから画像生成の例 その3。

Draw a picture of a human wearing sunglasses relaxing on the beach with the sea at sunset.

「夕暮れ時の海辺でサングラスをかけた人がリラックスしている」でお願いした場合。

「サングラスを外して」と追加すると、サングラスをかけていないバージョンが生成される。

Geminiによる生成画像。
Geminiによる生成画像。
年齢制限について。

画像生成は、18歳未満のユーザーは利用できないとのこと。(2024年2月8日時点。)

Gemini アプリのプライバシー ハブ – Gemini Apps ヘルプ

また、Gemini自体の利用は、13歳以上が対象とのこと。(日本の場合。)

Gemini ウェブアプリにログインする – Gemini Apps ヘルプ
Google アカウントの年齢制限 – Google アカウント ヘルプ

生成画像の例。

Bardに聞いてみると、下記のような回答があった。

  • 円、四角形、三角形などの図形。
  • 顔、花、動物などのシンプルなイラスト。
  • 風景、建物などの簡単な絵。

簡単な画像生成だけかと思いきや、上記のようにむしろ写実的な画像や、〇〇風のタッチ、テイストの表現もできる。

Geminiの使い方。Geminiによる画像生成。

Image:Gemini by Google AI

以上、参考になれば幸いです。


Webデザインは実務数年、職業訓練校講師数年、フリーランス数年、計15年以上のキャリアがありますが、一気にがぁっと書いているので「です・ます調」ではありません。(元々はメモ書きでした。) 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ訂正いたします。 写真は主にUnsplashPixabayのフリー素材を利用させていただいております。その他の写真や動画もフリー素材やパブリックドメイン、もしくは自前のものを使用しております。

デザイナー、ディレクター、講師、コーチ / 井川宜久

AI 関連メモ。

ChatGPT 関連メモ。
OpenAIのロゴ。
Bard 関連メモ。
Googleのロゴ。
Sora 関連メモ。
DALL·E 関連メモ。
Llama 関連メモ。

免責事項について

  • 記事ページ(Memosのページ)は当初は文字通りメモ書きでした。その後、修正や更新をしております。
  • 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ早急に対応いたします。
  • 一個人のポートフォリオサイトですので、万一損害・トラブル等が発生した場合でも、一切の責任を負いかねます。