Google AI StudioのGeminiで人物や風景、写真やイラストを。画像編集の使い方例。 / いがわ

.

Memo

ジェミニで画像生成と編集。

Geminiとの会話、画像の生成と編集が、ハイクオリティに。

Google AI Studioの使い方、画像生成と画像編集。

言語で画像の生成、編集が、高精度で可能に。

Google AI Studioに、Gemini 2.5 Flash Imageとして、新しい画像生成機能が登場。

とにかくクオリティが高いので、使い方次第でかなりのポテンシャルを感じる。

nano-bananaがGeminiへ。

Google DeepMindにより、nano-banana(ナノバナナ)と呼ばれ開発されていたAIモデルが、マルチモーダルな生成AIのGeminiへ統合。

Google AI Studioのトップページから、Googleアカウントで無料でも使用が可能。

現時点ではプレビュー版。)

Google AI StudioへのGeminiのアクセス方法。

Google AI Studioへアクセス。

「Google AI Studio」で検索するか、もしくは下記のURLから。

Google AI StudioへのGeminiの画面。

Gemini Native Imageから、Gemini 2.5 Flash Imageへ。

Google AI Studioの「Gemini Native Image」>「Gemini 2.5 Flash Image」へと進む。

画像生成AI Geminiの使い方、手順の画像。

すると、チャット形式の画面となる。

Google AI Studioの画像生成AI Geminiの使い方の画像。

アップデートなどで画面のデザインが変わっていることがあります。)


Google AI StudioのGeminiでの画像生成のやり方。

Google AI Studioの画像生成機能の使い方例。

チャット欄から言語でGeminiへ伝える。

今回は試しに、ざっくりとした指示で画像生成をお願い。

現時点では、英語の方が精度が高くなると思われる。)

Google AI Studioの画像生成AI Geminiの使い方の画像。

画像生成のプロンプト例。

プロンプト。

『Velvet Undergroundのファーストアルバムのジャケットの画像を生成してほしい。』

生成された画像。
画像生成AI Geminiにより生成されたバナナジャケットの画像。

バナナ画像生成の背景。

ナノバナナでバナナ画像を生成。

試してみたプロンプトは、アンディ・ウォーホルさんによるデザイン、バナナのジャケットで有名なThe Velvet Underground and Nicoのデビューアルバムの画像生成。

Geminiの事前学習のデータも元になっている。

本物のジャケットには、「Peel Slowly and See(ゆっくりむいて、見てみて)」という小さな文字があるので、それをGeminiが事前学習の情報で誤解し、テキスト生成だけでなく、バナナの皮もめくってしまっている生成画像になっている。

指示出し、プロンプトの重要性。

また、ファーストアルバムには女優のニコさんが参加していることも情報として知っていたようで、特に指示を出していないのにも関わらず、「NIKO」の文字が生成された。

想定していた画像(本物のアルバムジャケット)。
アンディ・ウォーホルのデザインによるヴェルヴェット・アンダーグラウンドのジャケット。

引用元:Velvet Underground and Nico

画像編集のプロンプト例。

プロンプト。

『方向性は良いけど、ちょっと違うね。もう一度生成してみてください。』

生成された画像。
Google AI Studioの画像生成AI Geminiにより生成されたバナナジャケットの画像。

指示出し(プロンプト)が雑なため、ほとんど変わっていない。

画像のアスペクト比のプロンプト例。

プロンプト。

『ありがとう。この画像のアスペクト比を3:2にできるかな?』

生成された画像。

Google AI Studioの画像生成AI Geminiの使い方の画像。

やはり指示出し(プロンプト)が雑なため、変わらなかった。

Geminiへのトラフィック増加の影響の可能性もあり。)


Google AI StudioのGeminiへ画像をアップし、編集も。

人物や風景、写真やイラストも生成、編集。

写真でもラフでも、元画像をリアル風やイラストへ編集、加工。

人物の髪型や、着ているファッションだけでなく、男性から女性へなど、人物そのものを変えることができる。

被写体の向きや姿勢、背景を変えることもリアルに可能。

また、被写体の背景を消す、電線を消すなどもできそう。

画像編集は、習うより慣れよ。

プロンプトによる画像編集などの指示出しについては、AIとの会話のように、使っていくうちに慣れてくると思われる。

そうなると、プロンプト・エンジニアリングやバイブコーディングのように、言語のやりとりだけで人物やイラスト、それら被写体の背景などを作っていける。


自然言語によるプロンプトと、画像や映像という成果物。

PhotoshopやIllustrator、Figmaなどはどうなるか?

デザイナーにはデザインツールの方が向いているかも。

Webサイトやチラシのモデルやイラスト、シンプルなアニメキャラクターなどのイメージ画像には、現時点でもプロンプトをうまく使用すれば、言語による画像生成や画像修正は高い可能性がある。

プロンプトには、画像や映像の基礎知識が必要。

After Effectsなどの動画であっても同様で、あくまでも「補助ツール」としての利用の方が現実的な気がする。

色や構図、質感や画角などの知識がなければ、そもそもの指示出しができない。

絵が苦手な作家と、言語化が苦手なデザイナー。

ただし言語化が得意な小説家や絵本作家が自分で本の扉絵や挿絵を描かないように、デザイナーや漫画家は言語だけでは成立しないのではないだろうか。

文字情報と視覚情報の扱い方、捉え方。

文字よりも図形や色の方が、ひとに伝わりやすく、印象に残りやすいという特徴もある。

文字を持たなかったアイヌのひとたちのファッション性は高く、文章を書けなくても絵を描くのが得意なひともいる。


Googleアカウント、Gemini利用時の注意点。

Geminiの年齢制限など。

年齢制限や利用規約、プライバシーなどについて。

Geminiアプリのプライバシーハブには、利用規約やプライバシーなどについての記載がまとめられている。

GeminiやGoogleアカウントの年齢制限。

GeminiやGoogleアカウントの利用は、13歳以上という記載がある。(日本の場合。)

Geminiの商用利用について。

商用利用は注意、確認が必要。

Google AIが著作権を持つ可能性や追加ライセンスの必要性、将来的に変更される可能性や著作権の影響などがある。

事業としての商用利用や、SNSなどのユーザーとしてのフェイクには、注意や確認が必要。

Google DeepMindによる、SynthIDというデジタルウォーターマーク(電子透かし)が埋め込まれている。

Google AI Studioの画像生成AI、Geminiの使い方を見る猫ちゃん。

以上、参考になれば幸いです。


Webデザインは実務数年、職業訓練校講師数年、フリーランス数年、計15年以上のキャリアがありますが、一気にがぁっと書いているので「です・ます調」ではありません。(元々はメモ書きでした。) 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ訂正いたします。 写真は主にUnsplashPixabayのフリー素材を利用させていただいております。その他の写真や動画もフリー素材やパブリックドメイン、もしくは自前のものを使用しております。

井川 宜久 / Norihisa Igawa
デザイナー、ディレクター、講師、コーチ / 井川宜久

AI 関連メモ。

ChatGPT 関連メモ。

Gemini 関連メモ。

Copilot、Bing 関連メモ。

Llama 関連メモ。

Claude 関連メモ。


免責事項について

  • 記事ページ(Memosのページ)は当初は文字通りメモ書きでした。その後、修正や更新をしております。
  • 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ早急に対応いたします。
  • 一個人のポートフォリオサイトですので、万一損害・トラブル等が発生した場合でも、一切の責任を負いかねます。