Google AI StudioのGeminiで人物や風景、写真やイラストを。画像編集の使い方例。 / いがわ

.

Memo

ジェミニで画像生成と編集。Google AI Studioでnano-banana。

Geminiの画像生成・編集が、ハイクオリティに。

画像生成と画像編集。Google AI Studioの使い方。

無料で画像編集が可能、かつ高精度で。

Google AI Studioに、Gemini 2.5 Flash Imageとして、新しい画像生成機能が登場。

クオリティが高いので、使い方次第でかなりのポテンシャルを感じる。

nano-bananaがGeminiへ。

Google DeepMindにより、nano-banana(ナノバナナ)と呼ばれ開発されていたAIモデルが、マルチモーダルな生成AIのGeminiへ統合。

Google AI Studioのトップページから、Googleアカウントで無料でも使用が可能。

現時点ではプレビュー版。)

Google AI StudioへのGeminiのアクセス方法。

Google AI Studioへのアクセス。

「Google AI Studio」で検索するか、もしくは下記のURLから。

Google AI StudioへのGeminiの画面。

Gemini Native Imageから、Gemini 2.5 Flash Imageへ。

Google AI Studioの「Gemini Native Image」>「Gemini 2.5 Flash Image」へと進む。

nano-banana搭載Geminiの使い方、手順の画像。

すると、チャット形式の画面となる。

画面は英語表記でも、メッセージは日本語でOK。

Google AI Studioの画像生成AI Geminiの使い方の画像。

アップデートなどで画面のデザインが変わっていることがあります。)


Geminiでの画像生成のやり方。テキストから作成。

画像生成機能の使い方の例。テキストから画像を作成、編集。

チャット欄から言語でGeminiへ伝える。

今回は試しに、ざっくりとした指示で画像生成をお願い。

Google AI Studioの画像生成AI Geminiの使い方の画像。

画像生成のプロンプト例。

プロンプト。

『Velvet Undergroundのファーストアルバムのジャケットの画像を生成してほしい。』

生成された画像。
生成AI Geminiにより生成されたバナナジャケットの画像。

バナナ画像生成の背景。

ナノバナナでバナナジャケットを生成。

試してみたプロンプトは、アンディ・ウォーホルさんによるデザイン、バナナのジャケットで有名なThe Velvet Underground and Nicoのデビューアルバムの画像生成。

ジャケットが置かれている木の机のような背景も、Geminiが自動的に生成したもの。

Geminiの事前学習のデータも元になっている。

本物のジャケットには、「Peel Slowly and See(ゆっくりむいて、見てみて)」という小さな文字があるので、それをGeminiが事前学習で持っていた情報と、今回のプロンプトと混同し、誤解した模様。

「Peel Slowly and See」というテキストの生成だけでなく、実際にバナナの皮もめくってしまっている画像の生成となっている。

指示出し、プロンプトの重要性。

また、ファーストアルバムには女優のニコさんが参加していることも情報として知っていたようで、特に指示を出していないのにも関わらず、「NICO」の文字が生成された。

想定していた画像(本物のアルバムジャケット)。
アンディ・ウォーホルのデザインによるヴェルヴェット・アンダーグラウンドのジャケット。

引用元:Velvet Underground and Nico

画像編集のプロンプト例。

プロンプト。

『方向性は良いけど、ちょっと違うね。もう一度生成してみてください。』

生成された画像。
Google AI Studioの生成AI Geminiにより生成されたバナナジャケットの画像。

内容が薄い指示文(プロンプト)が影響していると思われ、ほとんど変わっていない。

画像のアスペクト比のプロンプト例。

プロンプト。

『ありがとう。この画像のアスペクト比を3:2にできるかな?』

生成された画像。

Google AI Studioの画像生成AI Geminiの使い方の画像。

画像のアスペクト比も変わらなかった。やはり指示出し(プロンプト)が大事。

Geminiへのトラフィック増加の影響の可能性もあり。)


Geminiでの画像生成のやり方。写真からから作成。

画像生成機能の使い方の例。画像から画像を作成、編集。

画像をアップし、チャット欄から言語でGeminiへ伝える。

自分で用意した素材であれば問題ないが、すぐに公開できるような人物写真が手元にないことがある。

素材サイト、たとえば「Unsplash」にある写真も、画像をAIの機械学習やトレーニングに使用する場合は、Unsplashのデータセットのルール確認が必要となっている。

Google AI Studioの無料プランでは、このルールに該当する可能性があるため、注意が必要。

「写真AC」や「ぱくたそ」なども、規約を確認する必要がある。

写真家や人物モデルの方々の仕事上、無料素材は難しい。)

Adobeに継続的に契約している場合は、FireflyやAdobe Stockを活用できる。

使用した画像。

今回は、2024年3月にBard(現Gemini)によって生成された画像を使用。

Geminiの使い方。Geminiによる生成画像。

Image:Gemini by Google AI

プロンプト。

『これは以前Geminiによって生成されたサングラスをかけた女性の画像です。
この女性のサングラスを外すことはできますか?』

加工、編集された画像。
Geminiの使い方。nano-banana(Gemini 2.5 Flash Image)による加工、編集画像。

クオリティは非常に高い。

プロンプト。

『ありがとう。いい感じです。
次にこの女性を日本人に変えることはできますか?

・髪型はドレッドではなく黒髪で、肩付近までの長さ。
・被っている帽子はとってください。』

生成された画像。
Geminiの使い方。nano-banana(Gemini 2.5 Flash Image)による加工、編集画像。

画像が編集され、日本人、アジア系の顔になる。

プロンプト。

『確かにアジア系ですね。この女性をより一般的な日本人らしくできますか?』

生成された画像。
Geminiの使い方。nano-banana(Gemini 2.5 Flash Image)による加工、編集画像。

若干、修正がされた。

プロンプト。

『ありがとう。それではこの日本人女性を、日本人男性に変えることはできまか?

・髪型は一般的な男性らしい短髪。茶髪ではなく自然な黒髪。
・白い無地のTシャツを着ています。』

生成された画像。
Geminiの使い方。nano-banana(Gemini 2.5 Flash Image)による加工、編集画像。

人物が女性から男性へ変わった。違和感もない。

プロンプト。

『被写体の編集が終わりました。次に背景を少し変えたいです。

・現在のピントは被写体の人物に合わせられています。
・現在の背景は海です。ピントを被写体に合わせたまま、ぼかされた背景に富士山を追加してください。』

生成された画像。
Geminiの使い方。nano-banana(Gemini 2.5 Flash Image)による加工、編集画像。

想像以上に大きな富士山となったので、Geminiへ修正をお願い。

プロンプト。

『ありがとう。富士山が大きくて、不自然になっています。
この富士山を小さくして、違和感のないスムーズな背景にできますか?』

生成された画像。
Geminiの使い方。nano-banana(Gemini 2.5 Flash Image)による加工、編集画像。

被写体のように、簡単には変わらなかった。

プロンプト。

『富士山の大きさが変わっていません。10分の1程度の大きさに変えてみてください。』

生成された画像。
Geminiの使い方。nano-banana(Gemini 2.5 Flash Image)による加工、編集画像。

Geminiへ再修正を依頼。

プロンプト。

『「富士山の大きさ」ではなく、「ぼかしが大きさ」が変わってしまいました。

・ぼかしはひとつ前の生成画像の値にしてください。
・富士山の大きさは、葛飾北斎さんによる「富嶽三十六景 神奈川沖浪裏」のサイズを基準にしてみてください。』

生成された画像。
Geminiの使い方。nano-banana(Gemini 2.5 Flash Image)による加工、編集画像。

富士山の画像の大きさではなく、富士山を構成するピクセルのぼかしが大きくなってしまった。

プロンプト。

『富士山の大きさが変わっていません。ちょっと難しいですね。
それではこのまま、男性を富士山の方向へ振り返る姿勢に変更できますか?』

生成された画像。
Geminiの使い方。nano-banana(Gemini 2.5 Flash Image)による加工、編集画像。

富士山の大きさは変えられず、富士山の方向ではなく、向かって右側へ振り返ってしまった。

という感じで、なかなかすんなりとはいかない。

プロンプトによる画像の加工、編集の指示出し。

対話AIのように、習うより慣れよで。

プロンプトによる画像編集などの指示文については、AIとの会話のように、使っていくうちに慣れてくると思われる。

そうなると、プロンプト・エンジニアリングやバイブコーディングのように、言語のやりとりだけで人物やイラスト、それら被写体の背景などを作っていける。

プロンプトもAIと一緒に書ける。

画像へ対してのテキスト指示を、AIに書いてもらうこともできる。

共通の目的を持ってAIとやりとりをし、AIが画像生成をしやすいプロンプトにしていける。


Google AI StudioのGeminiで無料で画像編集。

人物や風景、写真やイラストも生成、編集。

写真でもラフでも、元画像をリアル風やイラストへ編集、加工。

上記のように、Geminiは人物の髪型や、着ているファッションだけでなく、男性から女性へなど、人物そのものを変えることができる。

被写体(人物や動物、植物、モノなど)の向きや姿勢、背景を変えることもリアルに可能。

被写体にはIDが付与されるため、ポーズや髪型、ファッションなどを変更しても、一貫性が保たれる。

また、画像加工によくある、被写体の背景を削除する、電線を消すなどもできた。

現時点では、元画像によって精度に差があり。)


自然言語によるプロンプトと、画像や映像という成果物。

PhotoshopやIllustrator、Figmaなどはどうなるか?

学習データ量の問題。

ユーザー数の増加とともに生成AIの精度が上がってきたように、おそらく画像データの学習量も増えていく。

Nano BananaがMega Banana、Giga Bananaのような感じで学習データが増えていくと、修正や補完などの画像加工の性能は格段に向上すると思われる。

デザイナーにはデザインツールの方が向いているかも。

Webサイトやチラシのモデルやイラスト、シンプルなアニメキャラクターなどのイメージ画像には良さそう。

現時点でもプロンプトをうまく使用すれば、言語による画像生成や画像修正には可能性がある。

そのためには魔法の言葉などではなく、言語化のスキルが必須となる。

写真はカメラマンの方が向いているかも。

写真も同様で、最初の撮影時に知識や経験、センスやフィーリングのあるカメラマンに任せた方が良いかもしれない。

あとから修正が必要になった場合、Google AI StudioのGeminiによる画像処理能力は、そう遠くないうちに強力なツールになり得る。

Nano Bananaとプロンプトについて。

プロンプトには、画像や映像の基礎知識が必要。

After Effectsなどの動画でも、あくまでも「補助ツール」としての利用の方が現実的な気がする。

色や構図、質感や画角などの知識がなければ、そもそもの指示出しができない。

無料プランのサービスではリスクがある。

プロの知識と技術の価値。

下記のようなUnsplashにあるプロレベルのライセンスフリーの写真は、生成AIの登場前からのものということもあり、現時点ではGoogle AI Studio(無料版)での使用は厳しい。

Unsplashの許可を得なければ、無料使用の対象外となる、いわゆる「AI学習のデータセット」とされてしまうおそれがある。

日中の屋外での女性の浅い焦点の写真。

Photo by Christopher Campbell

Unsplashの場合、画像をAIの機械学習やトレーニングに使用するときは、データセットのルール確認が必要。)

生成画像の誤用には注意。

Geminiの生成画像には識別情報(SynthID / デジタルウォーターマーク)が埋め込まれるため、勝手に利用したり悪用した場合は比較的簡単に見つかる。

人間としての個性や向き不向き。

絵が苦手な作家と、言語化が苦手なデザイナー。

言語化が得意な小説家や絵本作家が自分で本の扉絵や挿絵を描かないように、デザイナーやイラストレーター、漫画家の仕事が言語だけで成立するのは難易度が高いかも。

現時点ではあくまでも「ツール」として活用した方が現実的。

黄色いシャツと黒いズボンをはいた女性の画像。

Illustration by Vadim Bogulov

WebデザインやUIデザイン。

iPadとペンでのラフデザイン。

Geminiの画像生成、画像加工や編集の機能を使用する前に、これらのような、基礎・基本が大切となる。

iPadとペンによるWebデザインのラフ画像。

Photo by Faizur Rehman

手書きとペンでのラフデザイン。

手書きの場合でも同様。絵心やテクニックがあれば、AIよりもスムーズ。

紙とペンによるUI設計のラフ画像。

Photo by Amélie Mourichon

文字情報と視覚情報の捉え方、扱い方。

文字と図形の特徴と歴史。

文字よりも図形や色の方が、ひとに伝わりやすく、印象に残りやすいという特徴もある。

文字を持たなかったアイヌのひとたちのファッション性は高く、文章を書けなくても絵を描くのが得意なひともいる。

古代遺跡には、文字だけでなく図形があったりもする。


Googleアカウント、Gemini利用時の注意点。

Geminiの利用制限や規約など。

年齢制限や利用規約、プライバシーなどについて。

Geminiアプリのプライバシーハブには、利用規約やプライバシーなどについての記載がまとめられている。

GeminiやGoogleアカウントの年齢制限。

GeminiやGoogleアカウントの利用は、13歳以上という記載がある。(日本の場合。)

Geminiの商用利用について。

商用利用は注意、確認が必要。

Google AIが著作権を持つ可能性や追加ライセンスの必要性、将来的に変更される可能性や著作権の影響などがある。

事業としての商用利用や、SNSなどのユーザーとしてのフェイクには、注意や確認が必要。

Google DeepMindによる、SynthIDというデジタルウォーターマーク(電子透かし)が埋め込まれています。)

Geminiの年齢制限について。

Geminiをリリースしている、Googleによる年齢制限。

GeminiやGoogleアカウントの利用は「13歳以上」と記載あり。

(日本の場合。)

生成画像は18歳以上。

Geminiアプリのプライバシーハブに、生成された画像は18歳未満のユーザーは利用できないという記載がある。

また、Googleは「生成AIの使用禁止に関するポリシー」も公開している。

変更があるかもしれないので、使用時にチェックした方が無難。

生成AIの年齢制限とルールについて考えるイメージ。

最新機器と子どもの教育。

スティーブ・ジョブズさんと、ビル・ゲイツさんの場合。

Appleの共同創業者のジョブズさんや、Microsoftの共同創業者のゲイツさんは、自分たちの子どもが小さかったころは、スマホやiPadなどの使用を制限していたとのこと。

関連:ChatGPTやGeminiなど生成AIの年齢制限と、AI使用のリスク。

Google AI Studioの画像生成AI、Geminiの使い方を見る猫ちゃん。

以上、参考になれば幸いです。


Webデザインは実務数年、職業訓練校講師数年、フリーランス数年、計15年以上のキャリアがありますが、一気にがぁっと書いているので「です・ます調」ではありません。(元々はメモ書きでした。) 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ訂正いたします。 写真は主にUnsplashPixabayのフリー素材を利用させていただいております。その他の写真や動画もフリー素材やパブリックドメイン、もしくは自前のものを使用しております。

井川 宜久 / Norihisa Igawa
デザイナー、ディレクター、講師、コーチ / 井川宜久

AI 関連メモ。

ChatGPT 関連メモ。

Gemini 関連メモ。

Copilot、Bing 関連メモ。

Llama 関連メモ。

Claude 関連メモ。


免責事項について

  • 記事ページ(Memosのページ)は当初は文字通りメモ書きでした。その後、修正や更新をしております。
  • 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ早急に対応いたします。
  • 一個人のポートフォリオサイトですので、万一損害・トラブル等が発生した場合でも、一切の責任を負いかねます。