Geminiで画像の作成や編集。人物や写真、イラストの商用利用と注意点。 / メモ / いがわ

Geminiで画像の作成や編集。人物や写真、イラストの商用利用と注意点。

2025.08.28 2025.09.03更新。

Contents - 目次

1 Nano BananaでGeminiの画像生成・編集が高次元に。
2 Geminiでの画像生成のやり方。テキストから作成。
3 Geminiでの画像生成のやり方。写真からから作成。
4 Google AI StudioのGeminiで無料で画像編集。
5 自然言語によるプロンプトと、画像や映像という成果物。
6 Googleアカウント、Gemini利用時の注意点。
7 AI 関連メモ。

Nano BananaでGeminiの画像生成・編集が高次元に。

画像生成と画像編集。Google AI Studioの使い方。

無料で画像編集が可能、かつ高精度で。

Google AI Studioに、Gemini 2.5 Flash Imageとして、新しい画像生成機能（Nano Banana）が登場。

クオリティが高いので、使い方次第でかなりのポテンシャルを感じる。

Nano Bananaによる画像編集。

nano-bananaがGeminiへ。

Google DeepMindにより、nano-banana（ナノバナナ）と呼ばれ開発されていたAIモデルが、マルチモーダルな生成AIのGeminiへ統合。

Google AI Studioのトップページから、Googleアカウントで無料でも使用が可能。

GeminiのNano Bananaへのアクセス方法。

Google AI Studioからのアクセス。

「Google AI Studio」で検索するか、もしくは下記のURLから。

URL：Google AI Studio

※2025年9月2日追記）
通常のGeminiからも、Nano Bananaの機能が使用できるようになっています。

モデル選択で「2.5 Flash」を選べばOKです。

Google Geminiへのアクセス。

「Gemini」で検索するか、もしくは下記のURLから。

URL：Google Gemini

Google AI StudioのGeminiの画面。

Gemini Native Imageから、Gemini 2.5 Flash Image（Try Nano Banana）へ。

Google AI Studioの「Gemini Native Image」>「Gemini 2.5 Flash Image（Nano Banana）」へと進む。

（※モデル表記がGemini 2.5 Flash Imageではなく、Nano Bananaの場合あり。）

nano-banana搭載Geminiの使い方、手順の画像。

すると、チャット形式の画面となる。

画面は英語表記でも、メッセージは日本語で通じる。

GeminiのNano Bananaの画面。

（※アップデートなどで画面のデザインが変わっていることがあります。）

Geminiでの画像生成のやり方。テキストから作成。

画像生成機能の使い方の例。テキストから画像を作成、編集。

チャット欄から言語でGeminiへ伝える。

今回は試しに、ざっくりとした指示で画像生成をお願い。

Google AI Studioの画像生成AI Geminiの使い方の画像。

画像生成のプロンプト例。

プロンプト。

『Velvet Undergroundのファーストアルバムのジャケットの画像を生成してほしい。』

生成された画像。

バナナ画像生成の背景。

ナノバナナでバナナジャケットを生成。

試してみたプロンプトは、アンディ・ウォーホルさんによるデザイン、バナナのジャケットで有名なThe Velvet Underground and Nicoのデビューアルバムの画像生成。

ジャケットが置かれている木の机のような背景も、Geminiが自動的に生成したもの。

アート性が強く、情報も多い、Velvet Underground。

Geminiの学習済みデータも元になっているかも。

本物のジャケットには、「PEEL SLOWLY AND SEE（ゆっくりむいて、見てみて）」という小さな文字がある。

その情報をGeminiが事前学習かプレビュー版ですでに持っていた可能性が高く、今回のプロンプトと混同し、誤解した模様。

結果的に「PEEL SLOWLY AND SEE」というテキストの生成だけでなく、実際にバナナの皮もめくってしまっている画像の生成となっている。

指示出し、プロンプトの重要性。

また、ファーストアルバムには女優のニコさんが参加していることも情報として知っていたようで、特に指示を出していないのにも関わらず、「NICO」の文字が生成された。

イメージしていた画像（本物のアルバムジャケット）。

シルクスクリーンを活用した、アンディ・ウォーホルさんによるデザイン。

ウォーホルさんデザインのジャケットには、バンド名の「THE VELVET UNDERGROUND」やゲスト的に3曲のボーカルを担当した「NICO」の文字はない。

あるのはジャケットのデザインとプロデュースを担当した「Andy Warhol」という大きめの文字と、「PEEL SLOWLY AND SEE」という小さな文字。

アンディ・ウォーホルのデザインによるヴェルヴェット・アンダーグラウンドのジャケット。

引用元：The Velvet Underground & Nico – Wikipedia

画像編集のプロンプト例。

プロンプト。

『方向性は良いけど、ちょっと違うね。もう一度生成してみてください。』

生成された画像。

Google AI Studioの生成AI Geminiにより生成されたバナナジャケットの画像。

内容が薄い指示文（プロンプト）が影響していると思われ、ほとんど変わっていない。

画像のアスペクト比のプロンプト例。

プロンプト。

『ありがとう。この画像のアスペクト比を3:2にできるかな？』

生成された画像。

Google AI Studioの画像生成AI Geminiの使い方の画像。

画像のアスペクト比も変わらなかった。やはり指示出し（プロンプト）が大事。

（※リリース直後のトラフィック増加の影響の可能性もあり。）

Geminiでの画像生成のやり方。写真からから作成。

画像生成機能の使い方の例。画像から画像を作成、編集。

画像をアップし、チャット欄から言語でGeminiへ伝える。

文章からの生成（Text to Image）ではなく、元画像の加工・修正、再生成（Image to Image）へも対応している。

フリー素材やプライベート写真は注意。

自分で用意した素材であれば問題ないが、すぐに公開できるような写真が手元にないことがある。

素材サイト、たとえば「Unsplash」にある写真も、画像をAIの機械学習やトレーニングに使用する場合は、Unsplashのデータセットのルール確認が必要となっている。

Google AI Studioの無料プランでは、このルールに該当する可能性があるため、注意が必要。

「写真AC」や「ぱくたそ」なども、規約を確認する必要がある。

（※写真家や人物モデルの方々の仕事上、無料素材は難しい。）

Adobeと継続的に契約しているような場合は、FireflyやAdobe Stockを活用できる。

使用した画像。

今回は、2024年3月にBard（現Gemini）によって生成された画像を使用。

関連：Gemini（旧Bard）が絵を描けるように。テキストから画像生成の方法。

Image：Gemini by Google AI

プロンプト。

『これは以前Geminiによって生成されたサングラスをかけた女性の画像です。
この女性のサングラスを外すことはできますか？』

加工、編集された画像。

Geminiの使い方。nano-banana（Gemini 2.5 Flash Image）による加工、編集画像。

クオリティは非常に高い。

プロンプト。

『ありがとう。いい感じです。
次にこの女性を日本人に変えることはできますか？

・髪型はドレッドではなく黒髪で、肩付近までの長さ。
・被っている帽子はとってください。』

生成された画像。

画像が編集され、日本人、アジア系の顔になる。

プロンプト。

『確かにアジア系ですね。この女性をより一般的な日本人らしくできますか？』

生成された画像。

若干、修正がされた。

プロンプト。

『ありがとう。それではこの日本人女性を、日本人男性に変えることはできまか？

・髪型は一般的な男性らしい短髪。茶髪ではなく自然な黒髪。
・白い無地のTシャツを着ています。』

生成された画像。

人物が女性から男性へ変わった。違和感もない。

プロンプト。

『被写体の編集が終わりました。次に背景を少し変えたいです。

・現在のピントは被写体の人物に合わせられています。
・現在の背景は海です。ピントを被写体に合わせたまま、ぼかされた背景に富士山を追加してください。』

生成された画像。

想像以上に大きな富士山となったので、Geminiへ修正をお願い。

プロンプト。

『ありがとう。富士山が大きくて、不自然になっています。
この富士山を小さくして、違和感のないスムーズな背景にできますか？』

生成された画像。

被写体のように、簡単には変わらなかった。

プロンプト。

『富士山の大きさが変わっていません。10分の1程度の大きさに変えてみてください。』

生成された画像。

Geminiへ再修正を依頼。

プロンプト。

『「富士山の大きさ」ではなく、「ぼかしが大きさ」が変わってしまいました。

・ぼかしはひとつ前の生成画像の値にしてください。
・富士山の大きさは、葛飾北斎さんによる「富嶽三十六景神奈川沖浪裏」のサイズを基準にしてみてください。』

生成された画像。

富士山の画像の大きさではなく、富士山を構成するピクセルのぼかしが大きくなってしまった。

プロンプト。

『富士山の大きさが変わっていません。ちょっと難しいですね。
それではこのまま、男性を富士山の方向へ振り返る姿勢に変更できますか？』

生成された画像。

富士山の大きさは変えられず、富士山の方向ではなく、向かって右側へ振り返ってしまった。

という感じで、質は高くも、なかなかすんなりとはいかない。

プロンプトによる画像の加工、編集の指示出し。

対話AIのように、習うより慣れよで。

プロンプトによる画像編集などの指示文については、AIとの会話のように、使っていくうちに慣れてくると思われる。

そうなると、プロンプト・エンジニアリングやバイブコーディングのように、言語のやりとりだけで人物やイラスト、それら被写体の背景などを作っていける。

プロンプトもAIと一緒に書ける。

画像へ対してのテキスト指示を、AIに書いてもらうこともできる。

共通の目的を持ってAIとやりとりをし、AIが画像生成をしやすいプロンプトにしていける。

Google AI StudioのGeminiで無料で画像編集。

人物や風景、写真やイラストも生成、編集。

写真でもラフでも、元画像をリアル風やイラストへ編集、加工。

上記のように、Geminiは人物の髪型や、着ているファッションだけでなく、男性から女性へなど、人物そのものを変えることができる。

被写体（人物や動物、植物、モノなど）の向きや姿勢、背景を変えることもリアルに可能。

被写体にはIDが付与されるため、ポーズや髪型、ファッションなどを変更しても、一貫性が保たれる。

また、画像加工によくある、被写体の背景を削除する、電線を消すなどもできた。

（※現時点では、元画像によって精度に差があり。）

自然言語によるプロンプトと、画像や映像という成果物。

PhotoshopやIllustrator、Figmaなどはどうなるか？

学習データ量の問題。

ユーザー数の増加とともに生成AIの精度が上がってきたように、おそらく画像データの学習量も増えていく。

Nano BananaがMega Banana、Giga Bananaのような感じで学習データが増えていくと、修正や補完などの画像加工の性能は格段に向上すると思われる。

デザイナーにはデザインツールの方が向いているかも。

Webサイトやチラシのモデルやイラスト、シンプルなアニメキャラクターなどのイメージ画像には良さそう。

現時点でもプロンプトをうまく活用すれば、言語による画像生成や画像修正には可能性がある。

そのためには魔法の言葉などではなく、言語化のスキルが必須となる。

写真はカメラマンの方が向いているかも。

写真も同様で、最初の撮影時に知識や経験、センスやフィーリングのあるカメラマンに任せた方が良いかもしれない。

あとから修正が必要になった場合には、Google AI StudioのGeminiによる画像処理能力は、そう遠くないうちに強力なツールになり得る。

Nano Bananaとプロンプトについて。

プロンプトには、画像や映像の基礎知識が必要。

After Effectsなどの動画でも、あくまでも「補助ツール」としての利用の方が現実的な気がする。

色や構図、質感や画角などの知識がなければ、そもそもの指示出しができない。

無料プランのサービスではリスクがある。

プロの知識と技術の価値。

下記のようなUnsplashにあるプロレベルのライセンスフリーの写真は、生成AIの登場前からのものということもあり、現時点ではGoogle AI Studio（無料版）での使用は厳しい。

Unsplashの許可を得なければ、無料使用の対象外となる、いわゆる「AI学習のデータセット」とされてしまうおそれがある。

日中の屋外での女性の浅い焦点の写真。

Photo by Christopher Campbell

（※Unsplashの場合、画像をAIの機械学習やトレーニングに使用するときは、データセットのルール確認が必要。）

URL：Unsplash
参照元：利用規約 | Unsplash
参照元：Unsplash Dataset | The world’s largest open library dataset

生成画像の誤用には注意。

Geminiの生成画像には識別情報（SynthID / デジタルウォーターマーク）が埋め込まれるため、勝手に利用したり悪用した場合は比較的簡単に見つかる。

人間としての個性や向き不向き。

絵が苦手な作家と、言語化が苦手なデザイナー。

言語化が得意な小説家や絵本作家が自分で本の扉絵や挿絵を描かないように、デザイナーやイラストレーター、漫画家の仕事が言語だけで成立するのは難易度が高いかも。

現時点ではあくまでも「作業を補助するツール」として活用した方が現実的。

黄色いシャツと黒いズボンをはいた女性の画像。

Illustration by Vadim Bogulov

WebデザインやUIデザイン。

iPadとペンでのラフデザイン。

Geminiの画像生成、画像加工や編集の機能を使用する前に、これらのような、基礎・基本が大切となる。

iPadとペンによるWebデザインのラフ画像。

Photo by Faizur Rehman

手書きとペンでのラフデザイン。

手書きの場合でも同様。絵心やテクニックがあれば、AIよりもスムーズ。

紙とペンによるUI設計のラフ画像。

Photo by Amélie Mourichon

文字情報と視覚情報の捉え方、扱い方。

文字と図形の特徴と歴史。

文字よりも図形や色の方が、ひとに伝わりやすく、印象に残りやすいという特徴もある。

文字を持たなかったアイヌのひとたちのファッション性は高く、文章を書けなくても絵を描くのが得意なひともいる。

古代遺跡には、文字だけでなく図形があったりもする。

Googleアカウント、Gemini利用時の注意点。

Geminiの利用制限や規約など。

年齢制限や利用規約、プライバシーなどについて。

Geminiアプリのプライバシーハブには、利用規約やプライバシーなどについての記載がまとめられている。

Gemini アプリのプライバシーハブ – Gemini Apps ヘルプ

GeminiやGoogleアカウントの年齢制限。

GeminiやGoogleアカウントの利用は、13歳以上という記載がある。

（※日本の場合。）

Geminiの商用利用について。

商用利用は注意、確認が必要。

Google AIが著作権を持つ可能性や追加ライセンスの必要性、将来的に変更される可能性や著作権の影響などがある。

事業としての商用利用や、SNSなどのユーザーとしてのフェイクには、注意や確認が必要。

（※Google DeepMindによる、SynthIDというデジタルウォーターマーク（電子透かし）が埋め込まれています。）

Geminiの年齢制限について。

Geminiをリリースしている、Googleによる年齢制限。

GeminiやGoogleアカウントの利用は「13歳以上」と記載あり。

（※日本の場合。）

生成画像は18歳以上。

Geminiアプリのプライバシーハブに、生成された画像は18歳未満のユーザーは利用できないという記載がある。

また、Googleは「生成AIの使用禁止に関するポリシー」も公開している。

変更があるかもしれないので、使用時にチェックした方が無難。