
Contents - 目次
Geminiの画像生成・編集が、ハイクオリティに。
画像生成と画像編集。Google AI Studioの使い方。
無料で画像編集が可能、かつ高精度で。
Google AI Studioに、Gemini 2.5 Flash Imageとして、新しい画像生成機能が登場。
クオリティが高いので、使い方次第でかなりのポテンシャルを感じる。
nano-bananaがGeminiへ。
Google DeepMindにより、nano-banana(ナノバナナ)と呼ばれ開発されていたAIモデルが、マルチモーダルな生成AIのGeminiへ統合。
Google AI Studioのトップページから、Googleアカウントで無料でも使用が可能。
(※現時点ではプレビュー版。)
Google AI StudioへのGeminiのアクセス方法。
Google AI Studioへのアクセス。
「Google AI Studio」で検索するか、もしくは下記のURLから。
- URL:Google AI Studio
Google AI StudioへのGeminiの画面。
Gemini Native Imageから、Gemini 2.5 Flash Imageへ。
Google AI Studioの「Gemini Native Image」>「Gemini 2.5 Flash Image」へと進む。
すると、チャット形式の画面となる。
画面は英語表記でも、メッセージは日本語でOK。
(※アップデートなどで画面のデザインが変わっていることがあります。)
Geminiでの画像生成のやり方。テキストから作成。
画像生成機能の使い方の例。テキストから画像を作成、編集。
チャット欄から言語でGeminiへ伝える。
今回は試しに、ざっくりとした指示で画像生成をお願い。
画像生成のプロンプト例。
プロンプト。
『Velvet Undergroundのファーストアルバムのジャケットの画像を生成してほしい。』
生成された画像。

バナナ画像生成の背景。
ナノバナナでバナナジャケットを生成。
試してみたプロンプトは、アンディ・ウォーホルさんによるデザイン、バナナのジャケットで有名なThe Velvet Underground and Nicoのデビューアルバムの画像生成。
ジャケットが置かれている木の机のような背景も、Geminiが自動的に生成したもの。
Geminiの事前学習のデータも元になっている。
本物のジャケットには、「Peel Slowly and See(ゆっくりむいて、見てみて)」という小さな文字があるので、それをGeminiが事前学習で持っていた情報と、今回のプロンプトと混同し、誤解した模様。
「Peel Slowly and See」というテキストの生成だけでなく、実際にバナナの皮もめくってしまっている画像の生成となっている。
指示出し、プロンプトの重要性。
また、ファーストアルバムには女優のニコさんが参加していることも情報として知っていたようで、特に指示を出していないのにも関わらず、「NICO」の文字が生成された。
想定していた画像(本物のアルバムジャケット)。

引用元:Velvet Underground and Nico
画像編集のプロンプト例。
プロンプト。
『方向性は良いけど、ちょっと違うね。もう一度生成してみてください。』
生成された画像。

内容が薄い指示文(プロンプト)が影響していると思われ、ほとんど変わっていない。
画像のアスペクト比のプロンプト例。
プロンプト。
『ありがとう。この画像のアスペクト比を3:2にできるかな?』
生成された画像。
画像のアスペクト比も変わらなかった。やはり指示出し(プロンプト)が大事。
(※Geminiへのトラフィック増加の影響の可能性もあり。)
Geminiでの画像生成のやり方。写真からから作成。
画像生成機能の使い方の例。画像から画像を作成、編集。
画像をアップし、チャット欄から言語でGeminiへ伝える。
自分で用意した素材であれば問題ないが、すぐに公開できるような人物写真が手元にないことがある。
素材サイト、たとえば「Unsplash」にある写真も、画像をAIの機械学習やトレーニングに使用する場合は、Unsplashのデータセットのルール確認が必要となっている。
Google AI Studioの無料プランでは、このルールに該当する可能性があるため、注意が必要。
「写真AC」や「ぱくたそ」なども、規約を確認する必要がある。
(※写真家や人物モデルの方々の仕事上、無料素材は難しい。)
Adobeに継続的に契約している場合は、FireflyやAdobe Stockを活用できる。
使用した画像。
今回は、2024年3月にBard(現Gemini)によって生成された画像を使用。

Image:Gemini by Google AI
プロンプト。
『これは以前Geminiによって生成されたサングラスをかけた女性の画像です。
この女性のサングラスを外すことはできますか?』
加工、編集された画像。

クオリティは非常に高い。
プロンプト。
『ありがとう。いい感じです。
次にこの女性を日本人に変えることはできますか?
・髪型はドレッドではなく黒髪で、肩付近までの長さ。
・被っている帽子はとってください。』
生成された画像。

画像が編集され、日本人、アジア系の顔になる。
プロンプト。
『確かにアジア系ですね。この女性をより一般的な日本人らしくできますか?』
生成された画像。

若干、修正がされた。
プロンプト。
『ありがとう。それではこの日本人女性を、日本人男性に変えることはできまか?
・髪型は一般的な男性らしい短髪。茶髪ではなく自然な黒髪。
・白い無地のTシャツを着ています。』
生成された画像。

人物が女性から男性へ変わった。違和感もない。
プロンプト。
『被写体の編集が終わりました。次に背景を少し変えたいです。
・現在のピントは被写体の人物に合わせられています。
・現在の背景は海です。ピントを被写体に合わせたまま、ぼかされた背景に富士山を追加してください。』
生成された画像。

想像以上に大きな富士山となったので、Geminiへ修正をお願い。
プロンプト。
『ありがとう。富士山が大きくて、不自然になっています。
この富士山を小さくして、違和感のないスムーズな背景にできますか?』
生成された画像。

被写体のように、簡単には変わらなかった。
プロンプト。
『富士山の大きさが変わっていません。10分の1程度の大きさに変えてみてください。』
生成された画像。

Geminiへ再修正を依頼。
プロンプト。
『「富士山の大きさ」ではなく、「ぼかしが大きさ」が変わってしまいました。
・ぼかしはひとつ前の生成画像の値にしてください。
・富士山の大きさは、葛飾北斎さんによる「富嶽三十六景 神奈川沖浪裏」のサイズを基準にしてみてください。』
生成された画像。

富士山の画像の大きさではなく、富士山を構成するピクセルのぼかしが大きくなってしまった。
プロンプト。
『富士山の大きさが変わっていません。ちょっと難しいですね。
それではこのまま、男性を富士山の方向へ振り返る姿勢に変更できますか?』
生成された画像。

富士山の大きさは変えられず、富士山の方向ではなく、向かって右側へ振り返ってしまった。
という感じで、なかなかすんなりとはいかない。
プロンプトによる画像の加工、編集の指示出し。
対話AIのように、習うより慣れよで。
プロンプトによる画像編集などの指示文については、AIとの会話のように、使っていくうちに慣れてくると思われる。
そうなると、プロンプト・エンジニアリングやバイブコーディングのように、言語のやりとりだけで人物やイラスト、それら被写体の背景などを作っていける。
プロンプトもAIと一緒に書ける。
画像へ対してのテキスト指示を、AIに書いてもらうこともできる。
共通の目的を持ってAIとやりとりをし、AIが画像生成をしやすいプロンプトにしていける。
Google AI StudioのGeminiで無料で画像編集。
人物や風景、写真やイラストも生成、編集。
写真でもラフでも、元画像をリアル風やイラストへ編集、加工。
上記のように、Geminiは人物の髪型や、着ているファッションだけでなく、男性から女性へなど、人物そのものを変えることができる。
被写体(人物や動物、植物、モノなど)の向きや姿勢、背景を変えることもリアルに可能。
被写体にはIDが付与されるため、ポーズや髪型、ファッションなどを変更しても、一貫性が保たれる。
また、画像加工によくある、被写体の背景を削除する、電線を消すなどもできた。
(※現時点では、元画像によって精度に差があり。)
自然言語によるプロンプトと、画像や映像という成果物。
PhotoshopやIllustrator、Figmaなどはどうなるか?
学習データ量の問題。
ユーザー数の増加とともに生成AIの精度が上がってきたように、おそらく画像データの学習量も増えていく。
Nano BananaがMega Banana、Giga Bananaのような感じで学習データが増えていくと、修正や補完などの画像加工の性能は格段に向上すると思われる。
デザイナーにはデザインツールの方が向いているかも。
Webサイトやチラシのモデルやイラスト、シンプルなアニメキャラクターなどのイメージ画像には良さそう。
現時点でもプロンプトをうまく使用すれば、言語による画像生成や画像修正には可能性がある。
そのためには魔法の言葉などではなく、言語化のスキルが必須となる。
写真はカメラマンの方が向いているかも。
写真も同様で、最初の撮影時に知識や経験、センスやフィーリングのあるカメラマンに任せた方が良いかもしれない。
あとから修正が必要になった場合、Google AI StudioのGeminiによる画像処理能力は、そう遠くないうちに強力なツールになり得る。
プロンプトには、画像や映像の基礎知識が必要。
After Effectsなどの動画でも、あくまでも「補助ツール」としての利用の方が現実的な気がする。
色や構図、質感や画角などの知識がなければ、そもそもの指示出しができない。
無料プランのサービスではリスクがある。
プロの知識と技術の価値。
下記のようなUnsplashにあるプロレベルのライセンスフリーの写真は、生成AIの登場前からのものということもあり、現時点ではGoogle AI Studio(無料版)での使用は厳しい。
Unsplashの許可を得なければ、無料使用の対象外となる、いわゆる「AI学習のデータセット」とされてしまうおそれがある。
Photo by Christopher Campbell
(※Unsplashの場合、画像をAIの機械学習やトレーニングに使用するときは、データセットのルール確認が必要。)
生成画像の誤用には注意。
Geminiの生成画像には識別情報(SynthID / デジタルウォーターマーク)が埋め込まれるため、勝手に利用したり悪用した場合は比較的簡単に見つかる。
人間としての個性や向き不向き。
絵が苦手な作家と、言語化が苦手なデザイナー。
言語化が得意な小説家や絵本作家が自分で本の扉絵や挿絵を描かないように、デザイナーやイラストレーター、漫画家の仕事が言語だけで成立するのは難易度が高いかも。
現時点ではあくまでも「ツール」として活用した方が現実的。
Illustration by Vadim Bogulov
WebデザインやUIデザイン。
iPadとペンでのラフデザイン。
Geminiの画像生成、画像加工や編集の機能を使用する前に、これらのような、基礎・基本が大切となる。
Photo by Faizur Rehman
手書きとペンでのラフデザイン。
手書きの場合でも同様。絵心やテクニックがあれば、AIよりもスムーズ。
Photo by Amélie Mourichon
文字情報と視覚情報の捉え方、扱い方。
文字と図形の特徴と歴史。
文字よりも図形や色の方が、ひとに伝わりやすく、印象に残りやすいという特徴もある。
文字を持たなかったアイヌのひとたちのファッション性は高く、文章を書けなくても絵を描くのが得意なひともいる。
古代遺跡には、文字だけでなく図形があったりもする。
Googleアカウント、Gemini利用時の注意点。
Geminiの利用制限や規約など。
年齢制限や利用規約、プライバシーなどについて。
Geminiアプリのプライバシーハブには、利用規約やプライバシーなどについての記載がまとめられている。
GeminiやGoogleアカウントの年齢制限。
GeminiやGoogleアカウントの利用は、13歳以上という記載がある。(日本の場合。)
Geminiの商用利用について。
商用利用は注意、確認が必要。
Google AIが著作権を持つ可能性や追加ライセンスの必要性、将来的に変更される可能性や著作権の影響などがある。
事業としての商用利用や、SNSなどのユーザーとしてのフェイクには、注意や確認が必要。
(※Google DeepMindによる、SynthIDというデジタルウォーターマーク(電子透かし)が埋め込まれています。)
Geminiの年齢制限について。
Geminiをリリースしている、Googleによる年齢制限。
GeminiやGoogleアカウントの利用は「13歳以上」と記載あり。
(日本の場合。)
生成画像は18歳以上。
Geminiアプリのプライバシーハブに、生成された画像は18歳未満のユーザーは利用できないという記載がある。
また、Googleは「生成AIの使用禁止に関するポリシー」も公開している。
変更があるかもしれないので、使用時にチェックした方が無難。
最新機器と子どもの教育。
スティーブ・ジョブズさんと、ビル・ゲイツさんの場合。
Appleの共同創業者のジョブズさんや、Microsoftの共同創業者のゲイツさんは、自分たちの子どもが小さかったころは、スマホやiPadなどの使用を制限していたとのこと。
- 参照元:ジョブズとゲイツが我が子のテクノロジー使用を厳しく制限した理由
- 参照元:Billionaire tech mogul Bill Gates reveals he banned his children from mobile phones until they turned 14 – Mirror Online
- 参照元:Apple Founder Steve Jobs Limited His Kids’ Use Of Technology At Home – CBS San Francisco
関連:ChatGPTやGeminiなど生成AIの年齢制限と、AI使用のリスク。
以上、参考になれば幸いです。
※Webデザインは実務数年、職業訓練校講師数年、フリーランス数年、計15年以上のキャリアがありますが、一気にがぁっと書いているので「です・ます調」ではありません。(元々はメモ書きでした。) ※事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ訂正いたします。 ※写真は主にUnsplashやPixabayのフリー素材を利用させていただいております。その他の写真や動画もフリー素材やパブリックドメイン、もしくは自前のものを使用しております。
AI 関連メモ。
ChatGPT 関連メモ。
- ChatGPT最新「GPT-5」の性能。有料ユーザーから無料ユーザーへ。
- ChatGPTだけで被写体背景の切り抜き、背景色を変更する方法。
- ChatGPT 4o Image Generationの使い方の例。画像生成ができないとき。
- ChatGPTの最新推論モデル「o3-mini」の使い方とヒント。
- ChatGPTの次世代モデル、GPT-4.5とGPT-5のリリース時期と可能性。
- ChatGPTの最新推論モデル「o3-mini」の使い方とヒント。
- ChatGPT searchとは?使い方や、有料と無料、Googleとの違い。
- Chrome拡張機能、ChatGPT searchの使い方。自然言語、日常会話で検索。
- ChatGPTに検索機能。ChatGPT searchでWeb検索が可能に。
- MacとWindowsでもChatGPTと音声会話。Advanced Voiceが利用可能に。
- Advanced Voiceによる音声会話。ChatGPTとプラトニックな関係に?
- OpenAI o1の使い方。考えてから答える新しいChatGPTモデル。
- Voice Engineという名の、音声合成技術。日本語の精度は?
- SearchGPT。ChatGPTがAI検索エンジンに。使い方の例と順番待ちへの登録方法。
- GPT-4o miniが登場。ChatGPT無料版はGPT-3.5からバージョンアップ。
- ChatGPT無料ユーザーにもメモリ機能が。記憶や使い方の例。
- iPhoneやiPad、MacでChatGPT(GPT-4o)が。Apple Intelligence。
- 生成AIとWebデザイン、ChatGPTを活用したコーディングに必要なもの。
- ChatGPT最新モデル GPT-4oが無料でも。使える主な機能。
- ChatGPT(GPT-4o)で、PDF要約の精度を検証した結果。
- GPT-4o。ChatGPTと画像見ながら音声で会話?有料でも無料でも。
- ChatGPT無料版でも画像生成が可能に。有料版だけじゃない!?
- ChatGPT(チャットGPT)にアーカイブ機能が。復元も削除も。
- ChatGPT(チャットGPT)を日本語化。日本語設定の方法。
- ChatGPT(チャットGPT)との音声会話と、音声の変更方法。
- ChatGPTアプリのインストールとログイン方法、チャットの使い方。
- ChatGPT(チャットGPT)のスペルチェック、文章校正がむっちゃ楽。
- ChatGPT(チャットGPT)へのログイン方法。ログインできないとき。
- ChatGPTにプラグイン。広がる機能と使い方。最新情報へも。
- ChatGPTがLINEに?「AIチャットくん」の始め方、そして使い方。
- ChatGPTの始め方と使い方と。初心者向けシンプル版。
- ChatGPTはSVGアイコンを作れるのか?
- ChatGPTの文章作成やコーディング、SEO対策は変わるか?
Gemini 関連メモ。
- Google AI StudioのGeminiで人物や風景、写真やイラストを。画像編集の使い方例。
- Gemini 2.5 Proがアップグレード。Google AI Studio無料プランの使い方。
- Deep Researchというリサーチツール?無料で使えるGoogle Gemini。
- GeminiアプリがiOSにも。Googleアプリからはアクセス不可に。
- ChatGPTやGeminiなど生成AIの年齢制限と、AI使用のリスク。
- NotebookLMは使えない?YouTube動画とPDFの使い方と検証結果。
- Google AI Studioの「Gemini 1.5 Pro 002とGemini Experimental 1114」にできること。
- ChromeがGoogle レンズで検索、アドレスバーからGeminiの利用が可能に。
- Gemini 1.5 Pro 2Mモデル。Waitlistの登録手順。日本語上手なGoogle生成AI。
- BardからGeminiに。使い方はどう変わる?日本語対応は?
- Bard(Gemini)が絵を描けるように。テキストから画像生成の方法。
- Bard(Gemini)の画像認識の使い方。日本語対応済み、Googleレンズで画像読み取り。
- 最新情報を日本語かつ無料で使いたいときは、GoogleのBard?
- ChatGPTとBardの違い。なぜAIは日本語チャットが苦手なの?
- Bard(Gemini)が日本語対応。ログイン方法や最新情報など、使い方の例。
- BardでGemini。Googleの最新AIを無料で使う方法。
- GoogleのBardは、OpenAIのChatGPTを越えられるだろうか?
Copilot、Bing 関連メモ。
- ChatGPTとCopilotの違い。料金や、できることと、できないこと。
- Copilotとは? GPT-4とDALL·E 3が無料で使える生成AI。
- SkypeのBingチャット。GPT-4を日本語かつ無料で使える。& 注意点。
- BingのGPT-4、チャットの使い方。使えない?(今はまだ。)
- MacでGPT-4(ChatGPT最新版)を使う場合、Edgeが必要なのかも。
Llama 関連メモ。
- Llama 3.1登場。MetaのオープンソースAIとダウンロードサイト。
- Meta Horizon OSとApple Vision Pro。オープンかクローズか。
- Llama 3。無料でオープンソースなMeta AI最新モデル。
- Llama(ラマ)の使い方や日本語は? ダウンロード手順とブラウザ実装サイト。