
Contents - 目次
Bard(Gemini)が画像認識を開始。
Geminiで画像認識。
Googleレンズの機能で。
Google検索の際に現れる、画像検索用のGoogleレンズを使って、 Geminiは画像を認識できる。
無料で使え、Googleアカウントでログインすると、すぐに利用できる。
(※2024年2月8日に、BardからGeminiに名称が変更。)
Geminiの画像認識は、日本語でも可。
画像認識機能について。
Geminiはすでに、日本語での画像認識に対応している。
ただし、「人物」はまだ認識されない。
ロイヤリティフリーの画像でも、「顔が写っている人物の写真」はアップができない。
肖像権や著作権、プライバシーの侵害や悪用などの問題があるためなのかもしれない。
画像認識機能についての補足。
人物については慎重に。
「人物」については非常に厳しく、「絵」でもある程度写実的なものであればアップロードの時点で弾かれる。
参照:Bard – PaLM 2 を活用した、Google によるチャットベースの AI ツール
Geminiの悪用リスクも防げるため、社会にとっては有益なことかと思う。
(※バージョンアップなどで画面のデザインが変わっていることがあります。)
Geminiの画像認識の使い方。(日本語でもOK。)
Geminiの画像認識の手順。
画面下部の、メッセージ入力欄から。
Geminiの画面下部にある、メッセージ入力欄左横のアイコンをクリック。
左横の「+」アイコンをクリックし、画像を選択。パソコンやスマホなどから、画像ファイルをGeminiへアップロードする。
または、画像ファイルをそのままGeminiの入力欄へ、ドラッグ&ドロップしても可。
画像をアップロードし、メッセージの入力欄に入力する。
メッセージは日本語対応済み。入力後は右横にある三角形の送信ボタンをクリックする。
Geminiが画像を認識して、説明をする。
まだ正確性に欠ける箇所もあるが、近いうちに改善されそう。生成AIの進化はとにかく速い。
Gemini 1.5の場合。(2023年8月)
Gemini 2.0 Flashの場合。(2025年4月)
Gemini 2.5 Pro Experimentalの場合。(2025年4月)
Geminiの画像認識機能は画像だけじゃない。
グラフや表、スケッチなども認識。
Gemini 1.5の場合。(2023年8月)
写真だけでなく、グラフや表、スケッチなども認識できるらしい。
ためしにボールペンの手書きで描いたエッフェル塔のスケッチをアップして聞いてみたところ、概ね正しい回答があった。
Gemini 1.5の場合。(2023年8月)
先月(2023年7月)までは下記の写真でも、人物の画像は未対応という理由で認識がされなかったが、今月(2023年8月)では認識できるようになっている。

画像認識や日本語対応がこれほどまでに速いとは。なんだかおっかなびっくり。
Geminiの画像認識に、人物の画像は未対応 → 対応に。
画像認識が人物の画像に対応。
人物の画像もアップロードできるようになった。
Sketch to Che Guevara. Sketch to Moe Tucker.
鉛筆によるスケッチ。


Geminiとのやりとり。
2025年2月時点でも、人物の絵や写真はまだ対応していないとのこと。
(※自分が描いた絵や、パブリックドメインのものでも不可。)
Geminiに変わった後も、同様に対応されていなかった。
生成AIのルールが社会的に整備・認知されないうちは、非対応のままで良いのではないだろうか。
Geminiが人物の認識にも対応に。
Geminiによる人物画の画像認識。
Gemini 2.0 Flashの場合。(2025年4月)
Gemini 2.5 Pro Experimentalの場合。(2025年4月)
Gemini 2.5 Pro Experimentalの場合。(2025年4月)
Gemini利用時の注意点。
Geminiの年齢制限について。
年齢制限が色々と曖昧。
Geminiアプリのプライバシーハブによると、生成された画像は、18歳未満のユーザーは利用できない。
Geminiアプリの年齢制限。(Android & iOS)
AndroidとiOSでのGeminiアプリでは12歳以上となっているので、小学生でも使用できることになる。
GeminiとGoogleアカウントの年齢制限。
GeminiやGoogleアカウントの利用は、13歳以上が対象。(日本の場合。)
いじめや誹謗中傷の原因にさせないためにも、念のため注意が必要かもしれない。
Geminiの商用利用について。
商用利用も注意が必要。
Googleの公式サイト上には明確な記載は見つからず。
Geminiに聞いてみると、Google AIが著作権を持つ可能性、追加ライセンスの必要性、将来的に変更される可能性、画風の元の著作権の影響などがあるとの回答。
当然と言えば当然であり、妥当と言えば妥当な回答。
以上、参考になれば幸いです。
AI 関連メモ。
ChatGPT 関連メモ。
- ChatGPTの最新推論モデル「o3-mini」の使い方とヒント。
- ChatGPTの次世代モデル、GTP-4.5とGPT-5のリリース時期と可能性。
- ChatGPTの最新推論モデル「o3-mini」の使い方とヒント。
- ChatGPT searchとは?使い方や、有料と無料、Googleとの違い。
- Chrome拡張機能、ChatGPT searchの使い方。自然言語、日常会話で検索。
- ChatGPTに検索機能。ChatGPT searchでWeb検索が可能に。
- MacとWindowsでもChatGPTと音声会話。Advanced Voiceが利用可能に。
- Advanced Voiceによる音声会話。ChatGPTとプラトニックな関係に?
- OpenAI o1の使い方。考えてから答える新しいChatGPTモデル。
- Voice Engineという名の、音声合成技術。日本語の精度は?
- SearchGPT。ChatGPTがAI検索エンジンに。使い方の例と順番待ちへの登録方法。
- GPT-4o miniが登場。ChatGPT無料版はGPT-3.5からバージョンアップ。
- ChatGPT無料ユーザーにもメモリ機能が。記憶や使い方の例。
- iPhoneやiPad、MacでChatGPT(GTP-4o)が。Apple Intelligence。
- 生成AIとWebデザイン、ChatGPTを活用したコーディングに必要なもの。
- ChatGPT最新モデル GPT-4oが無料でも。使える主な機能。
- ChatGPT(GPT-4o)で、PDF要約の精度を検証した結果。
- GPT-4o。ChatGPTと画像見ながら音声で会話?有料でも無料でも。
- ChatGPT無料版でも画像生成が可能に。有料版だけじゃない!?
- ChatGPT(チャットGPT)にアーカイブ機能が。復元も削除も。
- ChatGPT(チャットGPT)を日本語化。日本語設定の方法。
- ChatGPT(チャットGPT)との音声会話と、音声の変更方法。
- ChatGPTアプリのインストールとログイン方法、チャットの使い方。
- ChatGPT(チャットGPT)のスペルチェック、文章校正がむっちゃ楽。
- ChatGPT(チャットGPT)へのログイン方法。ログインできないとき。
- ChatGPTにプラグイン。広がる機能と使い方。最新情報へも。
- ChatGPTがLINEに?「AIチャットくん」の始め方、そして使い方。
- ChatGPTの始め方と使い方と。初心者向けシンプル版。
- ChatGPTはSVGアイコンを作れるのか?
- ChatGPTの文章作成やコーディング、SEO対策は変わるか?
DALL·E 関連メモ。
Sora 関連メモ。
- OpenAI Soraの短編映画。アーティストや映画制作者たち。
- OpenAIのSoraの公開デモから、Soraの仕組みをできるだけシンプルに。
- OpenAIからSora(動画生成AI)が広がる。デモやWebCMから一般公開へ。
Gemini 関連メモ。
- NotebookLMは使えない?YouTube動画とPDFの使い方と検証結果。
- Google AI Studioの「Gemini 1.5 Pro 002とGemini Experimental 1114」にできること。
- Gemini 1.5 Pro 2Mモデル。Waitlistの登録手順。日本語上手なGoogle生成AI。
- BardからGeminiに。使い方はどう変わる?日本語対応は?
- Bard(Gemini)が絵を描けるように。テキストから画像生成の方法。
- Bard(Gemini)の画像認識の使い方。日本語対応済み、Googleレンズで画像読み取り。
- 最新情報を日本語かつ無料で使いたいときは、GoogleのBard?
- ChatGPTとBardの違い。なぜAIは日本語チャットが苦手なの?
- Bard(Gemini)が日本語対応。ログイン方法や最新情報など、使い方の例。
- BardでGemini。Googleの最新AIを無料で使う方法。
- GoogleのBardは、OpenAIのChatGPTを越えられるだろうか?
Copilot、Bing 関連メモ。
- ChatGPTとCopilotの違い。料金や、できることと、できないこと。
- Copilotとは? GPT-4とDALL·E 3が無料で使える生成AI。
- SkypeのBingチャット。GPT-4を日本語かつ無料で使える。& 注意点。
- BingのGPT-4、チャットの使い方。使えない?(今はまだ。)
- MacでGPT-4(ChatGPT最新版)を使う場合、Edgeが必要なのかも。
Llama 関連メモ。
- Llama 3.1登場。MetaのオープンソースAIとダウンロードサイト。
- Meta Horizon OSとApple Vision Pro。オープンかクローズか。
- Llama 3。無料でオープンソースなMeta AI最新モデル。
- Llama(ラマ)の使い方や日本語は? ダウンロード手順とブラウザ実装サイト。
Claude 関連メモ。
Perplexity 関連メモ。
- PerplexityとWordPressの名前と意味合い。著作権と知的財産。
- Perplexityの日本語化の方法と使い方や検索の例。
- Perplexity(パープレキシティ)のアカウント作成と使い方の基本。
※Webデザインは実務数年、職業訓練校講師数年、フリーランス数年、計15年以上のキャリアがありますが、一気にがぁっと書いているので「です・ます調」ではありません。(元々はメモ書きでした。) ※事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ訂正いたします。 ※写真は主にUnsplashやPixabayのフリー素材を利用させていただいております。その他の写真や動画もフリー素材やパブリックドメイン、もしくは自前のものを使用しております。