Bard(Gemini)の画像認識の使い方。日本語対応済み、Googleレンズで画像読み取り。 / いがわ

.

Memo

Geminiの画像認識の使い方。日本語でも可。

Bard(Gemini)が画像認識を開始。

Geminiで画像認識。
Googleレンズの機能で。

Google検索の際に現れる、画像検索用のGoogleレンズの機能を使って、 Geminiは画像を認識できる。

Geminiは画像認識を含め無料で使え、Googleアカウントでログインすると、すぐに利用できる。

ログインしなくても使用可能だが、機能が限定的となるとのこと。)
2024年2月8日に、BardからGeminiに名称が変更。)

Geminiの画像認識は、日本語でも可。
画像認識機能について。

Geminiはすでに、日本語での画像認識に対応している。

ただし、「人物」はまだ認識されない。
ロイヤリティフリーの画像でも、「顔が写っている人物の写真」はアップができない。

肖像権や著作権、プライバシーの侵害や悪用などの問題があるためなのかもしれない。

Bard(Gemini)はまだ人物の画像認識には対応していない。

参照:Bard – PaLM 2 を活用した、Google によるチャットベースの AI ツール


Geminiの画像認識の使い方。(日本語でもOK。)

Geminiの画像認識の手順。

Geminiの画面下部にある、メッセージ入力欄左横のアイコンをクリック。

左横のアイコンをクリックし、パソコンやスマホなどから、画像ファイルをGeminiへアップロードする。

Bard(Gemini)へ画像をアップロードするボタンの画像。

画像をアップロードし、メッセージの入力欄に入力する。

メッセージは日本語対応済み。入力後は右横にある三角形のアイコンをクリックする。

Bard(Gemini)で画像認識をする手順の画面。

Geminiが画像を認識して、説明をする。

まだ正確性に欠ける箇所もあるが、近いうちに改善されそう。生成AIの進化はとにかく速い。

Bard(Gemini)による画像の説明1。

写真だけでなく、グラフや表、スケッチなども認識できるらしい。

ためしにボールペンの手書きで描いたエッフェル塔のスケッチをアップして聞いてみたところ、概ね正しい回答があった。

Bard(Gemini)による画像の説明2。

つい先月までは下記の写真でも、人物の画像は未対応という理由で認識がされなかったが、現在では認識できるようになっている。

Bard(Gemini)が画像認識できなかった画像。

画像認識や日本語対応がこれほどまでに速いとは。なんだかおっかなびっくり。


Geminiの画像認識に、人物の画像は未対応。

人物の画像はアップロードできない。

Geminiとのやりとり。

2024年2月上旬時点でも、人物の画像についてはまだ対応していないとのこと。

パブリックドメインのものでも不可。)

Bard(Gemini)とのやりとりの画面。

Geminiに変わった後も、同様に対応されていなかった。

生成AIのルールが社会的に整備・認知されないうちは、非対応のままで良いのではないだろうか。

Geminiで画像認識、アップロードや読み込みを覗き見する猫ちゃん。

以上、参考になれば幸いです。


AI 関連メモ。

ChatGPT 関連メモ。

DALL·E 関連メモ。

Sora 関連メモ。

Gemini 関連メモ。

Copilot、Bing 関連メモ。

Llama 関連メモ。


Webデザインは実務数年、職業訓練校講師数年、フリーランス数年、計15年以上のキャリアがありますが、一気にがぁっと書いているので「です・ます調」ではありません。(元々はメモ書きでした。) 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ訂正いたします。 写真は主にUnsplashPixabayのフリー素材を利用させていただいております。その他の写真や動画もフリー素材やパブリックドメイン、もしくは自前のものを使用しております。

井川 宜久 / Norihisa Igawa
デザイナー、ディレクター、講師、コーチ / 井川宜久

免責事項について

  • 記事ページ(Memosのページ)は当初は文字通りメモ書きでした。その後、修正や更新をしております。
  • 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ早急に対応いたします。
  • 一個人のポートフォリオサイトですので、万一損害・トラブル等が発生した場合でも、一切の責任を負いかねます。