Bard(Gemini)の画像認識の使い方。日本語対応済み、Googleレンズで画像読み取り。デザイナー、コーチ、ディレクター / 井川

.

Memo

です・ます調の文章でなくすみません。

当初の名残りです..pets

Bard 画像認識のやり方。日本語での使い方。ChatGPTだけじゃない!

Bardが画像認識を開始。

Bard(Gemini)で画像認識。

2024年2月8日に、BardからGeminiに名称が変更。)

Googleレンズ。

Google検索の際に現れる、画像検索用のGoogleレンズの機能を使って、 Bardが画像を認識できるようになっている。

Bardは画像認識を含め無料で使え、Googleアカウントでログインすると、すぐに利用できる。

ログインしなくても使用可能だが、機能が限定的となるとのこと。)

画像認識は、日本語でも可。
画像認識機能について。

Bardはすでに、日本語での画像認識に対応している。

ただし、「人物」はまだ認識されない。
ロイヤリティフリーの画像でも、「顔が写っている人物の写真」はアップができない。

肖像権や著作権、プライバシーの侵害や悪用などの問題があるためなのかもしれない。

ChatGPTだけじゃない!Bardはまだ人物の画像認識には対応していない。

参照:Bard – PaLM 2 を活用した、Google によるチャットベースの AI ツール


Bardの画像認識の使い方。(日本語でもOK。)

Bardの画面下部にある、メッセージ入力欄左横のアイコンをクリック。

左横のアイコンをクリックし、パソコンやスマホなどから、画像ファイルをBardへアップロードする。

Bardへ画像をアップロードするボタンの画像。

画像をアップロードし、メッセージの入力欄に入力する。

メッセージは日本語対応済み。入力後は右横にある三角形のアイコンをクリックする。

Bardで画像認識をする手順の画面。

Bardが画像を認識して、説明をする。

まだ正確性に欠ける箇所もあるが、近いうちに改善されそう。生成AIの進化はとにかく速い。

Bardによる画像の説明1。

写真だけでなく、グラフや表、スケッチなども認識できるらしい。

ためしにボールペンの手書きで描いたエッフェル塔のスケッチをアップして聞いてみたところ、概ね正しい回答があった。

Bardによる画像の説明2。

つい先月までは下記の写真でも、人物の画像は未対応という理由で認識がされなかったが、現在では認識できるようになっている。

画像認識できなかった画像。今はもう認識可能に。

画像認識や日本語対応がこれほどまでに速いとは。なんだかおっかなびっくり。


画像認識に、人物の画像は未対応。

人物の画像はアップロードできない。

2024年2月上旬時点でも、人物の画像についてはまだ対応していないとのこと。

Sketch to CheChe Guevara

鉛筆によるスケッチも、対応外だった。

Sketch to CheChe Guevara
Bardとのやりとり。

Bardとのやりとりの画面。

Geminiに変わった後も、同様に対応されていなかった。

Bardで画像認識、アップロードや読み込みを覗き見する猫ちゃん。

以上、参考になれば幸いです。


AI 関連メモ。

ChatGPT 関連メモ。
OpenAIのロゴ。
Bard 関連メモ。
Googleのロゴ。
DALL·E 関連メモ。

Webデザインは実務数年、職業訓練校講師数年、フリーランス数年、計15年以上のキャリアがありますが、一気にがぁっと書いているので「です・ます調」ではありません。(元々はメモ書きでした。) 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ訂正いたします。 写真は主にUnsplashPixabayのフリー素材を利用させていただいております。その他の写真や動画もフリー素材やパブリックドメイン、購入素材、もしくは自前のものを使用しております。

デザイナー、ディレクター、講師、コーチ / 井川宜久

免責事項について

  • 記事ページ(Memosのページ)は当初は文字通りメモ書きでした。その後、修正や更新をしております。
  • 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ早急に対応いたします。
  • 一個人のポートフォリオサイトですので、万一損害・トラブル等が発生した場合でも、一切の責任を負いかねます。