Bardで画像認識をする方法。画像入力、読み込みをGoogleレンズで。デザイナー、コーチ、ディレクター / 井川

igawa design.

Memo

Bardで画像認識。Googleレンズでアップロード、画像入力、画像読み込み。

です・ます調の文章でなくてすみません。当初は個人的なメモ書きだったためです。

Bardが画像認識。Googleレンズへアップロードで。

Google検索の際に現れる、画像検索用のGoogleレンズの機能を使って、 Bardが画像を認識できるようになっている。

2023年8月時点では日本語対応はしていないが、そう遠くないうちに対応すると思われる。

画像認識機能について。

現時点でもChromeの言語設定を変えると、画像認識を使用することができる。

ただし、今はまだ「人物」は認識されない。

例えば、、、

  • 顔が写っていない人物が猫を抱っこしている画像でも、拒否されてしまう。
  • 顔が写っているロイヤリティフリーな著名人の写真も同様に、アップができない。

肖像権や著作権、プライバシーの侵害や悪用などの問題があるため、できないのかもしれない。


Bardで画像認識をする手順。

言語設定を英語に。

まだ日本語に対応していないため、Chromeの言語設定を英語にする必要がある。

その後は、パソコンやスマホから画像ファイルをアップロードするだけで良い。

言語設定は、数分もあればすぐに切り替えられる。

「Googleアカウントを管理」を選択。

アカウントの画面から言語を切り替える。

Google Chromeの画面右上のアイコンをクリックし、「アカウント」を選択する。

またはその右横のプロフィール画像をクリックし、「Googleアカウントを管理」からも進める。

Bardで画像認識をする手順の画面。アカウントの管理へ進む。

画面左側メニュー内の「個人情報」をクリック。

個人情報の画面で設定。

画面左のサイドメニュー内から、「個人情報」を選択する。

Bardで画像認識をする手順の画面1。

「その他の情報と Google サービスの設定」 > 「ウェブ向けの全般設定」へ進む。

ウェブ向けの全般設定。

画面の中ほどにある、「ウェブ向けの全般設定」内の「言語」を選択する。

Bardで画像認識をする手順の画面2。

「言語」を「English」に設定する。

言語の切り替えは簡単。

言語を「English(英語)」にしても、BardやGoogle検索は日本語で使える。

Google スプレッドシートやGoogle Meetなどが「英語」となるが、同様の方法で「日本語」に切り替えればすぐに戻る。

Bardで画像認識をする手順の画面3。

言語が英語に変わる。

言語設定の完了。

Googleアカウントの言語表示が、日本語から英語へと変われば準備OK。

Bardで画像認識をする手順の画面4。

Bardのサイトへ戻る。

画像認識の準備が完了。

言語設定が英語でも、日本語で入力、チャットができる。

また、Chromeの翻訳機能で、日本語変換も可能。今回は試していないが、iPhoneのSafariにも翻訳機能がある。

Bardで画像認識をする手順の画面5。

画面下部にある、プロンプトの横の「+」マークをクリック。

画像がアップロードできるように。

言語設定を英語にした後は、Bardの画面下部にある入力欄の左横に、「+」マークが表示される。

Bardで画像認識をする手順の画面6。

「+」マークをクリックすると、アップロード用の小さな画面が出てくる。

サポートされている画像形式は、JPEG(jpg)、PNG、WebPとなっている。

Bardで画像認識をする手順の画面7。

ブラウザの翻訳機能で確認できる。

Upload file(ファイルをアップロードする)をクリックすると、パソコンやスマホにある画像を選択できるようになる。

Bardで画像認識をする手順の画面8。

ダイアログが表示される場合。

データや画像認識についての説明。

データについてのダイアログが表示される場合は、「Got it (わかりました)」をクリックする。

Bardで画像認識をする手順の画面9。

Chrome翻訳機能で日本語でも確認。

Bardで画像認識をする手順の画面10。

画像ファイルをアップロードし、テキストを入力。

画像認識のお願いは英語で。

言語設定が「English」でも日本語チャットができるが、画像認識の際は英語で行う必要がある。

今回は、「What do you see in the photo? (何が写っていますか?)」 と入力してみた。

Bardで画像認識をする手順の画面11。

Bardのチャット画面に戻る。

エンターキーか、右横の三角形をクリック。

エンターキーもしくは入力欄の右側の三角形を押すと、チャット画面に戻る。

すると、画像認識後の会話ができるようになる。

Bardで画像認識をする手順の画面12。

Chromeの翻訳機能で日本語に翻訳してみると、なかなか的確な判断をしている。

Bardで画像認識をする手順の画面13。

写真だけでなく、グラフや表、スケッチなども認識できるらしい。

Bardで画像認識、アップロードや読み込みを覗き見する猫ちゃん。

以上、参考になれば幸いです。


AI 関連メモ。

Chat D-ID 関連メモ。
ChatGPT 関連メモ。
OpenAIのロゴ。
Bard 関連メモ。
Googleのロゴ。
DALL·E 関連メモ。

Webデザインは実務数年、職業訓練校講師数年、フリーランス数年、計15年以上のキャリアがありますが、一気にがぁっと書いています。(元々はメモ書きでしたので順次見直し、更新しています。) 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ訂正いたします。 写真は主にUnsplashPixabayのフリー素材を利用させていただいております。その他の写真や動画もフリー素材やパブリックドメイン、購入素材、もしくは自前のものを使用しております。

デザイナー、ディレクター、講師、コーチ / 井川宜久

免責事項について

  • 記事ページ(Memosのページ)は当初は文字通りメモ書きでした。その後、修正や更新をしております。
  • 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ早急に対応いたします。
  • 一個人のポートフォリオサイトですので、万一損害・トラブル等が発生した場合でも、一切の責任を負いかねます。