Contents - 目次
Geminiでも使い方は変わらず、日本語もOK。
Geminiに名称変更。ブランド統一へ。
Gemini(ジェミニ)。
Geminiは、日本語で双子座という意味。読み方は「ジェミニ」となった。
Geminiのモデル。
- Gemini Ultra – 非常に複雑なタスクに対応する、高性能かつ最大のモデル
- Gemini Pro – 幅広いタスクに対応する最良のモデル
- Gemini Flash – Proよりも軽量で、大規模なサービスに高速かつ効率的に対応できるように設計されたモデル
- Gemini Nano – デバイス上のタスクに最も効率的なモデル
Proでも無料、かつ日本語で使える。
参照元:最大かつ高性能 AI モデル、Gemini を発表 – AI をすべての人にとってより役立つものに
Gemini 1.5の発表。
後日発表された「Gemini 1.5(Gemini 1.5 Pro)」は、最上位モデルのGemini Ultra(Gemini Ultra1.0)と同様のレベルのパフォーマンスとのこと。
参照元:Google Japan Blog: 次世代モデル、 Gemini 1.5 を発表
Gemini 1.5 Proの使い方。
Gemini 1.5 Proの利用方法。
Googl AI Studioで。
さらにその後に公開されたGemini 1.5 Proは、旧BardやGemini 1.5のURLとは別にGoogl AI Studioから利用が可能。
URL:Google AI Studio
Gemini 1.5 Proの画面。
Gemini 1.5 Pro。
UI(ユーザー・インターフェイス)は英語だが、チャットは日本語でできる。無料で使え、上位モデルのGemini Ultra1.0と同様のレベルなので、精度は高い。
(※バージョンアップなどで画面のデザインが変わっていることがあります。)
使い方はシンプル。チャットは日本語も可。
- 画面右側の「Create new prompt」をクリック。
- 画面左側のモデルから、「Gemini 1.5 Pro」を選択。
- 画面下部の入力欄へ、メッセージを入力。(※使用制限あり。画面右側の「Token Count(トークンカウント)」が目安となる。最大は約100万もしくは200万トークン。)
Googleによる公式デモ動画。
Geminiの時代に。
AIと機械学習により、世界中のユーザーに提供されていく第一歩となるかもしれない。
スマホのような、生活インフラとして欠かせない時代がやってくる可能性が。
参照元:Gemini 時代の新たな一歩 | Google Cloud 公式ブログ
Gemini 1.5 ProがGemini Advancedへ搭載。
Google ドライブ経由、または直接ファイルをGemini Advancedにアップロードすると、世界最長(100万トークン以上。200万トークンも試験中。)のコンテキスト ウィンドウでドキュメントを分析できる。
これにより、最大1,500ページの複数の文書や、100件のメールの要約、1時間の動画コンテンツの分析などが可能になるという。
参照元:Gemini 1.5 Pro を Gemini Advanced に搭載
Geminiの使い方と日本語対応。
Geminiには、ブラウザ版とアプリ版がある。
ブラウザでの使い方。
GeminiはBardと同じように、ブラウザ上で利用ができ、日本語対応もされている。
使うためには、まずGoogleアカウントでログインが必要。
その後は画面内に表示されている、使い方の説明や問いかけへ返信することで、習うより慣れよで次第に慣れていく。
- 画面下部の入力欄にメッセージを入れ、エンターキーを押すとチャットが始まる。(2024.09.01時点ではGoogl AI Studioのモデルでは送信ボタンのクリックが必要。)
- プロンプトとは、要するに入力欄にいれる文章のこと。
- チャットの履歴は、左側のサイドバーに保存される。(3点リーダーから削除も可能。)
- 画面に注意書きがあるように、回答が正解とは限らない。(これは他の生成AIでも同じ。)
- 日本語対応されているが、精度は英語の方が高い。
Gemini 1.0 Proの画面。
Gemini 1.0 Pro。
Gemini 1.0 Proは、UIが日本語化されている。
(※バージョンアップなどで画面のデザインが変わっていることがあります。)
GeminiにはBardのときのチャット履歴も残っており、以前の続きからのチャットもできる。
BardのURLへアクセスすると、GeminiのURLへ自動的にリダイレクトされる。
BardとGeminiの公式URL。
- BardのURL:https://bard.google.com
- GeminiのURL:https://gemini.google.com
アプリでの使い方。
Geminiへのブランド名変更に伴い、スマホアプリ版もリリース。
ダウンロードして、Googleアカウントでログインすると使用可能。
使い方もブラウザ同様で、シンプル。
AndroidとiPhone(iOS)でのアプリ名、ダウンロード先は下記の通り。
- Android:「Google Gemini」。(Google Gemini – Google Playのアプリ)
- iPhone(iOS):「Google」。(Google on the App Store)
参照元:Bard から Gemini へ:Ultra 1.0 とGemini アプリを発表
Geminiにできること。
GeminiはマルチモーダルAI。
チャットや翻訳、コード生成や画像生成など、複数の使い方ができる。
Googleサービスと連携可能な、マルチモーダルAI。
Geminiは日本語化もされており、文章の生成や校正はもちろん、画像認識も画像生成もBardと変わらずに使える。
Geminiの機能。
他の生成AIのように、マルチモーダルAIとして、主に下記のことができる。
Google各サービスとの連携は、Geminiならではの特徴。
- 文章生成。
- 文章校正。
- 質問応答。
- 要約や翻訳。
- コード生成。
- 画像認識。
- 画像生成。
- 音声入力。
- Google各サービス(Gmail、Google Map、YouTubeなど)との連携。
- ブレインストーミング。
- 詩や台本、メールや手紙の下準備。
など。
関連:Bardが絵を描けるように。テキストから画像生成の方法。
関連:Bardの画像認識の使い方。日本語対応済み、Googleレンズで画像読み取り。
関連:最新情報を日本語かつ無料で使いたいときは、GoogleのBard?
(※いわゆる「ハルシネーション」的なことは、他の生成AIでも普通に起こっているので、Google検索や書籍などを併用したファクトチェックが大切。)
Geminiによる、スマホのアシスタント機能。
Androidは、「Googleアシスタント」からも利用ができる様子。
参照元:Gemini モバイルアプリを使ってみる – Android – Gemini アプリ ヘルプ
Gemini 1.0 proによる画像生成の例。
2024年2月9日時点では、日本語では生成できなかった。(英語では可能。)
上記は、「Gemini(Twins)」を使用した英語でのプロンプトで生成された画像。
ただし人物の画像生成はやはりまだ色々と解決しなければならない問題があるようで、このときは途中で生成不可となった。
2024年5月8日時点では、英語でも画像生成ができなくなっている。
Geminiの年齢制限について。
画像生成は、18歳未満のユーザーは利用できないとのこと。
また、Gemini自体の利用は、13歳以上が対象とのこと。(日本の場合。)
Geminiの商用利用について。
商用利用は注意が必要。
Googleの公式サイトには明確な記載は見つからず、Geminiに商用利用について聞いてみてもはっきりとした回答がなかった。
Geminiによると、Google AIが著作権を持つ可能性や追加ライセンスの必要性、将来的に変更される可能性や画風の元の著作権の影響などがあるとのこと。
Geminiの軽量モデルとしてのGemma(ジェマ)。
Gemma(ジェマ)は商用利用可能。
複数のメディアやGoogleのサイトによると、こちらはオープンモデルで、商用利用も可能な模様。
Gemma – Google が提供する最先端の軽量オープンモデル ファミリー。 | Google AI for Developers
参照元:Gemma: Google introduces new state-of-the-art open models
Gemmaの使い方。
使い勝手はGeminiと違っていて、まだ一般ユーザー向けではない感じ。
Geminiのモデルと、料金プラン。
Geminiの料金プラン。
Geminiのプランと料金設定は下記のようになっている。
無料版のGeminiと、有料版のGemini Advancedがある。
- 無料で使えるGeminiは、「Gemini 1.0 Pro」のモデル。
- 有料の「Gemini Advanced」では、「Gemini 1.5 Pro」のモデルが使える。(※料金は2024年5月中旬時点。)
参照元:Gemini Advanced – Google の最も高性能な AI モデルにアクセス
Google Oneでのプランと料金設定。
Google Oneの中のGemini。
GmailやGoogle ドライブ、Google フォトなどが使用できるGoogle OneのサービスとしてGeminiも含まれている。
- 「Gemini 1.0 proを無料で使えるのは、「15GB」のプラン。
- 「Gemini 1.5 pro」が使えるのは、月額2,900円の「AI プレミアム 2TB」。(※トライアル期間あり。)
(※料金は2024年5月初旬時点。)
参照元:クラウド ストレージのアップグレード – Google One
Image:Gemini by Google AI
以上、参考になれば幸いです。
※Webデザインは実務数年、職業訓練校講師数年、フリーランス数年、計15年以上のキャリアがありますが、一気にがぁっと書いているので「です・ます調」ではありません。(元々はメモ書きでした。) ※事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ訂正いたします。 ※写真は主にUnsplashやPixabayのフリー素材を利用させていただいております。その他の写真や動画もフリー素材やパブリックドメイン、もしくは自前のものを使用しております。
AI 関連メモ。
ChatGPT 関連メモ。
- ChatGPT searchとは?使い方や、有料と無料、Googleとの違い。
- Chrome拡張機能、ChatGPT searchの使い方。自然言語、日常会話で検索。
- ChatGPTに検索機能。ChatGPT searchでWeb検索が可能に。
- MacとWindowsでもChatGPTと音声会話。Advanced Voiceが利用可能に。
- Advanced Voiceによる音声会話。ChatGPTとプラトニックな関係に?
- OpenAI o1の使い方。考えてから答える新しいChatGPTモデル。
- Voice Engineという名の、音声合成技術。日本語の精度は?
- SearchGPT。ChatGPTがAI検索エンジンに。使い方の例と順番待ちへの登録方法。
- GPT-4o miniが登場。ChatGPT無料版はGPT-3.5からバージョンアップ。
- ChatGPT無料ユーザーにもメモリ機能が。記憶や使い方の例。
- iPhoneやiPad、MacでChatGPT(GTP-4o)が。Apple Intelligence。
- 生成AIとWebデザイン、ChatGPTを活用したコーディングに必要なもの。
- ChatGPT最新モデル GPT-4oが無料でも。使える主な機能。
- ChatGPT(GPT-4o)で、PDF要約の精度を検証した結果。
- GPT-4o。ChatGPTと画像見ながら音声で会話?有料でも無料でも。
- ChatGPT無料版でも画像生成が可能に。有料版だけじゃない!?
- ChatGPT(チャットGPT)にアーカイブ機能が。復元も削除も。
- ChatGPT(チャットGPT)を日本語化。日本語設定の方法。
- ChatGPT(チャットGPT)との音声会話と、音声の変更方法。
- ChatGPTアプリのインストールとログイン方法、チャットの使い方。
- ChatGPT(チャットGPT)のスペルチェック、文章校正がむっちゃ楽。
- ChatGPT(チャットGPT)へのログイン方法。ログインできないとき。
- ChatGPTにプラグイン。広がる機能と使い方。最新情報へも。
- ChatGPTがLINEに?「AIチャットくん」の始め方、そして使い方。
- ChatGPTの始め方と使い方と。初心者向けシンプル版。
- ChatGPTはSVGアイコンを作れるのか?
- ChatGPTの文章作成やコーディング、SEO対策は変わるか?
DALL·E 関連メモ。
Sora 関連メモ。
- OpenAI Soraの短編映画。アーティストや映画制作者たち。
- OpenAIのSoraの公開デモから、Soraの仕組みをできるだけシンプルに。
- OpenAIからSora(動画生成AI)が広がる。デモやWebCMから一般公開へ。
Gemini 関連メモ。
- Google AI Studioの「Gemini 1.5 Pro 002とGemini Experimental 1114」にできること。
- Gemini 1.5 Pro 2Mモデル。Waitlistの登録手順。日本語上手なGoogle生成AI。
- BardからGeminiに。使い方はどう変わる?日本語対応は?
- Bard(Gemini)が絵を描けるように。テキストから画像生成の方法。
- Bard(Gemini)の画像認識の使い方。日本語対応済み、Googleレンズで画像読み取り。
- 最新情報を日本語かつ無料で使いたいときは、GoogleのBard?
- ChatGPTとBardの違い。なぜAIは日本語チャットが苦手なの?
- Bard(Gemini)が日本語対応。ログイン方法や最新情報など、使い方の例。
- BardでGemini。Googleの最新AIを無料で使う方法。
- GoogleのBardは、OpenAIのChatGPTを越えられるだろうか?
Copilot、Bing 関連メモ。
- ChatGPTとCopilotの違い。料金や、できることと、できないこと。
- Copilotとは? GPT-4とDALL·E 3が無料で使える生成AI。
- SkypeのBingチャット。GPT-4を日本語かつ無料で使える。& 注意点。
- BingのGPT-4、チャットの使い方。使えない?(今はまだ。)
- MacでGPT-4(ChatGPT最新版)を使う場合、Edgeが必要なのかも。
Llama 関連メモ。
- Llama 3.1登場。MetaのオープンソースAIとダウンロードサイト。
- Meta Horizon OSとApple Vision Pro。オープンかクローズか。
- Llama 3。無料でオープンソースなMeta AI最新モデル。
- Llama(ラマ)の使い方や日本語は? ダウンロード手順とブラウザ実装サイト。