Contents - 目次
ChatGPTと音声会話。
AI(ChatGPT)とボイスチャット。
ChatGPTの音声会話機能。
ChatGPTのスマホアプリで、AIとの音声会話(ボイスチャット)が可能に。
有料のChatGPT Plus(GPT-4)だけでなく、無料のChatGPT(GPT3.5)でも利用できる。
使い方は簡単で、日本語対応もしており、電話のように会話ができる。
2024年9月に「Advanced Voice」という新しい音声会話モードが登場しています。
OpenAIの発表によると、2024年10月5日以降から無料ユーザーでも順次使用可能となるとのこと。
時間制限はありますが、クオリティはかなり高くなっています。
左が従来の標準音声会話、右が新しいAdvanced Voice Mode。
いずれも、チャットの入力欄の右横にあるアイコンをタップすると会話を始められる。
参照元:Voice mode FAQ | OpenAI Help Center
ChatGPTと音声で会話をする手順。
音声会話の手順は簡単。
アプリ版ChatGPTを起動する。
ChatGPTを起動すると、以下のような画面、もしくは前回使用時の続きの画面となる。
いずれの画面でも、右下のアイコン(オレンジで囲った部分)を押すと、会話がスタートする。
(※左側が従来のもの、右側がAdvanced Voice。画面はダークモード。)
ChatGPTと会話を始める。
「おはよう」や「こんにちは」など、日本語でも大丈夫。
音声会話がスタートすると、上部に小さなオレンジの点 (インジケータ)が点灯する。
(※マイクを使用中に出るもの。左側は接続中、右側は会話が開始されたもの。)
(※スクショはiPhoneの画面。)
左側が従来の画面、右側がAdvanced Voiceの画面。そのままスマホに向かって話せばOK。
ChatGPTが会話内容を考え中。
こちら側の会話を聞いて、考えているそぶりをして(AIが音声内容を処理して)から、音声が返ってくる。
もし途中で止めたい場合は、画面左下の停止ボタンを押すと良い。
Advanced Voiceの場合、制限時間が迫ってくると、「残り時間」が表示される。
(※左は従来の画面。右のAdvanced Voiceの場合は、青っぽい球が3Dにくるくる回る感じとなる。)
残り時間は、通話ごとではなく月ごと。
「残り時間」は通話ごとではなく、月次ごととなるので、その後は従来の標準音声に切り替えるか、有料プランのChatGPT Plusへアップグレードするかを選択する。
ChatGPTから音声で返答が返ってくる。
人と話すときと同様に、滑舌が良くないとうまく伝わらないことがあるが、寝起きのボソボソ声でも、意外と内容を聞き取ってくれる。
また、周囲の音声(人やテレビやネットやラジオなど。)にも結構反応するので、気を付けた方が良さそう。
会話を終えるときは「×」を押す。
普通の電話のように、赤い丸の「×」を押すと会話終了となる。
会話内容はチャット履歴に。
会話内容は自動的に文字起こしされ、テキストデータのチャット履歴として保存される。
なので後から会話を確認したいときは、履歴のテキストで確認することができる。
履歴をオフにしたままでは、音声会話ができない。
現時点では、履歴をオフにしている場合では、音声でのチャットができなくなっている。
そのため、誤って個人情報や会社の機密情報などを話してしまった場合などは、後から履歴を削除した方が無難かと思われる。
ChatGPTの音声を変えたいとき。
アプリの設定で音声を変更。
ChatGPTの音声は、下記の手順で変えることができる。
「ハンバーガーメニュー」 > 「ユーザー名」 へ。
左上の「ハンバーガーメニュー」を押して、メニューが開いたら画面下の「ユーザー名」を押す。
(※生成AIはモデルの進歩が速く、デザインや機能が変わっている場合があります。)
「設定(Settings)」 > 「音声(Voice)」へ進む。
「設定(Settings)」から「音声(Voice)」を押すと、 「音声を選択してください(Choose a voice)」、の画面となる。
ここで音声確認ができるので、気に入った音声を選択する。
「Choose a voice」 > 「Confirm」で設定完了。
最後に「Confirm」(確認する)を押すと、音声設定が完了。
パソコンからChatGPTと音声会話をしたいとき。
Voice Control for ChatGPT
Chromeの拡張機能を使用する。
パソコンで音声会話をしたいときは、Chromeの拡張機能に「Voice Control for ChatGPT」がある。
Chrome ウェブストア:Voice Control for ChatGPT
メリット。
- 音声でテキストを入力できる。
- 無料で使うことができる。
- シンプルで使いやすい。
デメリット。
- 音声だけで「メッセージの送信」ができない。なので、マウスやパッドでクリックする必要がある。
- 拡張機能のオン・オフがないので、オフにしたい場合は削除する必要がある。
- Chromeから削除する場合は、削除する理由を英語で聞かれる。(日本語対応がされていない。)
デスクトップ用のChatGPT。
ChatGPT公式アプリの登場。
GPT-4oの発表とともに、パソコン向けとして、OpenAI公式アプリのChatGPTが登場。
Mac版は現時点App Storeにはないが、ブラウザ版のChatGPTの右上からダウンロードができる。
Windows版は、年内に登場予定。
GPT-4oについて。
GPT-4oについてはこちらへまとめました。
関連:GPT-4o。ChatGPTと画像見ながら音声で会話?有料でも無料でも。
以上、参考になれば幸いです。
※Webデザインは実務数年、職業訓練校講師数年、フリーランス数年、計15年以上のキャリアがありますが、一気にがぁっと書いているので「です・ます調」ではありません。(元々はメモ書きでした。) ※事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ訂正いたします。 ※写真は主にUnsplashやPixabayのフリー素材を利用させていただいております。その他の写真や動画もフリー素材やパブリックドメイン、もしくは自前のものを使用しております。
AI 関連メモ。
ChatGPT 関連メモ。
- ChatGPT searchとは?使い方や、有料と無料、Googleとの違い。
- Chrome拡張機能、ChatGPT searchの使い方。自然言語、日常会話で検索。
- ChatGPTに検索機能。ChatGPT searchでWeb検索が可能に。
- MacとWindowsでもChatGPTと音声会話。Advanced Voiceが利用可能に。
- Advanced Voiceによる音声会話。ChatGPTとプラトニックな関係に?
- OpenAI o1の使い方。考えてから答える新しいChatGPTモデル。
- Voice Engineという名の、音声合成技術。日本語の精度は?
- SearchGPT。ChatGPTがAI検索エンジンに。使い方の例と順番待ちへの登録方法。
- GPT-4o miniが登場。ChatGPT無料版はGPT-3.5からバージョンアップ。
- ChatGPT無料ユーザーにもメモリ機能が。記憶や使い方の例。
- iPhoneやiPad、MacでChatGPT(GTP-4o)が。Apple Intelligence。
- 生成AIとWebデザイン、ChatGPTを活用したコーディングに必要なもの。
- ChatGPT最新モデル GPT-4oが無料でも。使える主な機能。
- ChatGPT(GPT-4o)で、PDF要約の精度を検証した結果。
- GPT-4o。ChatGPTと画像見ながら音声で会話?有料でも無料でも。
- ChatGPT無料版でも画像生成が可能に。有料版だけじゃない!?
- ChatGPT(チャットGPT)にアーカイブ機能が。復元も削除も。
- ChatGPT(チャットGPT)を日本語化。日本語設定の方法。
- ChatGPT(チャットGPT)との音声会話と、音声の変更方法。
- ChatGPTアプリのインストールとログイン方法、チャットの使い方。
- ChatGPT(チャットGPT)のスペルチェック、文章校正がむっちゃ楽。
- ChatGPT(チャットGPT)へのログイン方法。ログインできないとき。
- ChatGPTにプラグイン。広がる機能と使い方。最新情報へも。
- ChatGPTがLINEに?「AIチャットくん」の始め方、そして使い方。
- ChatGPTの始め方と使い方と。初心者向けシンプル版。
- ChatGPTはSVGアイコンを作れるのか?
- ChatGPTの文章作成やコーディング、SEO対策は変わるか?
DALL·E 関連メモ。
Sora 関連メモ。
- OpenAI Soraの短編映画。アーティストや映画制作者たち。
- OpenAIのSoraの公開デモから、Soraの仕組みをできるだけシンプルに。
- OpenAIからSora(動画生成AI)が広がる。デモやWebCMから一般公開へ。
Gemini 関連メモ。
- Google AI Studioの「Gemini 1.5 Pro 002とGemini Experimental 1114」にできること。
- Gemini 1.5 Pro 2Mモデル。Waitlistの登録手順。日本語上手なGoogle生成AI。
- BardからGeminiに。使い方はどう変わる?日本語対応は?
- Bard(Gemini)が絵を描けるように。テキストから画像生成の方法。
- Bard(Gemini)の画像認識の使い方。日本語対応済み、Googleレンズで画像読み取り。
- 最新情報を日本語かつ無料で使いたいときは、GoogleのBard?
- ChatGPTとBardの違い。なぜAIは日本語チャットが苦手なの?
- Bard(Gemini)が日本語対応。ログイン方法や最新情報など、使い方の例。
- BardでGemini。Googleの最新AIを無料で使う方法。
- GoogleのBardは、OpenAIのChatGPTを越えられるだろうか?
Copilot、Bing 関連メモ。
- ChatGPTとCopilotの違い。料金や、できることと、できないこと。
- Copilotとは? GPT-4とDALL·E 3が無料で使える生成AI。
- SkypeのBingチャット。GPT-4を日本語かつ無料で使える。& 注意点。
- BingのGPT-4、チャットの使い方。使えない?(今はまだ。)
- MacでGPT-4(ChatGPT最新版)を使う場合、Edgeが必要なのかも。
Llama 関連メモ。
- Llama 3.1登場。MetaのオープンソースAIとダウンロードサイト。
- Meta Horizon OSとApple Vision Pro。オープンかクローズか。
- Llama 3。無料でオープンソースなMeta AI最新モデル。
- Llama(ラマ)の使い方や日本語は? ダウンロード手順とブラウザ実装サイト。