ChatGPT(チャットGPT)との音声会話と、音声の変更方法。 / いがわ

.

Memo

ChatGPTとボイスチャット。音声会話ができないときの対処。

ChatGPTと音声会話。

AI(ChatGPT)とボイスチャット。

ChatGPTの音声会話機能。

ChatGPTのスマホアプリで、AIとの音声会話(ボイスチャット)が可能に。

有料のChatGPT Plus(GPT-4)だけでなく、無料のChatGPT(GPT3.5)でも利用できる。

使い方は簡単で、日本語対応もしており、電話のように会話ができる。

ChatGPTの開発元、OpenAI社のロゴ。
2024.10.05 追記)

2024年9月に「Advanced Voice」という新しい音声会話モードが登場しています。

OpenAIの発表によると、2024年10月5日以降から無料ユーザーでも順次使用可能となるとのこと。

時間制限はありますが、クオリティはかなり高くなっています。

左が従来の標準音声会話、右が新しいAdvanced Voice Mode。

いずれも、チャットの入力欄の右横にあるアイコンをタップすると会話を始められる。

無料で使用できる音声会話。
Advanced Voiceによる音声会話。

参照元:Voice mode FAQ | OpenAI Help Center


ChatGPTと音声で会話をする手順。

音声会話の手順は簡単。

アプリ版ChatGPTを起動する。

ChatGPTを起動すると、以下のような画面、もしくは前回使用時の続きの画面となる。

いずれの画面でも、右下のアイコン(オレンジで囲った部分)を押すと、会話がスタートする。

左側が従来のもの、右側がAdvanced Voice。画面はダークモード。)

ChatGPT(チャットGPT)のスタート画面。
ChatGPTのスタート画面。

ChatGPTと会話を始める。

「おはよう」や「こんにちは」など、日本語でも大丈夫。

音声会話がスタートすると、上部に小さなオレンジの点 (インジケータ)が点灯する。

マイクを使用中に出るもの。左側は接続中、右側は会話が開始されたもの。)
スクショはiPhoneの画面。)

左側が従来の画面、右側がAdvanced Voiceの画面。そのままスマホに向かって話せばOK。

ChatGPTとボイスチャットの接続中の画面。
ChatGPTとボイスチャットの接続中の画面。

ChatGPTが会話内容を考え中。

こちら側の会話を聞いて、考えているそぶりをして(AIが音声内容を処理して)から、音声が返ってくる。

もし途中で止めたい場合は、画面左下の停止ボタンを押すと良い。

Advanced Voiceの場合、制限時間が迫ってくると、「残り時間」が表示される。

左は従来の画面。右のAdvanced Voiceの場合は、青っぽい球が3Dにくるくる回る感じとなる。)

ChatGPTと音声会話を行っている画面。
ChatGPTと音声会話を行っている画面。
残り時間は、通話ごとではなく月ごと。

「残り時間」は通話ごとではなく、月次ごととなるので、その後は従来の標準音声に切り替えるか、有料プランのChatGPT Plusへアップグレードするかを選択する。

ChatGPTと音声会話を行っている画面。
ChatGPTと音声会話を行っている画面。

ChatGPTから音声で返答が返ってくる。

人と話すときと同様に、滑舌が良くないとうまく伝わらないことがあるが、寝起きのボソボソ声でも、意外と内容を聞き取ってくれる。

また、周囲の音声(人やテレビやネットやラジオなど。)にも結構反応するので、気を付けた方が良さそう。

ChatGPTと音声会話を行っている画面。

会話を終えるときは「×」を押す。

普通の電話のように、赤い丸の「×」を押すと会話終了となる。

ChatGPTの音声会話を終了しようとしている画面。

会話内容はチャット履歴に。

会話内容は自動的に文字起こしされ、テキストデータのチャット履歴として保存される。

なので後から会話を確認したいときは、履歴のテキストで確認することができる。

履歴をオフにしたままでは、音声会話ができない。

現時点では、履歴をオフにしている場合では、音声でのチャットができなくなっている。

そのため、誤って個人情報や会社の機密情報などを話してしまった場合などは、後から履歴を削除した方が無難かと思われる。

ChatGPTとのAIボイスチャット。


ChatGPTの音声を変えたいとき。

アプリの設定で音声を変更。

ChatGPTの音声は、下記の手順で変えることができる。

「ハンバーガーメニュー」 > 「ユーザー名」 へ。

左上の「ハンバーガーメニュー」を押して、メニューが開いたら画面下の「ユーザー名」を押す。

生成AIはモデルの進歩が速く、デザインや機能が変わっている場合があります。)

ChatGPTの設定の画像。ハンバーガーメニューから日本語に変更できる。
ChatGPTの設定の画像。ユーザー名をクリックする。

「設定(Settings)」 > 「音声(Voice)」へ進む。

「設定(Settings)」から「音声(Voice)」を押すと、 「音声を選択してください(Choose a voice)」、の画面となる。

ここで音声確認ができるので、気に入った音声を選択する。

ChatGPTの設定を行う画面。
ChatGPTの設定を行う画面。

「Choose a voice」 > 「Confirm」で設定完了。

最後に「Confirm」(確認する)を押すと、音声設定が完了。


パソコンからChatGPTと音声会話をしたいとき。

Voice Control for ChatGPT

Chromeの拡張機能を使用する。

パソコンで音声会話をしたいときは、Chromeの拡張機能に「Voice Control for ChatGPT」がある。

Chrome ウェブストア:Voice Control for ChatGPT

メリット。
  • 音声でテキストを入力できる。
  • 無料で使うことができる。
  • シンプルで使いやすい。
デメリット。
  • 音声だけで「メッセージの送信」ができない。なので、マウスやパッドでクリックする必要がある。
  • 拡張機能のオン・オフがないので、オフにしたい場合は削除する必要がある。
  • Chromeから削除する場合は、削除する理由を英語で聞かれる。(日本語対応がされていない。)

デスクトップ用のChatGPT。

ChatGPT公式アプリの登場。

GPT-4oの発表とともに、パソコン向けとして、OpenAI公式アプリのChatGPTが登場。

Mac版は現時点App Storeにはないが、ブラウザ版のChatGPTの右上からダウンロードができる。

Windows版は、年内に登場予定。


GPT-4oについて。

GPT-4oについてはこちらへまとめました。

関連:GPT-4o。ChatGPTと画像見ながら音声で会話?有料でも無料でも。

ChatGPTとの音声会話と、音声の変更方法。

以上、参考になれば幸いです。


Webデザインは実務数年、職業訓練校講師数年、フリーランス数年、計15年以上のキャリアがありますが、一気にがぁっと書いているので「です・ます調」ではありません。(元々はメモ書きでした。) 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ訂正いたします。 写真は主にUnsplashPixabayのフリー素材を利用させていただいております。その他の写真や動画もフリー素材やパブリックドメイン、もしくは自前のものを使用しております。

井川 宜久 / Norihisa Igawa
デザイナー、ディレクター、講師、コーチ / 井川宜久

AI 関連メモ。

ChatGPT 関連メモ。

DALL·E 関連メモ。

Sora 関連メモ。

Gemini 関連メモ。

Copilot、Bing 関連メモ。

Llama 関連メモ。

Claude 関連メモ。

Perplexity 関連メモ。


免責事項について

  • 記事ページ(Memosのページ)は当初は文字通りメモ書きでした。その後、修正や更新をしております。
  • 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ早急に対応いたします。
  • 一個人のポートフォリオサイトですので、万一損害・トラブル等が発生した場合でも、一切の責任を負いかねます。