OpenAI o1の使い方。考えてから答える新しいChatGPTモデル。 / いがわ

.

Memo

OpenAI o1-preview。新しいChatGPTモデル。

OpenAI o1-preview。考えてから答えるChatGPT。

考えてから答えるAI ChatGPT o1モデル。

o1-previewとo1-mini。

これまでのような「反射的」に、「反応」で答えるようなAIではなく、いったん「考えて」、「推論して」から答えるAIモデルが登場。

ひとの場合でも反射的に答えるより真剣に考えてから答える方が信頼感があるように、AIの仕組みにも「考える時間」が設けられる。

OpenAIのテストでは、この「考えること」により、数学や科学の答え、コーディングの質が上がったという。

数学オリンピックの予選試験で高得点。

国際数学のオリンピック(IMO)の予選試験では、GPT-4oの13%から大きく向上し、83%のスコアが出ているとのこと。

3桁の掛け算も間違いだらけだった初期のChatGPTから大幅に改良されている。

物理学、生物学、化学の問題のベンチマーク (GPQA) でも、人間の博士レベルを超える精度と発表されている。

後日追記)
  • 9.11と9.9の比較問題はまだ苦手の模様。
  • IQテストで120という情報は信憑性に欠けている。(ページ下部に追記あり。)

OpenAI o1。考えてから答えるAI。

引用元:OpenAI

まずは有料ユーザーから。そして無料ユーザーへ。

有料ユーザーから利用ができ、まずはChatGPT PlusおよびTeamユーザーアクセス可能。そして、ChatGPT EnterpriseとEduユーザー、その後におそらく小型モデルの「o1-mini」が無料ユーザーへ提供される。

無料ユーザーへの提供時期は未定。)

OpenAI o1はまだプレビュー(o1-preview)の段階なので、そのうち「preview」が取れて「o1」となると思われる。


OpenAI o1(previewとmini)の使い方。

ChatGPT PlusおよびTeamユーザー向け。

OpenAI o1の使い方。

引用元:OpenAI

モデル選択のプルダウンメニューに「o1-preview」と「o1-mini」が自動追加。

ChatGPTのモデル選択のプルダウンメニューに、「o1-preview」と「o1-mini」が自動追加される。

モデル選択で「o1-preview」もしくは「o1-mini」を選択。

使い方に特別なことは必要なく、モデル選択メニューから「o1-preview」を選択すればOK。

メッセージ入力欄からチャットを始める。

これまで通り、メッセージ入力欄からチャットができる。

目的に応じた使い分け。

画像やファイルのアップロードなどは未対応なので、用途に応じてモデルを切り替える。

「o1」モデルは「推論」モデルであり、現時点では使用回数に制限(レート制限)もある。

日常的なことは4oや4o-miniを利用し、推論的なことはo1を利用する、という感じで使い分けると良いかもしれない。

o1モデル利用のレート制限。

週ごとにレート制限があり、o1-previewは30メッセージ、o1-miniは50メッセージになるとのこと。

1時間や1日ではなく、1週間あたり。)

2024.09.17 追記)

ChatGPT PlusおよびTeamユーザーへの制限回数が増加。

  • o1-mini:1日あたり50メッセージ。
  • o1-preview:1週あたり50メッセージ。

o1モデルとチャットをしているイメージ。

プロンプトの違い。

GPT-4oなどと違い、そもそもが「推論モデル」。

シンプルかつ直接的なプロンプトが良いそう。

「ステップ・バイ・ステップで」や「段階的に考えて」というようなプロンプトは、思考の連鎖を促すことになるため、避けてくださいとのこと。

参照元:OpenAI Platform

IQの違い。
o1モデルはIQテストで120?

OpenAIはそのような発表をしておらず、査読された論文ベースでの情報でもない。

仮に人類の上位2%と言われているようなMENSAのIQテストであれば、120は突出した数字ではない。

IQテストはAI向けのテストではない。

MENSAのような上位2%と聞くとすごそうに感じるかもしれないが、50人中1人はいるということにもなる。同級生(同学年)が100人いた場合、2人はいるという数字。

実際に同級生の中にいるという意味ではなく、あくまでもパーセンテージとして。)

そもそもIQテストは、AIの能力を測る目的で作られたものではない。

IQテストは知能を図るひとつの側面。

IQテストは人間の知能を図るたくさんの中のひとつの側面であり、それがすべてではない。

また、「IQテスト用の勉強」が必要となるため、トップレベルの学歴でもIQテストのスコアが低かったり、トップベルの学歴がなくてもスコアが高いひとがいる。

20くらいのIQの違いであればコミュニケーションは取れるはずで、実際にテレビなど公の場に出ているひともいる。

IQが高くなるほど少数となるので、逆差別につながる恐れもある。

OpenAI o1の使い方。考えてから答えるChatGPTモデル。

ChatGPT EnterpriseとEduユーザー向けのリリースについて。

翌週(2024.09.15)からChatGPT EnterpriseとEduユーザーもアクセス可能になる予定。

使用方法は変わらず、自動追加されたo1モデルを選択するだけとなる。

特にウェイティングリストなどはなし。)

ChatGPT Freeユーザー向けのリリースについて。

リリース時期は未定。

これまでの流れからすると、ゆくゆくは、GPT-4oとGPT-4o miniのような感じとなるのかもしれない。

無料ユーザーでも制限付きで使用ができるような。)

ChatGPT o1モデルを覗く猫ちゃん。

以上、参考になれば幸いです。


Webデザインは実務数年、職業訓練校講師数年、フリーランス数年、計15年以上のキャリアがありますが、一気にがぁっと書いているので「です・ます調」ではありません。(元々はメモ書きでした。) 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ訂正いたします。 写真は主にUnsplashPixabayのフリー素材を利用させていただいております。その他の写真や動画もフリー素材やパブリックドメイン、もしくは自前のものを使用しております。

井川 宜久 / Norihisa Igawa
デザイナー、ディレクター、講師、コーチ / 井川宜久

AI 関連メモ。

ChatGPT 関連メモ。

DALL·E 関連メモ。

Sora 関連メモ。

Gemini 関連メモ。

Copilot、Bing 関連メモ。

Llama 関連メモ。

Claude 関連メモ。

Perplexity 関連メモ。


免責事項について

  • 記事ページ(Memosのページ)は当初は文字通りメモ書きでした。その後、修正や更新をしております。
  • 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ早急に対応いたします。
  • 一個人のポートフォリオサイトですので、万一損害・トラブル等が発生した場合でも、一切の責任を負いかねます。