OpenAIは本日、Spring Updateストリーミングイベントで「ChatGPT-4o」と呼ばれる大規模言語モデル(LLM)を発表しました。
OpenAIの最高技術責任者(CTO)であるMira Murati氏は、ChatGPT-4 LLMのリーチを拡大するため、ChatGPT-4oを無料で提供すると説明しています。CEOのSam Altman氏も、「無料版を含めて全てのChatGPT
ユーザーが利用可能です。これまでGPT-4クラスのモデルは、月額プランを支払っている人しか利用できませんでした。これは私たちのミッションにとって重要なことです」とこの発表を補足しています。
it is available to all ChatGPT users, including on the free plan! so far, GPT-4 class models have only been available to people who pay a monthly subscription. this is important to our mission; we want to put great AI tools in the hands of everyone.
— Sam Altman (@sama) May 13, 2024
ChatGPT-4oは、英語とコードのテキストでGPT-4 Turboの性能に匹敵し、非英語言語のテキストでは大幅に改善され、APIははるかに高速で50%安価だとされています。
視覚と音声の理解で特に優れていて、ライブデモでは、OpenAIのチームメンバーが自然な音声コマンドでChatGPT-4oとチャットしたり、スマートフォンのカメラを通して、数学の方程式を認識し、AIが音声で方程式を説明する様子が確認できます。
It can respond to audio inputs in as little as 232 milliseconds, with an average of 320 milliseconds, which is similar to human response time(opens in a new window) in a conversation. It matches GPT-4 Turbo performance on text in English and code, with significant improvement on text in non-English languages, while also being much faster and 50% cheaper in the API. GPT-4o is especially better at vision and audio understanding compared to existing models.
音声入力に対して最短232ミリ秒、平均320ミリ秒で応答することができ、これは会話における人間の応答時間(新しいウィンドウで開きます)に似ています。GPT-4oは、英語とコードのテキストでGPT-4 Turboの性能に匹敵し、非英語言語のテキストでは大幅に改善され、APIでははるかに高速で50%安価です。GPT-4oは、既存のモデルと比較して、視覚と音声の理解において特に優れています。
さらに無料版のユーザーを含め、新しいツールの提供が始まります。
コンピュータ上で行っているあらゆることにシームレスに統合できるように設計された、macOS用の新しいChatGPTデスクトップアプリがリリースされます。簡単なキーボードショートカット(Option + Space)で、即座にChatGPTに質問することができ、アプリ内で直接スクリーンショットを撮り、議論することも可能となります。
Mac用デスクトップアプリは本日よりまずPlusユーザー向けに配布が始まり、今後数週間でより広範囲に展開される予定です(無料版ユーザーも利用可能とのこと)。今年後半にはWindows版もリリースされる予定です。