2023年3月9日に開催されたAIキックオフイベントで、ドイツMicrosoftのCTOであるAndreas Braun氏が、「GPT-4」が来週にも登場する予定だと言及した事がわかりました(gHacks)。
GPT-4はマルチモーダルモデルとなるそうで、ユーザーはジェスチャー、音声、タッチ、テキストなど異なる出力・入力モードを使ってシステムと対話することができるようになると見込まれています。
Microsoftが3月初めに発表したマルチモーダル言語モデル「Kosmos-1」は、言葉だけでなく画像にも対応し、画像に説明を付けたり、画像に関連した質問に回答することができました。
AIによって仕事が奪われるのではないかとの心配に対し、Braun氏はAIは仕事を代替するものではなく、繰り返し行われる作業を別の方法で支援するものであると理解を求めています。
GPT-4のユースケースとしては、例えばコールセンターで、通話の録音をテキストとして保存しておけば、内容を要約したり手入力したりする必要がなくなるとの事例があげられています。
また、一部の報道では、GPT-4はBing検索サービスに組み込まれるとも伝えられています。