「ChatGPTは今、話すこと、聞くこと、画像を見ることができます」

ChatGPTは会話、質問、画像閲覧が可能です

オープンAIは、ChatGPTシステムのためのビジョン対応モデルであるGPT-4Vと、マルチモーダルな会話モードを発表したことで、生成型人工知能(AI)の領域がますます盛り上がっています。

2023年9月25日に発表された新しいアップグレードにより、ChatGPTユーザーはチャットボットとの対話を行うことができます。ChatGPTを駆動するモデルであるGPT-3.5とGPT-4は、プレーンな自然言語の発話クエリを理解し、5つの異なる声で応答することができるようになりました。

ChatGPTは今や見ることも、聞くことも、話すこともできます。次の2週間で展開されるアップグレードにより、PlusユーザーはChatGPT(iOSおよびAndroid)との音声対話を行うことができ、またすべてのプラットフォームで会話に画像を含めることができるようになります。 https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb

— OpenAI (@OpenAI) September 25, 2023

OpenAIのブログ投稿によると、この新しいマルチモーダルインターフェースにより、ユーザーはChatGPTと新しい方法で対話することができます。

「旅行中にランドマークの写真を撮影し、それについてのライブ会話をすることができます。自宅で冷蔵庫とパントリーの写真を撮影して、夕食に何を作るかを判断することができます(ステップバイステップのレシピのために追加の質問をすることもできます)。夕食後は、子供の数学の問題を写真を撮って、問題集を囲んで、ヒントを共有することでサポートすることができます。」

アップグレード版のChatGPTは、次の2週間以内にモバイルプラットフォームのPlusおよびEnterpriseユーザーに展開され、その後、開発者や他のユーザーにも「まもなく」アクセスが提供されます。

ChatGPTのマルチモーダルなアップグレードは、OpenAIの最も先進的な画像生成システムであるDALL-E 3の発売に続いています。

OpenAIによると、DALL-E 3も自然言語処理を統合しています。これにより、ユーザーはモデルに話しかけて結果を微調整したり、画像のプロンプト作成のためにChatGPTを統合したりすることができます。

他のAIのニュースでは、OpenAIの競合企業であるAnthropicが9月25日にAmazonと提携したことが発表されました。Cointelegraphが報じたところによると、Amazonは最大40億ドルを投資し、クラウドサービスとハードウェアアクセスを提供する予定です。引き換えに、AnthropicはAmazonの基盤となるAIモデルであるBedrockへの強化サポートを提供し、「ビジネス向けの安全なモデルのカスタマイズと微調整」も行うと述べました。

関連記事:Coinbase CEOはAI規制に警鐘を鳴らし、分散化を求める