アントロピックは、AI騒動が続く中でClaude 2を発表しました

アントロピックは、AI騒動中にClaude 2を発表しました

人類中心主義(Anthropic)は、人工知能(AI)と「公益」を目指す企業で、2023年7月11日にClaude 2を発表しました。これは、成長著しい生成型AIセクターにおけるさらなるマイルストーンとなる一年間の進歩の中での出来事です。

クロード2をご紹介します!最新モデルは、コーディング、数学、論理思考のパフォーマンスが向上しています。より長い回答を生成することができ、新しい公開ベータウェブサイト(https://t.co/uLbS2JNczH)で、米国と英国でご利用いただけます。 pic.twitter.com/jSkvbXnqLd

— 人類中心主義(@AnthropicAI)2023年7月11日

企業のブログ記事によると、Claude 2はほぼすべての測定カテゴリで改善が見られます。前任者との最も注目すべき違いの一つは、研究者が自分たちの仕事について話す方法です。

Claude 2を発表するブログ記事では、従来の機械学習のベンチマークや類似モデルとの計算スコアの言及はありません。代わりに、Anthropicは実世界の知識、スキル、問題解決テストを代表する数々のテストでClaudeとClaude 2を直接対決させました。

Anthropicによれば、Claude 2は知識、コーディング、その他の試験で前任者に勝利し、人間の平均にも十分なスコアを獲得しています:

「大学院進学を希望する学生と比較した場合、Claude 2はGREの読解・ライティング試験で90%以上のパーセンタイル、そして数量的推論では中央値の応募者と同程度のスコアを獲得しています。」

多くの専門家は、人間とAIのテスト受験者の比較は、人間の認知推論の性質や大規模な言語モデルのトレーニングデータセットにテスト情報が含まれている可能性などの理由から、効果がないと考えています。言い換えれば、人間向けに設計されたテストは、AIの推論能力を「テスト」したり、実際の知識やスキルを適切に示すデモンストレーションを提供したりすることができないかもしれません。

Claude 2の発表に伴い、Anthropicはアメリカとイギリスのユーザーに対して、ウェブベースの「Talk to Claude」インターフェースのベータ版を公開しました。

関連記事:AIプロンプトエンジニアとしての高収入の仕事を見つける方法

Cointelegraphは、新しいバージョンの簡単なテストを実施しましたが、改善点はすぐに目に見えました。Claude 2は、Cointelegraphのプロンプトに対して迅速かつ明瞭な回答を提供しました。

Chat with Claude 2. Source: Anthropic

Anthropicによれば、新モデルのプロンプト制限は10万トークン、または約7.5万語に相当します。サイトのユーザーインターフェースによれば、ユーザーはPDF、TXT、CSVなどの似たようなドキュメントを解析するためにアップロードすることができますが、Cointelegraphの限られたテストではこの機能は機能しませんでした。

この記事をNFTとして収集し、暗号スペースでの独立したジャーナリズムをサポートすることで、歴史の一瞬を保存しましょう。