この度、AIアシスタント「Claude 3.5 Sonnet」がさらに賢くなりましたので、主な改善点をお知らせいたします。
【Claude 3.5 Sonnetの進化したポイント】
■ コーディング性能の大幅な向上
* SWE-bench Verifiedスコアが33.4%から49.0%に向上し、公開モデル中最高性能を達成
* ソフトウェア開発プロセスにおける推論能力が約10%向上(GitLabによる検証)
* 複数ステップの開発プロセスを効率的に処理
■ ツール使用能力の強化
* TAU-benchにおける性能向上
* 小売分野:62.6%から69.2%に改善
* 航空分野:36.0%から46.0%に改善
* より複雑な多段階タスクの処理が可能に
※各数値は、標準的なテストによる評価結果です。数値が高いほど、より正確な処理が可能なことを示しています。
これらの機能向上により、より使いやすく、より正確なサポートを提供できるようになりました。ぜひ、進化したClaude 3.5 Sonnet(new)をお試しください。