Anthropicの最も高性能なモデル
Anthropicは木曜日、フラッグシップモデルの大幅アップグレードとなるClaude Opus 4.6をリリースした。ほぼすべてのベンチマークで改善を達成し、Opusラインとして初の100万トークンのコンテキストウィンドウ(ベータ)と最大128Kトークンの出力を実現している。
価格は入力/出力100万トークンあたり$5/$25で据え置き。
主な能力
Claude Opus 4.6は、エージェントコーディング、多分野推論、ナレッジワーク、エージェント検索の各評価で最先端の結果を達成している。主な改善点:
- 慎重な計画立案 — 複雑な要求を具体的なステップに分解し、最後まで遂行
- 長時間のエージェントタスク持続 — 長時間の作業セッションでも安定して動作
- 大規模コードベースでの信頼性 — 巨大なコードベース内で確実に動作
- 自己エラー検出 — 自身のミスを発見し修正
- Finance Agentベンチマーク首位 — 金融アナリストタスクでトップスコア
Notion、GitHub、Shopify、Boxなどのエンタープライズ企業がモデルの能力を高く評価している。GitHubのCPO Mario Rodriguez氏は、複雑なマルチステップのコーディング作業で成果を上げ、長期的なタスクの実現を可能にすると述べた。
エージェントチームとClaude Code
主要な新機能として、Claude Codeでのエージェントチームが導入された。複数のClaudeインスタンスがタスクを並列で処理できるようになり、プロジェクトの異なる側面を複数のエージェントが同時に取り組むという協調AIワークモデルを実現している。
また、PowerPointへの直接統合も実装され、アプリケーション内でClaudeのリアルタイム支援を受けながらプレゼンテーションを作成できるようになった。
500以上のゼロデイ脆弱性を発見
その能力の顕著な実証として、Claude Opus 4.6はGhostscript、OpenSC、CGIFなどの主要オープンソースライブラリで500以上の未知の重大セキュリティ脆弱性を発見した。
Anthropicはこれを、AIがサイバーセキュリティ防御を有意に強化できる証拠として位置づけるとともに、悪用防止のための新しいサイバー特化型セーフガードプローブを導入。モデルはAnthropicのASL-3 Standardの下でデプロイされ、その高度な能力を反映している。
「バイブワーキング」の時代
Anthropicのエンタープライズ向けプロダクト責任者Scott White氏は、この変化を「バイブワーキング」への移行と表現した。プロフェッショナルが高いレベルでやりたいことを説明すれば、Claudeがドキュメント、スプレッドシート、プレゼンテーション、分析にわたって実行を担うという働き方だ。
Claude Opus 4.6はclaude.ai、Anthropic API、Claude Code、AWS、Google Cloud、Azure、GitHub Copilot、Cursor、Kiroを含むすべての主要クラウドプラットフォームで利用可能。