概要
OpenAIは12月11日(現地時間)、最新のAIモデルファミリー「GPT-5.2」を発表した。CEO Sam Altmanが今月初めに社内で発出した「コードレッド」メモを受けてのリリースとなり、GoogleのGemini 3への対抗を意識した動きとなっている。
3つのモデル構成
GPT-5.2は以下の3つのバージョンで提供される:
Instant(インスタント)
- 高速応答に最適化
- 情報検索、文章作成、翻訳などの日常的なタスク向け
Thinking(シンキング)
- コーディング、数学、計画立案などの複雑な構造化作業に特化
- ステップバイステップの論理的推論が得意
Pro(プロ)
- 最高精度・信頼性を求める困難な問題向け
- より高品質な回答が必要な場面で使用
ベンチマーク結果
OpenAIは新たに「GDPval」というベンチマークを導入。44の職業にわたるプロフェッショナルな知識労働タスクを測定する。
- GPT-5.2 Thinking: 人間の専門家と同等以上のパフォーマンスを**70.9%**のタスクで達成
- Gemini 3 Pro: 同ベンチマークで53.3%
- エラー発生率は前世代比30%削減
投資銀行のジュニアアナリストが行うスプレッドシートモデリングタスクでは、GPT-5.1の59.1%から68.4%へと9.3%向上した。
競争の激化
リリースに際し、OpenAIのアプリケーション担当CEOであるFidji Simo氏は、GPT-5.2がGoogleへの対応として急いでリリースされたわけではないと主張。「これらのアップグレードは何ヶ月も前から開発されていた」と述べた。
一方で、AnthropicのClaude Opus 4.5はSWE-Bench Verifiedではコーディングベンチマークでより高いスコアを記録しているが、OpenAIはこのテストが実世界の使用を代表するものではないと反論している。
今後の展開
Simo氏は、ChatGPTの「アダルトモード」を2026年第1四半期にリリース予定であることも明らかにした。年齢予測モデルの精度向上を待っている状態だという。
GPT-5.2は有料ユーザーに順次展開され、開発者向けにはAPIでも利用可能となる。