株式会社オブライト

「LLM」のコラム

1件の記事

AI2026-07-01
Claude Sonnet 5 徹底解説 — 2026年6月30日 Anthropic 公開、SWE-bench Verified 92.4% で Opus 4.6 超え(+12pt) 1M コンテキスト・OSWorld-Verified 88.3% で人間専門家 72.4% を上回り、GPQA Diamond 96.2% / ARC-AGI-2 84.7% Introductory $2/$10 per M tok(〜2026-08-31)→ Standard $3/$15、Claude Free / Pro / Claude Code Pro のデフォルトモデルに
**Anthropic が2026年6月30日に Claude Sonnet 5 を公開** しました([公式リリース](https://www.anthropic.com/news/claude-sonnet-5) / [System Card](https://www.anthropic.com/claude-sonnet-5-system-card) / [TechCrunch 報道](https://techcrunch.com/2026/06/30/anthropic-launches-claude-sonnet-5-as-a-cheaper-way-to-run-agents/) / [VentureBeat](https://venturebeat.com/technology/anthropic-launches-claude-sonnet-5-at-a-steep-discount-to-its-top-model-as-the-company-races-toward-a-blockbuster-ipo))。 **最大の衝撃: 中位 Sonnet 階層で Opus 4.6 を 12pt 抜き** — **SWE-bench Verified 92.4%**(Opus 4.6 は 80.8%)、**OSWorld-Verified 88.3%**(人間専門家ベースライン 72.4% を 15.9pt 上回る)、**GPQA Diamond 96.2%**([Gemini 3.1 Pro](../columns/local-llm-landscape-2026-june-update) 94.3% 超え)、**ARC-AGI-2 84.7%**(Gemini 3.1 Pro 77.1% を 7.6pt 超え)。**1M トークンのコンテキストウィンドウ**(Opus 4.8 と同等)、出力上限 128K。 **Anthropic IPO 直前の戦略的価格設定**: **2026年8月31日まで Introductory $2 / M input・$10 / M output**、以降 Standard **$3 / $15**([Sonnet 4.6](../columns/claude-agent-sdk-credit-billing-change-2026-06-15) 同価格)。**新トークナイザで同入力が ~1.0–1.35× トークン換算** される点に注意。GPT-5.5・Gemini 3.1 Pro・自社 Opus 4.8 全てを価格で下回る。 **default model 化**: **claude.ai Free / Pro のデフォルト**、**Claude Code Pro のデフォルト**、API(`claude-sonnet-5`)/ AWS Bedrock / Vertex AI / Managed Agents 全配信チャネルで利用可。Zapier の Daniel Shepard 氏「**以前の Sonnet は途中で止まっていたタスクを Sonnet 5 は最後まで完了させる**」と評価(TechCrunch)。 **安全性**: Sonnet 4.6 より misalignment 低下、サイバー攻撃safeguards デフォルト有効、Firefox 脆弱性作成テストで **0.0% 成功率**(実用悪用不可)。 **戦略文脈**: agentic 能力は業界で「table stakes」化、競争軸は **コスト効率・信頼性・自律タスク完遂** に移行。Anthropic は IPO に向けて Opus 階層と Sonnet 階層の境界を破壊して **大量生産ワークロードでのコストパフォーマンス** を取りに来た格好。
Claude Sonnet 5AnthropicLLM