株式会社オブライト

「LLM」のコラム

1件の記事

Claude Sonnet 5 徹底解説 — 2026年6月30日 Anthropic 公開、SWE-bench Verified 92.4% で Opus 4.6 超え（+12pt） 1M コンテキスト・OSWorld-Verified 88.3% で人間専門家 72.4% を上回り、GPQA Diamond 96.2% / ARC-AGI-2 84.7% Introductory $2/$10 per M tok（〜2026-08-31）→ Standard $3/$15、Claude Free / Pro / Claude Code Pro のデフォルトモデルに

**Anthropic が2026年6月30日に Claude Sonnet 5 を公開** しました（[公式リリース](https://www.anthropic.com/news/claude-sonnet-5) / [System Card](https://www.anthropic.com/claude-sonnet-5-system-card) / [TechCrunch 報道](https://techcrunch.com/2026/06/30/anthropic-launches-claude-sonnet-5-as-a-cheaper-way-to-run-agents/) / [VentureBeat](https://venturebeat.com/technology/anthropic-launches-claude-sonnet-5-at-a-steep-discount-to-its-top-model-as-the-company-races-toward-a-blockbuster-ipo)）。 **最大の衝撃: 中位 Sonnet 階層で Opus 4.6 を 12pt 抜き** — **SWE-bench Verified 92.4%**（Opus 4.6 は 80.8%）、**OSWorld-Verified 88.3%**（人間専門家ベースライン 72.4% を 15.9pt 上回る）、**GPQA Diamond 96.2%**（[Gemini 3.1 Pro](../columns/local-llm-landscape-2026-june-update) 94.3% 超え）、**ARC-AGI-2 84.7%**（Gemini 3.1 Pro 77.1% を 7.6pt 超え）。**1M トークンのコンテキストウィンドウ**（Opus 4.8 と同等）、出力上限 128K。 **Anthropic IPO 直前の戦略的価格設定**: **2026年8月31日まで Introductory $2 / M input・$10 / M output**、以降 Standard **$3 / $15**（[Sonnet 4.6](../columns/claude-agent-sdk-credit-billing-change-2026-06-15) 同価格）。**新トークナイザで同入力が ~1.0–1.35× トークン換算** される点に注意。GPT-5.5・Gemini 3.1 Pro・自社 Opus 4.8 全てを価格で下回る。 **default model 化**: **claude.ai Free / Pro のデフォルト**、**Claude Code Pro のデフォルト**、API（`claude-sonnet-5`）/ AWS Bedrock / Vertex AI / Managed Agents 全配信チャネルで利用可。Zapier の Daniel Shepard 氏「**以前の Sonnet は途中で止まっていたタスクを Sonnet 5 は最後まで完了させる**」と評価（TechCrunch）。 **安全性**: Sonnet 4.6 より misalignment 低下、サイバー攻撃safeguards デフォルト有効、Firefox 脆弱性作成テストで **0.0% 成功率**（実用悪用不可）。 **戦略文脈**: agentic 能力は業界で「table stakes」化、競争軸は **コスト効率・信頼性・自律タスク完遂** に移行。Anthropic は IPO に向けて Opus 階層と Sonnet 階層の境界を破壊して **大量生産ワークロードでのコストパフォーマンス** を取りに来た格好。

Claude Sonnet 5AnthropicLLM