株式会社オブライト

「Model Routing」のコラム

1件の記事

Sakana Fugu 徹底解説 — 2026年6月22日 Sakana AI が公開した『LLM を呼び出すために学習された LLM』、GPT-5.5 / Claude Opus 4.8 / Gemini 3.1 Pro を内部で動的オーケストレーション、ICLR 2026 採択の TRINITY / Conductor が基盤、SWE-Bench Pro 73.7 で Opus 4.8 超え主張、Fugu / Fugu Ultra 2モデル + サブスク $20/$100/$200、EU/EEA は GDPR 対応中で提供外

**Sakana AI が2026年6月22日に Sakana Fugu を正式リリース** しました（[公式 fugu-release](https://sakana.ai/fugu-release/) / [製品ページ](https://sakana.ai/fugu/) / [gihyo.jp](https://gihyo.jp/article/2026/06/sakana-fugu) / [GIGAZINE](https://gigazine.net/gsc_news/en/20260622-sakana-fugu-multi-agent-system-ai)）。**従来想定される『次世代日本語 LLM』ではなく、複数 LLM を内部で動的にオーケストレーションする『指揮者』型モデル** で、ユーザーのクエリを受けると Fugu 本体が (1) 自前で解ける場合は直接応答、(2) 複雑なマルチステップタスクは **GPT-5.5 / Claude Opus 4.8 / Gemini 3.1 Pro** などのエージェントプールから動的にモデルを選定・委任・検証・統合します。**学術基盤** は ICLR 2026 採択論文の **TRINITY（進化的に最適化された LLM 協調器、Thinker/Worker/Verifier 役割割当）** と **Conductor（強化学習により自然言語での協調戦略を発見）** の2本。**2モデル提供**: 日常タスク・低レイテンシ用 **Fugu** と最難問・深い協調用 **Fugu Ultra**（プール構成固定で除外不可）。**ベンチマーク**: **SWE-Bench Pro 73.7** で Claude Opus 4.8 等のフロンティアモデル超え（XenoSpectrum 報道）、Terminal-Bench 2.1 で Anthropic 最新超え、Charxiv Reasoning で Claude Mythos Preview 超え、ただし Humanity is Last Exam (HLE) では劣後。公式表現は「Fable 5 / Mythos Preview と shoulder-to-shoulder」で慎重。**価格**: Fugu Ultra **入力 $5/M（標準）・$10/M（272K 超）、出力 $30/M・$45/M（272K 超）**、サブスクは **Standard $20 / Pro $100 / Max $200 per month**（Fugu/Ultra 両方利用可）、エンタープライズは使用量ベース。**OpenAI 互換 API**（console.sakana.ai）。**EU/EEA は GDPR 準拠作業中で提供外**、日本リージョン利用可。**戦略的価値は性能ではなく構造的レジリエンス** — 単一ベンダー依存からの脱却、輸出規制リスク分散（Sakana Marlin 解説の Fable 5 輸出規制 precedent と地続き）。BuildFastWithAI は「export controls を回避するモデル」と評価、Clanker Cloud は「Model Orchestration Is Becoming the Product」と表現。**Fugu 本体パラメータ数・日本語ベンチ（ELYZA / JMMLU / JMT-Bench）数値・David Ha / Llion Jones 個別発言は未確認**で、API 薄ラッパー批判の余地と独立検証は今後の論点。

Sakana AISakana FuguMulti-Agent Orchestration