本文へスキップ

株式会社オブライト

コラム

SEO・Web開発・IT技術に関するお役立ち情報

344件

Sakana Fugu 徹底解説 — 2026年6月22日 Sakana AI が公開した『LLM を呼び出すために学習された LLM』、GPT-5.5 / Claude Opus 4.8 / Gemini 3.1 Pro を内部で動的オーケストレーション、ICLR 2026 採択の TRINITY / Conductor が基盤、SWE-Bench Pro 73.7 で Opus 4.8 超え主張、Fugu / Fugu Ultra 2モデル + サブスク $20/$100/$200、EU/EEA は GDPR 対応中で提供外

Sakana AI が2026年6月22日に Sakana Fugu を正式リリース しました（公式 fugu-release / 製品ページ / gihyo.jp / GIGAZINE）。従来想定される『次世代日本語 LLM』ではなく、複数 LLM を内部で動的にオーケストレーションする『指揮者』型モデル で、ユーザーのクエリを受けると Fugu 本体が (1) 自前で解ける場合は直接応答、(2) 複雑なマルチステップタスクは GPT-5.5 / Claude Opus 4.8 / Gemini 3.1 Pro などのエージェントプールから動的にモデルを選定・委任・検証・統合します。学術基盤 は ICLR 2026 採択論文の TRINITY（進化的に最適化された LLM 協調器、Thinker/Worker/Verifier 役割割当） と Conductor（強化学習により自然言語での協調戦略を発見） の2本。2モデル提供: 日常タスク・低レイテンシ用 Fugu と最難問・深い協調用 Fugu Ultra（プール構成固定で除外不可）。ベンチマーク: SWE-Bench Pro 73.7 で Claude Opus 4.8 等のフロンティアモデル超え（XenoSpectrum 報道）、Terminal-Bench 2.1 で Anthropic 最新超え、Charxiv Reasoning で Claude Mythos Preview 超え、ただし Humanity is Last Exam (HLE) では劣後。公式表現は「Fable 5 / Mythos Preview と shoulder-to-shoulder」で慎重。価格: Fugu Ultra 入力 $5/M（標準）・$10/M（272K 超）、出力 $30/M・$45/M（272K 超）、サブスクは Standard $20 / Pro $100 / Max $200 per month（Fugu/Ultra 両方利用可）、エンタープライズは使用量ベース。OpenAI 互換 API（console.sakana.ai）。EU/EEA は GDPR 準拠作業中で提供外、日本リージョン利用可。戦略的価値は性能ではなく構造的レジリエンス — 単一ベンダー依存からの脱却、輸出規制リスク分散（Sakana Marlin 解説の Fable 5 輸出規制 precedent と地続き）。BuildFastWithAI は「export controls を回避するモデル」と評価、Clanker Cloud は「Model Orchestration Is Becoming the Product」と表現。Fugu 本体パラメータ数・日本語ベンチ（ELYZA / JMMLU / JMT-Bench）数値・David Ha / Llion Jones 個別発言は未確認で、API 薄ラッパー批判の余地と独立検証は今後の論点。

Sakana AISakana FuguMulti-Agent Orchestration+4

【2026-06-16 追記：方針一時停止】Claude Agent SDK クレジット分離は施行直前に撤回 — 6/15 公式 Help Center に Update 注記、Pro $20 / Max 5x $100 / Max 20x $200 のクレジット配布も停止、第三者ツールはサブスク通常枠で再び動く

2026年6月16日追記：Anthropic は 2026年6月15日施行予定だった Claude Agent SDK / claude -p / GitHub Actions / 第三者アプリ（OpenClaw / Zed / Conductor 等）のサブスク枠切り離し方針を、施行当日（6/15）に一時停止（pause）しました。公式 Help Center 記事冒頭に "Update June 15: We are pausing the changes to Claude Agent SDK usage described below. For now, nothing has changed: Claude Agent SDK, claude -p, and third-party app usage still draw from your subscription is usage limits. The previously announced monthly credit, which would have been available to eligible claimants in connection with these changes, isn it available. We are working to update the plan to better support how users build with Claude subscriptions. When we have an update, we will share it before anything takes effect." と追記。事前 claim されていた月次クレジット（Pro $20 / Max 5x $100 / Max 20x $200 / Team $20-100 / Enterprise $200）は配布されず無効化。Claude Agent SDK / claude -p / 第三者アプリは 再びサブスク通常利用枠から消費 されます。完全撤回ではなく一時停止 とされ、Anthropic は「プランを更新する作業中、次の発表は実施前に行う」とのみコメント。背景には Magna Capax の試算で実 API 換算 12〜175 倍の値上げに相当との分析、Anthropic 社員 Lydia Hallie の X 投稿に Community Notes が短時間で付与、Reddit r/ClaudeAI・HN・The New Stack などでの大規模反発がありました。Anthropic としては2026年に入って 3度目の同種撤回（1月 OAuth ブロック → 数日で撤回、4月4日第三者エージェント禁止 → 24時間以内に撤回、5月14日妥協案クレジットプール → 6月15日施行当日に一時停止）です。本コラムは当初の発表内容を保存しつつ、撤回の詳細・タイムライン・実務上の運用変更点・「Extra Usage 自動課金をオフにする」セクションの現状有効性を率直に整理しています。

AnthropicClaudeClaude Code+4

Sakana AI Marlin 完全解説 — 日本発「仮想CSO」型ウルトラ深層リサーチエージェントの全貌

2026年6月15日に正式商用リリースされたSakana AIの初商用製品『Marlin』は、LLMではなく自律型リサーチエージェントだ。AB-MCTS（適応分岐モンテカルロ木探索）とOpenAI o4-mini・Google Gemini 2.5 Pro・DeepSeek R1-0528のマルチLLM協調を組み合わせ、1タスクあたり最大約8時間稼働して数十〜100ページ超のレポートとエグゼクティブスライドを自律生成する。金融機関・事業会社・コンサル・シンクタンク向けに設計された戦略立案支援ツールであり、OpenAI Deep ResearchやGemini Deep Researchとは用途・設計思想が根本的に異なる。本稿ではアーキテクチャから価格体系、競合比較、日本企業視点での意義まで徹底解説する。

Sakana AIMarlinUltra Deep Research+4

Claude Fable 5・Mythos 5が米政府の輸出規制指令で突然停止――リリース3日後の強制無効化とその影響

2026年6月12日17時21分（米東部時間）、Anthropicは米商務省・産業安全保障局（BIS）から輸出規制指令を受け、Claude Fable 5およびMythos 5を全ユーザー向けに即時停止した。リリースからわずか3日後の強制措置であり、商業展開済みのフロンティアAIモデルに対して米連邦政府が直接介入した初の公知事例とされる。本稿では規制の法的性質、政府の根拠とAnthropicの反論、影響範囲（API・Bedrock・Vertex）、代替モデルの選択肢、日本企業への実務的含意を徹底解説する。

AnthropicClaude Fable 5Claude Mythos 5+4

Kimi K2.7-Code 徹底解説 — Moonshot AI が2026年6月12日に公開したコーディング特化 1T MoE オープン重みモデル、Modified MIT・$0.95/$4.00・256K context、ただし日本企業はデータ越境とベンチ独立検証未確立の2大論点に注意

Moonshot AI（北京）が2026年6月12日に公開したコーディング特化新フラッグシップ Kimi K2.7-Code を、Hugging Face モデルカード・MarkTechPost・VentureBeatを一次ソースに整理。1T 総パラメータ / 32B アクティブ MoE（384 expert / 8 active + 1 shared）、256K コンテキスト、MoonViT ビジョンエンコーダ400M、INT4 ネイティブ、思考モード強制有効。Modified MIT License（月間1億 MAU または $20M MRR 超でのみ Kimi K2 表示義務）、API は 入力 $0.95 / キャッシュヒット $0.19 / 出力 $4.00 per 1M トークン（Claude Opus 4.8 の出力単価約1/18）。OpenAI 互換 + Anthropic 互換 API で Claude Code / Cursor / Aider / Cline / cmux に即組込可能。K2.6 比でベンチ +21.8%、思考トークン -30% と Moonshot 自社主張、ただし 公式ベンチがすべて自社プロプライエタリで SWE-bench Verified / Pro / FrontierCode の独立検証スコアは2026年6月15日時点で未公開（VentureBeat 批判）。日本企業視点では (1) api.moonshot.cn および Singapore 子会社経由の api.moonshot.ai ともに中国国家情報法第7条の compelled-disclosure リスク（2025年2月 PPC DeepSeek 注意喚起・デジタル庁事務連絡の precedent）、(2) Hugging Face セルフホスト（≥4-8 H100 / INT4 595GB）が Mizuho / Lion の Qwen 国内ファインチューン precedent パターンに沿った唯一の確実解という2大論点を率直に整理しています。

Moonshot AIKimi K2.7-CodeOpen Weight LLM+4

DiffusionGemma 徹底解説 — Google DeepMind が2026年6月10日に公開した『業界初のオープン重み大規模テキスト拡散 LLM』、Gemma 4 26B (A4B MoE) と同バックボーンで AR 版比最大4倍速、Apache 2.0、品質は AR に劣るという公式明言まで

Google DeepMind が2026年6月10日に NVIDIA との同時アナウンスで公開した DiffusionGemma（google/diffusiongemma-26B-A4B-it、25.2B 総 / 3.8B アクティブ MoE）を、Google 公式ブログ・ai.google.dev モデルカード・Hugging Face・NVIDIA 公式を一次ソースに整理。自己回帰（AR）モデルが左から右へ1トークンずつ生成するのに対し、Diffusion 言語モデル（DLM）はマスク／ノイズに満たされた256トークンキャンバスを並列に脱ノイズして文章へ変換する。1 forward あたり15-20トークン確定、最大48 denoising steps、H100 で 1,000+ tok/sec、RTX 5090 で 700+ tok/sec、AR 版 Gemma 4 比約 3.5-4 倍。一方で MMLU Pro 77.6 vs 82.6、GPQA 73.2 vs 82.3、MMMU Pro 54.3 vs 73.8 と公式は AR 版に対する 品質劣後を率直に明言。Apache 2.0、Hugging Face / Vertex AI / NVIDIA NIM 提供、業界初のオープン重み大規模拡散 LLM。日本企業のオンプレ社内エージェント・コード補完・低レイテンシ業務での意義と、Mercury（Inception Labs）/ LLaDA / Gemini Diffusion との位置づけまで整理しています。

Google DeepMindGemma 4DiffusionGemma+5

Cognition AI の FrontierCode 徹底解説——「マージ可能か」を問う新世代コーディング AI ベンチマーク

2026年6月8日、Cognition AI が発表した FrontierCode は製品ではなくコーディング AI 評価ベンチマーク。「テストが通る」だけでなく「OSS メンテナーがそのままマージできる品質か」を6軸で測定する。SWE-bench Verified との違い、Diamond/Main/Extended の3段階データセット、Claude Opus 4.8 が Diamond 13.4%で首位に立った公式結果、日本企業のコードレビュー文化との親和性まで詳しく解説する。

Cognition AIFrontierCodeSWE-bench+4

Apple AFM Core Advanced 完全解説 — 20B Sparse MoEがiPhoneをオンデバイスAIの最前線へ

WWDC 2026で発表されたApple第3世代Foundation Models（AFM 3）のフラッグシップ、AFM Core Advanced。20Bパラメータ Sparse MoEとApple独自のIFP技術により、iPhone 17 Proでフロンティア級の推論がオフライン完結。アーキテクチャの革新点、A19 Pro仕様、対応デバイスの制限、Gemini distillationをめぐる「完全Apple製」論争まで、ITコンサルの視点から徹底解説します。

AppleAFMApple Foundation Models+5

Google NotebookLM「Better Research」アップデート完全解説 — Gemini 3.5 × Antigravity で能動的リサーチエージェントへ進化

2026年6月8日、Google は NotebookLM の大型アップデート「Better Research」を発表。AIエンジンを Gemini 3.5 へ刷新し、新世代コーディングエージェントフレームワーク Antigravity を統合。各ワークスペースにセキュアな VM が付与され、コード実行や多様なファイル出力が可能に。さらにエージェント型リサーチ機能により、ユーザーがソースを事前準備しなくてもアイデアを入力するだけで NotebookLM が自律的にウェブ上の一次資料を収集・分析するようになった。競合 LLM 比 4 倍高速、総合勝率 65% 超という公式ベンチマークとともに、料金体系・競合比較・日本企業の活用シナリオまで徹底解説する。

NotebookLMGoogleGemini 3.5+3

ソフトウェア開発2026-06-10

Obsidian 活用方法完全ガイド 2026 — ローカルファースト PKM で知識を資産に変える

Obsidian はカナダの Dynalist Inc. が開発したローカルファーストのナレッジ管理ツールです。2025年2月に商用利用も完全無料化され、IT コンサルタント・エンジニア・研究者・士業など日本企業の専門職にとって最有力の PKM 選択肢となりました。本記事では Vault の基本設定から 2026年新機能 Bases、Ollama によるローカル LLM 連携、Zettelkasten / PARA 活用パターン、日本語環境の注意点まで、明日から実践できる完全ガイドを提供します。

ObsidianPKMKnowledge Management+5

Claude Fable 5 / Claude Mythos 5 徹底解説 — Anthropic が2026年6月9日に発表した新最上位『Mythos クラス』モデル、価格 $10/$50、Opus 4.8 自動フォールバック、Project Glasswing 招待制まで

Anthropic が2026年6月9日に正式発表した Claude Fable 5 と Claude Mythos 5 を、公式発表・Claude Fable・Claude Mythos を一次ソースに整理。両者は 同一基盤モデルで、セーフガードの有無により公開向け（Fable）／審査済みパートナー向け（Mythos）に分かれます。従来の Opus / Sonnet / Haiku 三層に加え、新最上位『Mythos クラス』 が導入された点が構造変化。価格は 入力 $10 / 出力 $50 per 1M tokens（Mythos Preview の半額以下）、サイバー・生物・蒸留試行を検知すると Opus 4.8 へ自動フォールバック（全セッションの5%未満）、Hex のコア分析ベンチマークで 史上初の 90% 達成、Mythos 5 は Project Glasswing 招待制（サイバー防御・生物医学研究者のみ）という独自の運用設計までを公式情報ベースで解説しています。

AnthropicClaudeClaude Fable 5+4

cmux 完全解説 — Manaflow 製 macOS ネイティブ AI エージェント並列実行ターミナル

cmux は Manaflow（YC S24）が開発した macOS 専用の AI エージェント並列実行ターミナルです。Ghostty の libghostty を組み込んだ Swift ネイティブ実装で、垂直タブ・通知リング・組み込みブラウザなどエージェント管理特化の機能を備えます。本コラムでは正体・機能・インストール・ユースケース・競合比較・日本企業視点での留意点を網羅的に解説します。

cmuxManaflowAI Agent+5

123 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29