「Agentic Coding」のコラム

1件の記事

AI2026-06-26

Ornith-1.0 徹底解説 — DeepReinforce が2026年6月26日に公開した『エージェント・コーディング特化』MIT オープン重みモデルファミリー 3 サイズ（9B Dense / 35B MoE / 397B MoE）、すべて262K context・Qwen 3.5 + Gemma 4 ベース・BF16 + FP8 + GGUF 提供 SWE-Bench Verified 82.4%（397B）/ 75.6%（35B）/ 69.4%（9B）、SWE-Bench Pro 62.2% で OSS 同サイズ帯 SOTA を主張強化学習で『解の rollout だけでなく scaffolding 自体も最適化』する self-improving 設計 OpenHands / Hermes Agent / OpenClaw 互換、ClawEval ベンチも公開 — オブライト OpenClaw 利用者にも直接関係

**DeepReinforce が2026年6月26日に Ornith-1.0 を公開** しました（[公式](https://deep-reinforce.com/ornith_1_0.html) / [Hugging Face コレクション](https://huggingface.co/collections/deepreinforce-ai/ornith-10)）。**エージェント・コーディング特化のオープンウェイト LLM ファミリー** で、**MIT ライセンス・地域制限なし**。 **3つのサイズで提供**: [Ornith-1.0-9B](https://huggingface.co/deepreinforce-ai/Ornith-1.0-9B)（dense、~19GB BF16）/ [Ornith-1.0-35B](https://huggingface.co/deepreinforce-ai/Ornith-1.0-35B)（MoE）/ [Ornith-1.0-397B](https://huggingface.co/deepreinforce-ai/Ornith-1.0-397B)（MoE、Qwen 3.5 + Gemma 4 ベース）。**全サイズが 262K context**、**FP8 / GGUF 量子化版も同時公開**。 **ベンチマーク（公式公表値、同サイズ帯 OSS の SOTA を主張）**: | ベンチ | 9B | 35B | 397B | |---|---|---|---| | **SWE-Bench Verified** | **69.4%** | **75.6%** | **82.4%** | | **SWE-Bench Pro** | **42.9%** | **50.4%** | **62.2%** | | **SWE-Bench Multilingual** | — | — | **78.9%** | | **Terminal-Bench 2.1** | 43.1% | 64.2% | **77.5-78.2%** | | **NL2Repo** | 27.2% | 34.6% | **48.2%** | | **ClawEval** | — | — | **77.1%** | **設計思想**: 強化学習で **解の rollout だけでなく scaffolding（解を導くエージェント構造）自体も最適化**。自己改善型の agentic coding という、[Loop Engineering](../columns/loop-engineering-ai-agent-paradigm-2026-06) の Maker-Checker 思想と地続きのアプローチ。`<think>...</think>` ブロックでの推論モード、function calling、ツールユース対応。 **配布・運用**: vLLM ≥ 0.19.1 / SGLang ≥ 0.5.9 / Transformers ≥ 5.8.1 / Docker + llama.cpp / Ollama。OpenAI 互換 API エンドポイント。9B は単一 80GB GPU で十分、35B / 397B は **8×80GB GPU ノード（TP=8）**。エージェントフレームワーク互換: **OpenHands / Hermes Agent / [OpenClaw](../services/openclaw-setup)**（弊社サービスとも直接互換、ClawEval も同社で公式評価対象に）。 **DeepReinforce の系譜**: 強化学習を CUDA / 行列演算 / コード生成に応用してきた研究組織。過去に [CUDA-L1（3.12× 平均 GPU 高速化）](https://github.com/deepreinforce-ai/CUDA-L1)・[CUDA-L2（cuBLAS 超え HGEMM カーネル）](https://github.com/deepreinforce-ai/CUDA-L2)・**IterX（MLSys 2026 NVIDIA Track）** を発表。Ornith-1.0 はその RL ノウハウを LLM 自己改善に応用した最新作。 **位置付け**: 同時期の [Kimi K2.7-Code](../columns/kimi-k2-7-code-moonshot-ai-2026-06)（1T MoE / 32B active）・[GLM-5.2](../columns/local-llm-landscape-2026-june-update)（Intelligence Index v4.1 で 51 点 / OSS 首位）と並び、**2026年6月の agentic coding OSS 戦線の最先端**。中国系（Kimi / GLM）に対し **MIT ライセンス + 地域制限なし + 米国ベースの法務調達優位** が差別化。 **留保事項**: ベンチは DeepReinforce 自社公表値で、第三者リーダーボードでの独立検証は2026年6月26日時点で未確立。ベンダーレポート段階の数値である点には留意が必要です。本コラム末尾に **Ornith-1.0 を含むローカル LLM の導入・PoC・継続保守の3つの問い合わせ導線** を設置しています。

OrnithDeepReinforceOpen Weight