株式会社オブライト

「Agentic Coding」のコラム

1件の記事

AI2026-06-26
Ornith-1.0 徹底解説 — DeepReinforce が2026年6月26日に公開した『エージェント・コーディング特化』MIT オープン重みモデルファミリー 3 サイズ(9B Dense / 35B MoE / 397B MoE)、すべて262K context・Qwen 3.5 + Gemma 4 ベース・BF16 + FP8 + GGUF 提供 SWE-Bench Verified 82.4%(397B)/ 75.6%(35B)/ 69.4%(9B)、SWE-Bench Pro 62.2% で OSS 同サイズ帯 SOTA を主張 強化学習で『解の rollout だけでなく scaffolding 自体も最適化』する self-improving 設計 OpenHands / Hermes Agent / OpenClaw 互換、ClawEval ベンチも公開 — オブライト OpenClaw 利用者にも直接関係
**DeepReinforce が2026年6月26日に Ornith-1.0 を公開** しました([公式](https://deep-reinforce.com/ornith_1_0.html) / [Hugging Face コレクション](https://huggingface.co/collections/deepreinforce-ai/ornith-10))。**エージェント・コーディング特化のオープンウェイト LLM ファミリー** で、**MIT ライセンス・地域制限なし**。 **3つのサイズで提供**: [Ornith-1.0-9B](https://huggingface.co/deepreinforce-ai/Ornith-1.0-9B)(dense、~19GB BF16)/ [Ornith-1.0-35B](https://huggingface.co/deepreinforce-ai/Ornith-1.0-35B)(MoE)/ [Ornith-1.0-397B](https://huggingface.co/deepreinforce-ai/Ornith-1.0-397B)(MoE、Qwen 3.5 + Gemma 4 ベース)。**全サイズが 262K context**、**FP8 / GGUF 量子化版も同時公開**。 **ベンチマーク(公式公表値、同サイズ帯 OSS の SOTA を主張)**: | ベンチ | 9B | 35B | 397B | |---|---|---|---| | **SWE-Bench Verified** | **69.4%** | **75.6%** | **82.4%** | | **SWE-Bench Pro** | **42.9%** | **50.4%** | **62.2%** | | **SWE-Bench Multilingual** | — | — | **78.9%** | | **Terminal-Bench 2.1** | 43.1% | 64.2% | **77.5-78.2%** | | **NL2Repo** | 27.2% | 34.6% | **48.2%** | | **ClawEval** | — | — | **77.1%** | **設計思想**: 強化学習で **解の rollout だけでなく scaffolding(解を導くエージェント構造)自体も最適化**。自己改善型の agentic coding という、[Loop Engineering](../columns/loop-engineering-ai-agent-paradigm-2026-06) の Maker-Checker 思想と地続きのアプローチ。`<think>...</think>` ブロックでの推論モード、function calling、ツールユース対応。 **配布・運用**: vLLM ≥ 0.19.1 / SGLang ≥ 0.5.9 / Transformers ≥ 5.8.1 / Docker + llama.cpp / Ollama。OpenAI 互換 API エンドポイント。9B は単一 80GB GPU で十分、35B / 397B は **8×80GB GPU ノード(TP=8)**。エージェントフレームワーク互換: **OpenHands / Hermes Agent / [OpenClaw](../services/openclaw-setup)**(弊社サービスとも直接互換、ClawEval も同社で公式評価対象に)。 **DeepReinforce の系譜**: 強化学習を CUDA / 行列演算 / コード生成に応用してきた研究組織。過去に [CUDA-L1(3.12× 平均 GPU 高速化)](https://github.com/deepreinforce-ai/CUDA-L1)・[CUDA-L2(cuBLAS 超え HGEMM カーネル)](https://github.com/deepreinforce-ai/CUDA-L2)・**IterX(MLSys 2026 NVIDIA Track)** を発表。Ornith-1.0 はその RL ノウハウを LLM 自己改善に応用した最新作。 **位置付け**: 同時期の [Kimi K2.7-Code](../columns/kimi-k2-7-code-moonshot-ai-2026-06)(1T MoE / 32B active)・[GLM-5.2](../columns/local-llm-landscape-2026-june-update)(Intelligence Index v4.1 で 51 点 / OSS 首位)と並び、**2026年6月の agentic coding OSS 戦線の最先端**。中国系(Kimi / GLM)に対し **MIT ライセンス + 地域制限なし + 米国ベースの法務調達優位** が差別化。 **留保事項**: ベンチは DeepReinforce 自社公表値で、第三者リーダーボードでの独立検証は2026年6月26日時点で未確立。ベンダーレポート段階の数値である点には留意が必要です。 本コラム末尾に **Ornith-1.0 を含むローカル LLM の導入・PoC・継続保守の3つの問い合わせ導線** を設置しています。
OrnithDeepReinforceOpen Weight