Qwen 3.6-27B リリース解説 — Dense 27B でエージェントコーディング最先端、RTX 3090 で 40 tok/s【2026年4月版】
Alibaba Qwen Team が 2026年4月22日に公開した Qwen 3.6-27B Dense モデルの概要解説。SWE-bench Verified 77.2、Terminal-Bench 2.0 で 59.3(Claude 4.5 Opus と並ぶ)、262K-1M コンテキスト、Apache 2.0 ライセンス、RTX 3090 で 40 tok/s(Q4_K_M)など、公式情報と公開ベンチマークを整理。
Qwen 3.6-27B リリース概要
Alibaba の Qwen Team は2026年4月22日、Qwen 3.6 ファミリー初の Dense(非 MoE)オープン重みモデル Qwen 3.6-27B をリリースしました。Hugging Face と ModelScope で Apache 2.0 ライセンスで公開されており、商用利用可・ファインチューニング可。エージェントコーディング向けに大幅な性能改善が図られたモデルです。
公表ベンチマーク
公式が公表している主要ベンチマーク:
| ベンチマーク | Qwen 3.6-27B |
|---|---|
| SWE-bench Verified | 77.2 |
| Terminal-Bench 2.0 | 59.3(Claude 4.5 Opus と同点) |
| QwenWebBench | 1487 |
複数の項目で前バージョン Qwen 3.5-27B、より大きい MoE モデル Qwen 3.5-397B-A17B を上回ったとされています。Claude 4.5 Opus と Terminal-Bench 2.0 で並ぶ27Bオープンモデルというのは大きなインパクトです。
アーキテクチャ的な特徴
27B Dense ながら、エージェントコーディング向けの「Thinking Preservation」と呼ばれるメカニズム、Gated DeltaNet 線形 Attention と従来の self-attention のハイブリッド構造が公式に紹介されています。コンテキスト長は 262,144 トークンがネイティブで、最大 1,010,000 トークンまで拡張可能と公表されています。テキスト・画像・動画の入力にも対応しています。
Qwen 3.5-9B との比較 — どちらを選ぶべきか
弊社の既存解説(Qwen 3.5-9B 完全ガイド / Claude 代替移行ガイド)でカバーしている Qwen 3.5-9B は今でも有力な軽量モデルです。新しい Qwen 3.6-27B との使い分けを整理します。
| 観点 | Qwen 3.5-9B(軽量・標準) | Qwen 3.6-27B(コーディング・上位) |
|---|---|---|
| アーキテクチャ | 9B Dense + Gated DeltaNet + Sparse MoE 構成 | 27B Dense + Thinking Preservation + Gated DeltaNet ハイブリッド |
| 主な強み | 日本語対応・低コスト運用・5GBから動く軽さ | エージェントコーディング・SWE-bench / Terminal-Bench で27B最上位クラス |
| ライセンス | Apache 2.0 | Apache 2.0 |
| ネイティブコンテキスト | 262K(最大 1M 拡張) | 262K(最大 1M 拡張) |
| 量子化 Q4 のVRAM目安 | 約 6GB | 約 16〜18GB |
| 動かせるハード(最小) | M1 Mac 8GB / RTX 3060 12GB | M4 Pro 32GB / RTX 3090 24GB / RTX 4090 24GB |
| 速度(量子化版実測) | RTX 3060クラスで 40〜80 tok/s | RTX 3090 で 約40 tok/s(Q4_K_M) |
| マルチモーダル | テキスト中心 | テキスト + 画像 + 動画 |
| 想定用途 | 業務チャット・要約・FAQ・社内文書RAG | エージェント開発・コーディング支援・本格DX |
| Claude / GPT 代替の現実性 | Haiku / Mini クラスの代替 | Claude 4.5 Opus のコーディングタスクと拮抗(公表ベンチ) |
選び方の目安: - コスト最重視・Mac mini で常用したい → Qwen 3.5-9B - エージェントコーディング / 開発業務支援が中心 → Qwen 3.6-27B - 既存サーバが GPU 24GB 以上ある / 開発DXに本格投資 → Qwen 3.6-27B - ノートPC / 8GB Mac でも回したい → Qwen 3.5-9B - マルチモーダルが必要 → Qwen 3.6-27B(3.5-9B はテキスト中心) 両方を併用する ハイブリッド構成(軽い問い合わせは Qwen 3.5-9B、コーディング判断のみ Qwen 3.6-27B)が、コスト・品質バランスで最も合理的になるケースもあります。
ハードウェア要件 — RTX 3090 で 40 tok/s
公表されている動作レポートでは、RTX 3090 24GB で Q4_K_M 量子化版が約 40 tokens/sec を記録、10/10 のテストをパスしたとされています。一般家庭〜中小オフィスのワークステーション級 GPU で実用速度が出るのは、27B Dense オープンモデルとして大きな魅力です。Apple Silicon の M3 Max 64GB / M4 Max 系統でも量子化版なら充分動きます。
オブライトでの活用方針
オブライトでは、Qwen 3.6-27B を OpenClaw のローカルバックエンド候補に追加しました(OpenClaw 2026.4.23 リリース)。「クラウド API には出したくない機密データに対してエージェントコーディングを回したい」という社内開発・社内DX案件と相性が良く、Apache 2.0 でファインチューニング可能な点も実装上のメリットです。詳細は AI 導入コンサルティング からご相談ください。
FAQ
Q1: Qwen 3.5-9B からのアップグレード価値は? A: コーディングタスクが中心なら大きな差が出る可能性があります。9B → 27B は VRAM 要件が増える点に注意。 Q2: Mac mini で動きますか? A: M4 Pro 32GB 以上であれば量子化版 Qwen 3.6-27B が現実的。M2 8GB クラスでは Qwen 3.5-9B / Gemma 4 E4B のほうが向いています。 Q3: 商用利用は可能ですか? A: Apache 2.0 のため、商用利用・改変・再配布いずれも自由です。
参考文献
お気軽にご相談ください
お問い合わせ