AI2026-05-01約6分で読めます

Qwen 3.6-27B リリース解説

Dense 27B でエージェントコーディング最先端、RTX 3090 で 40 tok/s【2026年4月版】

Alibaba Qwen Team が 2026年4月22日に公開した Qwen 3.6-27B Dense モデルの概要解説。SWE-bench Verified 77.2、Terminal-Bench 2.0 で 59.3（Claude 4.5 Opus と並ぶ）、262K-1M コンテキスト、Apache 2.0 ライセンス、RTX 3090 で 40 tok/s（Q4_K_M）など、公式情報と公開ベンチマークを整理。

Qwen 3.6 Alibaba オープンソースLLM コーディング Apache 2.0

Qwen 3.6-27B リリース概要

Alibaba の Qwen Team は2026年4月22日、Qwen 3.6 ファミリー初の Dense（非 MoE）オープン重みモデル Qwen 3.6-27B をリリースしました。Hugging Face と ModelScope で Apache 2.0 ライセンスで公開されており、商用利用可・ファインチューニング可。エージェントコーディング向けに大幅な性能改善が図られたモデルです。

公表ベンチマーク

公式が公表している主要ベンチマーク：

ベンチマーク	Qwen 3.6-27B
SWE-bench Verified	77.2
Terminal-Bench 2.0	59.3（Claude 4.5 Opus と同点）
QwenWebBench	1487

複数の項目で前バージョン Qwen 3.5-27B、より大きい MoE モデル Qwen 3.5-397B-A17B を上回ったとされています。Claude 4.5 Opus と Terminal-Bench 2.0 で並ぶ27Bオープンモデルというのは大きなインパクトです。

アーキテクチャ的な特徴

27B Dense ながら、エージェントコーディング向けの「Thinking Preservation」と呼ばれるメカニズム、Gated DeltaNet 線形 Attention と従来の self-attention のハイブリッド構造が公式に紹介されています。コンテキスト長は 262,144 トークンがネイティブで、最大 1,010,000 トークンまで拡張可能と公表されています。テキスト・画像・動画の入力にも対応しています。

Qwen 3.5-9B との比較 — どちらを選ぶべきか

弊社の既存解説（Qwen 3.5-9B 完全ガイド / Claude 代替移行ガイド）でカバーしている Qwen 3.5-9B は今でも有力な軽量モデルです。新しい Qwen 3.6-27B との使い分けを整理します。

観点	Qwen 3.5-9B（軽量・標準）	Qwen 3.6-27B（コーディング・上位）
アーキテクチャ	9B Dense + Gated DeltaNet + Sparse MoE 構成	27B Dense + Thinking Preservation + Gated DeltaNet ハイブリッド
主な強み	日本語対応・低コスト運用・5GBから動く軽さ	エージェントコーディング・SWE-bench / Terminal-Bench で27B最上位クラス
ライセンス	Apache 2.0	Apache 2.0
ネイティブコンテキスト	262K（最大 1M 拡張）	262K（最大 1M 拡張）
量子化 Q4 のVRAM目安	約 6GB	約 16〜18GB
動かせるハード（最小）	M1 Mac 8GB / RTX 3060 12GB	M4 Pro 32GB / RTX 3090 24GB / RTX 4090 24GB
速度（量子化版実測）	RTX 3060クラスで 40〜80 tok/s	RTX 3090 で約40 tok/s（Q4_K_M）
マルチモーダル	テキスト中心	テキスト + 画像 + 動画
想定用途	業務チャット・要約・FAQ・社内文書RAG	エージェント開発・コーディング支援・本格DX
Claude / GPT 代替の現実性	Haiku / Mini クラスの代替	Claude 4.5 Opus のコーディングタスクと拮抗（公表ベンチ）

選び方の目安:

- コスト最重視・Mac mini で常用したい → Qwen 3.5-9B
- エージェントコーディング / 開発業務支援が中心 → Qwen 3.6-27B
- 既存サーバが GPU 24GB 以上ある / 開発DXに本格投資 → Qwen 3.6-27B
- ノートPC / 8GB Mac でも回したい → Qwen 3.5-9B
- マルチモーダルが必要 → Qwen 3.6-27B（3.5-9B はテキスト中心）

両方を併用する ハイブリッド構成（軽い問い合わせは Qwen 3.5-9B、コーディング判断のみ Qwen 3.6-27B）が、コスト・品質バランスで最も合理的になるケースもあります。

ハードウェア要件 — RTX 3090 で 40 tok/s

公表されている動作レポートでは、RTX 3090 24GB で Q4_K_M 量子化版が約 40 tokens/sec を記録、10/10 のテストをパスしたとされています。一般家庭〜中小オフィスのワークステーション級 GPU で実用速度が出るのは、27B Dense オープンモデルとして大きな魅力です。Apple Silicon の M3 Max 64GB / M4 Max 系統でも量子化版なら充分動きます。

オブライトでの活用方針

オブライトでは、Qwen 3.6-27B を OpenClaw のローカルバックエンド候補に追加しました（OpenClaw 2026.4.23 リリース）。「クラウド API には出したくない機密データに対してエージェントコーディングを回したい」という社内開発・社内DX案件と相性が良く、Apache 2.0 でファインチューニング可能な点も実装上のメリットです。詳細は AI 導入コンサルティングからご相談ください。

FAQ

Q1: Qwen 3.5-9B からのアップグレード価値は？
A: コーディングタスクが中心なら大きな差が出る可能性があります。9B → 27B は VRAM 要件が増える点に注意。

Q2: Mac mini で動きますか？
A: M4 Pro 32GB 以上であれば量子化版 Qwen 3.6-27B が現実的。M2 8GB クラスでは Qwen 3.5-9B / Gemma 4 E4B のほうが向いています。

Q3: 商用利用は可能ですか？
A: Apache 2.0 のため、商用利用・改変・再配布いずれも自由です。

参考文献

- Qwen 3.6-27B 公式ブログ（Qwen team）
- Hugging Face: Qwen/Qwen3.6-27B
- Qwen Team Releases Qwen 3.6-27B（MarkTechPost、2026/4/22）
- Qwen 3.6-27B on RTX 3090（Phemex News）

お気軽にご相談ください

お問い合わせ