株式会社オブライト
AI2026-05-01

Qwen 3.6-27B リリース解説 — Dense 27B でエージェントコーディング最先端、RTX 3090 で 40 tok/s【2026年4月版】

Alibaba Qwen Team が 2026年4月22日に公開した Qwen 3.6-27B Dense モデルの概要解説。SWE-bench Verified 77.2、Terminal-Bench 2.0 で 59.3(Claude 4.5 Opus と並ぶ)、262K-1M コンテキスト、Apache 2.0 ライセンス、RTX 3090 で 40 tok/s(Q4_K_M)など、公式情報と公開ベンチマークを整理。


Qwen 3.6-27B リリース概要

Alibaba の Qwen Team は2026年4月22日、Qwen 3.6 ファミリー初の Dense(非 MoE)オープン重みモデル Qwen 3.6-27B をリリースしました。Hugging Face と ModelScope で Apache 2.0 ライセンスで公開されており、商用利用可・ファインチューニング可。エージェントコーディング向けに大幅な性能改善が図られたモデルです。

公表ベンチマーク

公式が公表している主要ベンチマーク:

ベンチマークQwen 3.6-27B
SWE-bench Verified77.2
Terminal-Bench 2.059.3(Claude 4.5 Opus と同点)
QwenWebBench1487

複数の項目で前バージョン Qwen 3.5-27B、より大きい MoE モデル Qwen 3.5-397B-A17B を上回ったとされています。Claude 4.5 Opus と Terminal-Bench 2.0 で並ぶ27Bオープンモデルというのは大きなインパクトです。

アーキテクチャ的な特徴

27B Dense ながら、エージェントコーディング向けの「Thinking Preservation」と呼ばれるメカニズム、Gated DeltaNet 線形 Attention と従来の self-attention のハイブリッド構造が公式に紹介されています。コンテキスト長は 262,144 トークンがネイティブで、最大 1,010,000 トークンまで拡張可能と公表されています。テキスト・画像・動画の入力にも対応しています。

Qwen 3.5-9B との比較 — どちらを選ぶべきか

弊社の既存解説(Qwen 3.5-9B 完全ガイド / Claude 代替移行ガイド)でカバーしている Qwen 3.5-9B は今でも有力な軽量モデルです。新しい Qwen 3.6-27B との使い分けを整理します。

観点Qwen 3.5-9B(軽量・標準)Qwen 3.6-27B(コーディング・上位)
アーキテクチャ9B Dense + Gated DeltaNet + Sparse MoE 構成27B Dense + Thinking Preservation + Gated DeltaNet ハイブリッド
主な強み日本語対応・低コスト運用・5GBから動く軽さエージェントコーディング・SWE-bench / Terminal-Bench で27B最上位クラス
ライセンスApache 2.0Apache 2.0
ネイティブコンテキスト262K(最大 1M 拡張)262K(最大 1M 拡張)
量子化 Q4 のVRAM目安約 6GB約 16〜18GB
動かせるハード(最小)M1 Mac 8GB / RTX 3060 12GBM4 Pro 32GB / RTX 3090 24GB / RTX 4090 24GB
速度(量子化版実測)RTX 3060クラスで 40〜80 tok/sRTX 3090 で 約40 tok/s(Q4_K_M)
マルチモーダルテキスト中心テキスト + 画像 + 動画
想定用途業務チャット・要約・FAQ・社内文書RAGエージェント開発・コーディング支援・本格DX
Claude / GPT 代替の現実性Haiku / Mini クラスの代替Claude 4.5 Opus のコーディングタスクと拮抗(公表ベンチ)

選び方の目安: - コスト最重視・Mac mini で常用したい → Qwen 3.5-9B - エージェントコーディング / 開発業務支援が中心 → Qwen 3.6-27B - 既存サーバが GPU 24GB 以上ある / 開発DXに本格投資 → Qwen 3.6-27B - ノートPC / 8GB Mac でも回したい → Qwen 3.5-9B - マルチモーダルが必要 → Qwen 3.6-27B(3.5-9B はテキスト中心) 両方を併用する ハイブリッド構成(軽い問い合わせは Qwen 3.5-9B、コーディング判断のみ Qwen 3.6-27B)が、コスト・品質バランスで最も合理的になるケースもあります。

ハードウェア要件 — RTX 3090 で 40 tok/s

公表されている動作レポートでは、RTX 3090 24GB で Q4_K_M 量子化版が約 40 tokens/sec を記録、10/10 のテストをパスしたとされています。一般家庭〜中小オフィスのワークステーション級 GPU で実用速度が出るのは、27B Dense オープンモデルとして大きな魅力です。Apple Silicon の M3 Max 64GB / M4 Max 系統でも量子化版なら充分動きます。

オブライトでの活用方針

オブライトでは、Qwen 3.6-27B を OpenClaw のローカルバックエンド候補に追加しました(OpenClaw 2026.4.23 リリース)。「クラウド API には出したくない機密データに対してエージェントコーディングを回したい」という社内開発・社内DX案件と相性が良く、Apache 2.0 でファインチューニング可能な点も実装上のメリットです。詳細は AI 導入コンサルティング からご相談ください。

FAQ

Q1: Qwen 3.5-9B からのアップグレード価値は? A: コーディングタスクが中心なら大きな差が出る可能性があります。9B → 27B は VRAM 要件が増える点に注意。 Q2: Mac mini で動きますか? A: M4 Pro 32GB 以上であれば量子化版 Qwen 3.6-27B が現実的。M2 8GB クラスでは Qwen 3.5-9B / Gemma 4 E4B のほうが向いています。 Q3: 商用利用は可能ですか? A: Apache 2.0 のため、商用利用・改変・再配布いずれも自由です。

参考文献

お気軽にご相談ください

お問い合わせ