AI2026-07-05

Qwen3.6-35B-A3B Uncensored / Abliterated 徹底解説 — 35B MoE / 3B アクティブ / 262K context / hybrid linear+softmax 3:1 / text+image+video 対応、refusal 0/465、コミュニティ製 uncensored 派生の技術と倫理 HauhauCS Aggressive・huihui-ai abliterated・wangzhang abliterated・prithivMLmods など複数バリアント、Hugging Face + Ollama で配布

Qwen3.6-35B-A3B-Uncensored / Abliterated は、Alibaba の Qwen 3.6-35B-A3B（MoE、35B 総パラメータ / 3B アクティブ、262K context、hybrid attention）をベースに、コミュニティ有志が『拒否挙動（refusal）を除去』した派生モデル群（HackerNoon 解説 / HauhauCS Aggressive / huihui-ai abliterated / wangzhang abliterated / prithivMLmods Aggressive）。

ベースモデルの仕様: 35B 総パラメータ / 3B アクティブ（MoE、sparse expert 構造）、40 層、hybrid attention（linear + full softmax の 3:1 比率）、262K トークン native context、text / image / video ネイティブマルチモーダル入力。Alibaba のオープンウェイト戦略の中核モデル。

Abliteration 技術: 『拒否方向』を LoRA ベースの steering で attention / MLP projection から除去。追加で Expert-Granular Abliteration (EGA)（各層の expert down_proj スライス単位で abliteration）、MoE router suppression（safety expert を router 段階で無効化）という MoE 特化技法を組み合わせている。HauhauCS の内部テストでは 465 プロンプトのテストで 0 refusal と報告。ベース Qwen 3.6-35B の能力は 100% 維持しつつ、refusal のみ除去する設計思想。

複数バリアント:
- HauhauCS-Aggressive（HF / Ollama）: 最も aggressive な refusal 除去
- huihui-ai Huihui-Qwen3.6-abliterated（HF / Ollama）: 実績ある huihui-ai チームの手法
- wangzhang abliterated（HF）
- prithivMLmods Uncensored-Aggressive（HF）

各バリアントは 量子化オプション（GGUF Q4 / Q5 / Q8 / FP16 等）を用意しており、コンシューマ GPU（RTX 5090 32GB）から H100 まで幅広いハードウェアで実行可能。

倫理・法的論点: Abliterated モデルは 本来 Qwen が拒否すべき有害コンテンツ（違法薬物・攻撃コード・危険物合成等）を生成し得る。研究目的・脱獄耐性検証・ロールプレイ・成人向けコンテンツ生成等の合法用途は存在するが、業務利用・エンタープライズ導入では強い法的リスク。EU AI Act（2026-08 施行）や日本の PPC ガイドラインへの適合も懸念。責任は完全に利用者側、Alibaba / Qwen チームは関与せず。

位置付け: ローカル LLM 2026年6月最新版・Kimi K2.7-Code・Ornith-1.0 と並ぶオープンウェイト LLM 領域の側面として、『安全策を後から剥がす技術』が MoE 時代にも成立 している現実を示す事例。

Qwen3.6 Uncensored Abliterated Open Weights MoE HauhauCS huihui-ai Local LLM

TL;DR — Qwen3.6-35B Uncensored / Abliterated を一言で

Qwen3.6-35B-A3B-Uncensored / Abliterated は、Alibaba の Qwen 3.6-35B-A3B（35B MoE / 3B アクティブ / 262K context / hybrid attention / マルチモーダル）ベースに、コミュニティ有志が『拒否挙動』を LoRA + MoE 特化技法で除去した派生モデル群。

4 つの要点:

1. HauhauCS / huihui-ai / wangzhang / prithivMLmods など複数チームが独立してリリース、Hugging Face + Ollama で配布中
2. 技術: LoRA-based steering + Expert-Granular Abliteration (EGA) + MoE router suppression（MoE 特化）
3. HauhauCS 内部テストで 465 プロンプト中 refusal 0 回、ベース能力 100% 維持を主張
4. 法務・倫理リスク大 — enterprise 用途では推奨困難、研究・脱獄耐性検証・成人向けコンテンツなど限定用途向け

本コラムはローカル LLM 2026年6月最新版・Kimi K2.7-Code・Ornith-1.0 と並ぶ オープンウェイト LLM の周辺トピック としての位置付けです。

ベースモデル：Qwen 3.6-35B-A3B の仕様

Alibaba の Qwen 3.6 シリーズは、オープンウェイト LLM の中でも最も広範な採用を得ているファミリー。35B-A3B はそのミドルレンジ MoE モデル。

項目	値
総パラメータ	35B
アクティブパラメータ	約 3B / トークン（sparse MoE）
レイヤー数	40 層
Attention	Hybrid（linear attention + full softmax、3:1 比率）
コンテキスト	262,144 トークン（native、ropescaling 不要）
モダリティ	text / image / video ネイティブ
ライセンス	Qwen License（オープンウェイト、商用条件あり）

Hybrid attention の意義: 全層 full softmax の従来モデルより メモリ / 計算コストが低い一方、long context の retrieval 性能を維持。長い文書の処理に強いのが特徴。

Abliteration とは何か — 拒否挙動の外科的除去

Abliteration（ablate + erase の造語）は、Andy Arditi らが 2024 年に提案した LLM 安全策の後付け除去手法。モデル内部で『拒否』を表す方向ベクトルを特定し、その方向を打ち消すように重みを修正 することで、fine-tuning より軽量に refusal を除去できる。

Qwen3.6 に対する適用の特殊性: 従来の abliteration は dense モデル対象だったが、Qwen3.6 は MoE（Mixture-of-Experts） であり、単純な attention / MLP steering だけでは不十分。そこで:

(1) LoRA-based steering — attention と MLP projection に対して LoRA 形式で refusal direction を打ち消すパラメータを追加。dense モデルと同様の手法。

(2) Expert-Granular Abliteration (EGA) — 各層の expert down_proj スライスごとに abliteration を適用。MoE の各 expert が独立して refusal に寄与する可能性があるため、expert 単位できめ細かく処理。

(3) MoE router suppression — router（どの expert を選ぶかを決めるゲート）レベルで 『safety expert』を選ばれにくくする。safety に特化した expert を無効化する構造的アプローチ。

この 3 段階を組み合わせることで MoE モデルでも dense モデル並みの refusal 除去率（HauhauCS 報告で 0/465 = 0%）を達成、というのがコミュニティ側の主張。

主要バリアントの比較

バリアント	制作者	特徴	配布
HauhauCS-Aggressive	HauhauCS	最も aggressive、refusal 0/465 主張	HF / Ollama
Huihui-Qwen3.6-abliterated	huihui-ai	老舗 abliteration チーム、他多数の abliterated モデルで実績	HF / Ollama
wangzhang abliterated	wangzhang	シンプルな abliteration	HF
prithivMLmods Uncensored-Aggressive	prithivMLmods	HF での人気クリエイター	HF
（前世代）Qwen3.5-35B-A3B Uncensored	HauhauCS	Qwen 3.5 世代の同種派生	HF

選択基準:

- HauhauCS-Aggressive — refusal 除去率を最大化したい場合。品質劣化リスクは中程度
- huihui-ai abliterated — 品質と refusal 除去のバランスを取りたい場合。老舗の信頼性
- wangzhang / prithivMLmods — セカンドオピニオン用

量子化とハードウェア要件

各バリアントは GGUF 量子化版が Hugging Face / Ollama で配布 されており、幅広いハードウェアで実行可能。

量子化	ファイルサイズ目安	推奨 GPU / VRAM
FP16（フル精度）	~70 GB	H100 80GB / A100 80GB
Q8_0	~35 GB	RTX 5090 32GB ×2、または A100 40GB
Q5_K_M	~24 GB	RTX 5090 32GB 単体
Q4_K_M	~20 GB	RTX 4090 24GB、RTX 5090
Q3_K_M	~16 GB	RTX 4080 16GB、Mac M3/M4 Max 32GB
Q2_K	~12 GB	品質劣化大、実験用途のみ

Ollama での実行例:

bash

ollama run huihui_ai/Qwen3.6-abliterated
# または
ollama run fredrezones55/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive

MoE 構造のため アクティブ 3B のみが計算対象 となり、VRAM 使用量に対して推論速度が速い（dense 30B より高速、dense 7B に近いレイテンシ）。ローカル実行の実用性は高い。

想定される用途（合法範囲）

Abliterated モデルには 正当な使い道 も存在する:

(1) 脱獄耐性研究: セキュリティ研究者が LLM の refusal メカニズムを研究する際、すでに refusal が除かれたモデル を対照群として比較。「本来の refusal がなければどの応答が出るか」を検証。

(2) 学術研究: アライメント研究、AI safety 研究、モデル内部の refusal representation 解析。

(3) 成人向けフィクション執筆・ロールプレイ: 出版・エンタメ用途で、過剰な safety filter に阻まれず クリエイティブライティングを行いたいケース。特に成人向け小説プラットフォームでの利用。

(4) 医療・法務の詳細質問: 通常 LLM が『医師/弁護士に相談を』と拒否するが、専門家が既存知識確認として使う ケース。責任は使用者が負う前提。

(5) 歴史的・文学的タブー主題の分析: 通常拒否される戦争犯罪・思想史・倫理的グレー領域の学術分析。

法務・倫理リスク（企業導入は非推奨）

Abliterated モデルは本来 Qwen が拒否すべき有害コンテンツを生成しうる:

- 違法薬物合成手順
- サイバー攻撃コード（exploit / malware）
- 危険物・爆発物の合成手順
- 児童搾取コンテンツ（重大な違法）
- 憎悪表現・差別的コンテンツ
- なりすまし・詐欺文言

企業・エンタープライズ導入の観点:

(1) 法的責任: 生成コンテンツの責任は 完全に利用者側。Alibaba / Qwen チーム・abliteration の制作者は責任を負わない。企業が abliterated モデルで問題コンテンツを出力した場合、企業自身が民事・刑事責任 を負う可能性。

(2) EU AI Act（2026-08 施行）との整合性: ローカル LLM 2026年6月最新版で解説した通り、GPAI 義務化 + systemic risk 認定モデル（10^25 FLOPs 超）は全義務適用。abliterated モデルを商用サービスに組み込むと、追加の safety mitigation 義務 が発生する可能性大。

(3) 日本の PPC / METI ガイドライン: Kimi K2.7-Code コラムで触れた通り、日本の個人情報保護委員会・経産省 AI ガイドラインは AI の安全性・透明性 を強く求めている。abliterated モデルはこれと真逆の方向。

(4) Qwen ライセンスの解釈: Qwen 3.6 のオープンウェイトライセンスは、モデルの派生・再配布は許諾 しているが、明示的に有害用途を禁止する条項 も含まれる。abliteration が『有害用途への便宜供与』と解釈された場合、ライセンス違反リスク。

結論: enterprise 導入・商用サービスへの組み込みは強く非推奨。研究・個人利用・限定的な合法用途に限定するのが現実的。

技術的な限界と品質劣化

Abliteration は完璧ではない:

(1) 品質劣化: refusal direction を除去する過程で、モデル全体の instruction following や reasoning が微妙に劣化 する報告が多数。特に aggressive バリアントは能力低下が大きい。

(2) 意図しない挙動変化: 単に refusal が消えるだけでなく、モデルの personality・応答スタイル・helpfulness も変化 する。プロダクション用途では予期しない出力の可能性。

(3) 一部 refusal 残存: 「0/465」は特定テストセットでの結果であり、現実の多様なプロンプトでは refusal が残る場合 も。

(4) MoE 特有の課題: EGA + router suppression は すべての expert に対して均等には効かない。特定タスクで unexpected な出力が発生しやすい。

(5) セキュリティ: abliterated モデルは 悪意ある fine-tuning のさらなる追加 を受けやすい。第三者が公開する量子化版には バックドア が仕込まれる可能性もゼロではない。

コミュニティエコシステム

Abliteration は Hugging Face を中心に活発なコミュニティ を形成。

主要な abliteration 制作者:

- huihui-ai — 最も実績のある abliteration 専門チーム、複数世代の Qwen / Llama / Mistral 系の abliterated 版を継続公開
- HauhauCS — MoE 特化技法（EGA / router suppression）を推進
- prithivMLmods — HF での人気コミュニティメンバー、複数モデルの uncensored 派生を公開
- wangzhang、mradermacher、bartowski など複数の量子化 / uncensored 提供者

流通経路:

- Hugging Face Hub — オリジナルモデル + 量子化版
- Ollama — 使いやすい CLI から ollama run で即実行
- LM Studio — GUI でモデル管理
- llama.cpp / GGUF — 各種フロントエンドで利用可能

位置付け — オープンウェイト LLM 領域の側面として

abliterated / uncensored モデルの存在は、オープンウェイト LLM が抱える構造的な現実:

1. オープンウェイトである以上、safety alignment は事後的に剥がされうる
2. MoE モデルにも abliteration が到達 — 単純な dense モデル対象だった技法が拡張された
3. 法的・倫理的責任は完全に利用者側 — オリジナル開発者（Alibaba）は関与しない
4. 業界標準の LLM 安全性論と、オープンウェイト現実の乖離 — Anthropic の Claude Fable 5 輸出規制など閉じたモデルの安全策強化と、オープン側での abliteration の同時進行

この記事は abliterated モデルの利用を推奨するものではなく、技術的事実として業界に存在する現象 を整理する目的です。実際の利用可否は個々の法域・用途・組織方針に応じて慎重に判断する必要があります。

本トピックに関連する弊社サービスとして AI コンサルティング・ソフトウェア開発・OpenClaw 導入セットアップがあります。オープンウェイト LLM の企業向け安全な活用設計・alignment 検証・コンプライアンス対応のご相談はお問い合わせから。

まとめ

Qwen3.6-35B-A3B-Uncensored / Abliterated は、Alibaba のオープンウェイト Qwen 3.6-35B MoE を コミュニティ有志が LoRA + Expert-Granular Abliteration + MoE router suppression の 3 段階技法で refusal 除去した派生モデル群。HauhauCS / huihui-ai / wangzhang / prithivMLmods など複数バリアントが Hugging Face + Ollama で配布中、量子化オプションで RTX 5090 単体から動作。HauhauCS は 465 プロンプト中 refusal 0 を報告、ベース能力の 100% 維持を主張。

3 つの本質的インパクト:

1. Abliteration が MoE 時代に到達 — dense モデル対象の技法が拡張、Expert-Granular Abliteration と router suppression で対応
2. オープンウェイト LLM の safety 現実 — 発表元の safety alignment は事後的に剥がされうる
3. 合法用途と違法用途の混在 — 研究・成人向け執筆・脱獄耐性検証は正当だが、企業導入は法的リスク大

留保: enterprise / 商用サービス導入は強く非推奨、EU AI Act / 日本 PPC / METI ガイドラインとの整合性懸念、Qwen ライセンス解釈リスク、品質劣化、バックドア可能性、意図しない挙動変化。

References

Hugging Face（主要バリアント）:
- HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive
- huihui-ai/Huihui-Qwen3.6-35B-A3B-abliterated
- wangzhang/Qwen3.6-35B-A3B-abliterated
- prithivMLmods/Qwen3.6-35B-A3B-Uncensored-Aggressive
- （前世代）HauhauCS/Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive

Ollama:
- fredrezones55/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive
- huihui_ai/Qwen3.6-abliterated

解説記事:
- HackerNoon — Qwen3.6-35B-A3B Uncensored: A 35B MoE Model With 262K Context

関連コラム:
- ローカル LLM 2026年6月最新版
- Kimi K2.7-Code
- Ornith-1.0
- Claude Fable 5 復活
- Claude Sonnet 5 リリース

お気軽にご相談ください

お問い合わせ