コラム
SEO・Web開発・IT技術に関するお役立ち情報
327件
AI2026-06-11
DiffusionGemma 徹底解説 — Google DeepMind が2026年6月10日に公開した『業界初のオープン重み大規模テキスト拡散 LLM』、Gemma 4 26B (A4B MoE) と同バックボーンで AR 版比 最大4倍速、Apache 2.0、品質は AR に劣るという公式明言まで
Google DeepMind が2026年6月10日に NVIDIA との同時アナウンスで公開した DiffusionGemma(`google/diffusiongemma-26B-A4B-it`、25.2B 総 / 3.8B アクティブ MoE)を、Google 公式ブログ・ai.google.dev モデルカード・Hugging Face・NVIDIA 公式 を一次ソースに整理。自己回帰(AR)モデルが左から右へ1トークンずつ生成するのに対し、Diffusion 言語モデル(DLM)はマスク/ノイズに満たされた256トークンキャンバスを並列に脱ノイズして文章へ変換する。1 forward あたり15-20トークン確定、最大48 denoising steps、H100 で 1,000+ tok/sec、RTX 5090 で 700+ tok/sec、AR 版 Gemma 4 比 約 3.5-4 倍。一方で MMLU Pro 77.6 vs 82.6、GPQA 73.2 vs 82.3、MMMU Pro 54.3 vs 73.8 と公式は AR 版に対する 品質劣後を率直に明言。Apache 2.0、Hugging Face / Vertex AI / NVIDIA NIM 提供、業界初のオープン重み大規模拡散 LLM。日本企業のオンプレ社内エージェント・コード補完・低レイテンシ業務での意義と、Mercury(Inception Labs)/ LLaDA / Gemini Diffusion との位置づけまで整理しています。
Google DeepMindGemma 4DiffusionGemma+5
AI2026-06-10
Claude Fable 5 / Claude Mythos 5 徹底解説 — Anthropic が2026年6月9日に発表した新最上位『Mythos クラス』モデル、価格 $10/$50、Opus 4.8 自動フォールバック、Project Glasswing 招待制まで
Anthropic が2026年6月9日に正式発表した Claude Fable 5 と Claude Mythos 5 を、公式発表・Claude Fable・Claude Mythos を一次ソースに整理。両者は 同一基盤モデルで、セーフガードの有無により公開向け(Fable)/審査済みパートナー向け(Mythos)に分かれます。従来の Opus / Sonnet / Haiku 三層に加え、新最上位『Mythos クラス』 が導入された点が構造変化。価格は 入力 $10 / 出力 $50 per 1M tokens(Mythos Preview の半額以下)、サイバー・生物・蒸留試行を検知すると Opus 4.8 へ自動フォールバック(全セッションの5%未満)、Hex のコア分析ベンチマークで 史上初の 90% 達成、Mythos 5 は Project Glasswing 招待制(サイバー防御・生物医学研究者のみ)という独自の運用設計までを公式情報ベースで解説しています。
AnthropicClaudeClaude Fable 5+4
AI2026-06-05
Hermes Agent / Hermes Desktop の Skills & Tools 完全ガイド — 19,932件のスキルカタログと40+ ビルトインツール、業務用途別の組み合わせパターン【2026年6月版】
Nous Research の OSS 自律エージェント Hermes Agent v0.15.2(と GUI 版 Hermes Desktop)の Skills & Tools システム を、公式ドキュメントと GitHub Releases を一次ソースに網羅的に解説。Skills(必要時にロードされる手順書)の Progressive Disclosure(3段階ローディング、~3kトークンから開始)、`SKILL.md` フォーマット、v0.15.1 で 858 → 19,932 件に急拡大した skills.sh カタログ、`openhands` / `code-wiki` / `web-pentest` などの注目スキル、エージェントが自分で Skills を create / patch / edit / delete する自己学習ループ、Tools(40+ビルトイン関数: web_search / x_search / terminal / patch / browser_navigate / vision_analyze / cronjob / memory / delegate_task ほか)、MCP の クライアント+サーバ両対応、macOS Computer Use の背景実行(カーソルが動かない・Spaces を切り替えない、5-20ms/event)、25+ メッセンジャー Gateway(Slack/Discord/Telegram/Teams/WhatsApp/LINE/Feishu/WeCom他)まで完全網羅。リサーチ・ライティング・データ分析・コーディング・カスタマーサポート・ソーシャルリスニング・社内自動化・パーソナル業務の 8カテゴリ別 推奨組み合わせパターン で日本企業の実務適用を整理しています。
Hermes AgentHermes DesktopNous Research+5
AI2026-06-04
Gemma 4 12B 徹底解説 — Vision Encoder と Audio Encoder を捨てた『encoder-free マルチモーダル』、16GBノートPCで動く Apache 2.0 ローカル LLM の正体【2026年6月3日発表】
Google DeepMind が2026年6月3日に公開した Gemma 4 12B を、公式ブログ と Developer Guide をベースに徹底解説。本モデル最大の特徴は encoder-free multimodal アーキテクチャ — Vision Encoder(旧モデルで約5.5億パラメータ)を 35M パラメータの軽量 embedder + 行列乗算1回 に置換し、Audio Encoder(12層 Conformer)は完全削除して raw 音声を直接 LLM の埋め込み空間に投影する設計。16GB VRAM のノート PC(Copilot+ PC / Apple Silicon Mac)で動作、Apache 2.0 ライセンス、Hugging Face / Ollama / LM Studio / MLX / Vertex AI で即利用可能。本コラムは技術的背景、26B MoE に迫るベンチマーク主張、Gemma 4 ファミリー(E2B/E4B/26B/31B)の中での位置づけ、Llama 4 / Qwen 3.5 / Phi-5 との競合関係、日本企業のオンプレ AI / 音声業務 / データ主権要件への適合性までを公式情報ベースで整理しました。
Gemma 4Gemma 4 12BGoogle DeepMind+5