株式会社オブライト

「NVIDIA」のコラム

7件の記事

AI2026-06-11
DiffusionGemma 徹底解説 — Google DeepMind が2026年6月10日に公開した『業界初のオープン重み大規模テキスト拡散 LLM』、Gemma 4 26B (A4B MoE) と同バックボーンで AR 版比 最大4倍速、Apache 2.0、品質は AR に劣るという公式明言まで
Google DeepMind が2026年6月10日に NVIDIA との同時アナウンスで公開した **DiffusionGemma**(`google/diffusiongemma-26B-A4B-it`、25.2B 総 / 3.8B アクティブ MoE)を、[Google 公式ブログ](https://blog.google/innovation-and-ai/technology/developers-tools/diffusion-gemma-faster-text-generation/)・[ai.google.dev モデルカード](https://ai.google.dev/gemma/docs/diffusiongemma/model_card)・[Hugging Face](https://huggingface.co/google/diffusiongemma-26B-A4B-it)・[NVIDIA 公式](https://blogs.nvidia.com/blog/rtx-ai-garage-local-gemma-diffusion/) を一次ソースに整理。**自己回帰(AR)モデルが左から右へ1トークンずつ生成するのに対し、Diffusion 言語モデル(DLM)はマスク/ノイズに満たされた256トークンキャンバスを並列に脱ノイズして文章へ変換する**。1 forward あたり15-20トークン確定、最大48 denoising steps、H100 で 1,000+ tok/sec、RTX 5090 で 700+ tok/sec、AR 版 Gemma 4 比 約 3.5-4 倍。一方で **MMLU Pro 77.6 vs 82.6、GPQA 73.2 vs 82.3、MMMU Pro 54.3 vs 73.8** と公式は AR 版に対する **品質劣後を率直に明言**。Apache 2.0、Hugging Face / Vertex AI / NVIDIA NIM 提供、業界初のオープン重み大規模拡散 LLM。日本企業のオンプレ社内エージェント・コード補完・低レイテンシ業務での意義と、Mercury(Inception Labs)/ LLaDA / Gemini Diffusion との位置づけまで整理しています。
Google DeepMindGemma 4DiffusionGemma
AI2026-05-05
NVIDIA DGX Spark で「機密コードはローカルLLM、移植本番はクラウドLLM」を実装する — 2026年版・経営承認を通すリスクヘッジ運用ガイド
NVIDIA DGX Spark(GB10 Grace Blackwell Superchip、128GB ユニファイドメモリ、約 1 PFLOPS FP4、$4,699)の主要スペックと、機密性の高いコード資産の解析・移植案件で「ローカルLLMで分析・個人情報分離→他社LLMで移植」というリスクヘッジを組むための具体的な運用パターンを解説します。クラウドAIのオプトアウトでは経営承認が下りないケースをどう乗り越えるか、実務目線で整理。
NVIDIADGX SparkローカルLLM
AI2026-04-06
NVIDIA PersonaPlex 7B完全ガイド — リアルタイムフルデュプレックス音声AIの仕組みと活用法【2026年版】
NVIDIAが2026年1月にリリースしたPersonaPlex 7Bは、従来のASR→LLM→TTSパイプラインを単一モデルに統合し、真のフルデュプレックス音声対話を実現したオープンソース音声AIです。本記事では、アーキテクチャ、パフォーマンス、セットアップ手順、実践ユースケースまで徹底解説します。
PersonaPlexNVIDIA音声AI
AI2026-03-19
Microsoft Foundry Agent Service GA — エンタープライズ向けエージェント構築基盤が本番環境対応
2026年3月のGTC 2026で発表されたMicrosoft Foundry Agent Serviceの一般提供開始。エージェント構築・運用・監視を統合し、NVIDIA Nemotron対応やVera Rubin NVL72の世界初稼働など、エンタープライズAI基盤の最新動向を解説します。
Microsoft AzureAIエージェントクラウドインフラ
AI2026-03-19
NVIDIA Physical AIとデジタルツイン — GTC 2026が示す産業AI革命の最前線
2026年3月にサンノゼで開催されたGTC 2026では、NVIDIA Isaac™とOmniverse™を核としたPhysical AIソリューションが発表されました。数十億ドル規模のAI工場をデジタルツインで事前検証する新時代の産業DX手法を解説します。
NVIDIAPhysical AIデジタルツイン
AI2026-03-17
NVIDIA NemoClawとは — GTC 2026で発表されたエンタープライズAIエージェント基盤の全貌
NVIDIAがGTC 2026で発表したNemoClawは、完全オープンソースのエンタープライズAIエージェントプラットフォームです。NeMo Framework、Nemotronモデル、NIM推論サービスの3コンポーネント構成、OpenShellサンドボックス、ハードウェア非依存設計など、企業が安全にAIエージェントを運用するための包括的な機能を解説します。
NVIDIANemoClawGTC 2026
AI2026-03-17
NemoClaw × OpenClaw — NVIDIAが提案するAIエージェント開発の新パラダイム
NVIDIAが2026年3月に発表したNemoClawとOpenClawの組み合わせによる、エンタープライズAIエージェント開発の新しいアプローチを解説。OpenShellによる安全な実行環境、Supervisor+Worker型マルチエージェントアーキテクチャ、LangChain・LlamaIndex等の主要フレームワーク統合について技術的に詳述します。
NemoClawOpenClawAIエージェント開発