「NVIDIA」のコラム

8件の記事

AI2026-07-20

NVIDIA Nemotron 3 必要スペック早見表 — Nano/Super/Ultra のVRAM・GPU構成・量子化別メモリ【2026年版オープンウェイト】

Nemotron 3 Nanoは4-bitで約18GB、Superは8×H100-80GB、UltraはNVFP4で4×B200が公式の目安。NVIDIAのオープンウェイトMoE 3モデルの必要VRAM・GPU構成・量子化別メモリを早見表で整理する。2026年7月時点。

Nemotron 3NVIDIARequirements

AI2026-06-11

DiffusionGemma 徹底解説 — Google DeepMind が2026年6月10日に公開した『業界初のオープン重み大規模テキスト拡散 LLM』、Gemma 4 26B (A4B MoE) と同バックボーンで AR 版比最大4倍速、Apache 2.0、品質は AR に劣るという公式明言まで

Google DeepMind が2026年6月10日に NVIDIA との同時アナウンスで公開した **DiffusionGemma**（`google/diffusiongemma-26B-A4B-it`、25.2B 総 / 3.8B アクティブ MoE）を、[Google 公式ブログ](https://blog.google/innovation-and-ai/technology/developers-tools/diffusion-gemma-faster-text-generation/)・[ai.google.dev モデルカード](https://ai.google.dev/gemma/docs/diffusiongemma/model_card)・[Hugging Face](https://huggingface.co/google/diffusiongemma-26B-A4B-it)・[NVIDIA 公式](https://blogs.nvidia.com/blog/rtx-ai-garage-local-gemma-diffusion/) を一次ソースに整理。**自己回帰（AR）モデルが左から右へ1トークンずつ生成するのに対し、Diffusion 言語モデル（DLM）はマスク／ノイズに満たされた256トークンキャンバスを並列に脱ノイズして文章へ変換する**。1 forward あたり15-20トークン確定、最大48 denoising steps、H100 で 1,000+ tok/sec、RTX 5090 で 700+ tok/sec、AR 版 Gemma 4 比約 3.5-4 倍。一方で **MMLU Pro 77.6 vs 82.6、GPQA 73.2 vs 82.3、MMMU Pro 54.3 vs 73.8** と公式は AR 版に対する **品質劣後を率直に明言**。Apache 2.0、Hugging Face / Vertex AI / NVIDIA NIM 提供、業界初のオープン重み大規模拡散 LLM。日本企業のオンプレ社内エージェント・コード補完・低レイテンシ業務での意義と、Mercury（Inception Labs）/ LLaDA / Gemini Diffusion との位置づけまで整理しています。

Google DeepMindGemma 4DiffusionGemma

AI2026-05-05

NVIDIA DGX Spark で「機密コードはローカルLLM、移植本番はクラウドLLM」を実装する — 2026年版・経営承認を通すリスクヘッジ運用ガイド

NVIDIA DGX Spark（GB10 Grace Blackwell Superchip、128GB ユニファイドメモリ、約 1 PFLOPS FP4、$4,699）の主要スペックと、機密性の高いコード資産の解析・移植案件で「ローカルLLMで分析・個人情報分離→他社LLMで移植」というリスクヘッジを組むための具体的な運用パターンを解説します。クラウドAIのオプトアウトでは経営承認が下りないケースをどう乗り越えるか、実務目線で整理。

NVIDIADGX SparkローカルLLM

AI2026-04-06

NVIDIA PersonaPlex 7B完全ガイド — リアルタイムフルデュプレックス音声AIの仕組みと活用法【2026年版】

NVIDIAが2026年1月にリリースしたPersonaPlex 7Bは、従来のASR→LLM→TTSパイプラインを単一モデルに統合し、真のフルデュプレックス音声対話を実現したオープンソース音声AIです。本記事では、アーキテクチャ、パフォーマンス、セットアップ手順、実践ユースケースまで徹底解説します。

PersonaPlexNVIDIA音声AI

AI2026-03-19

Microsoft Foundry Agent Service GA — エンタープライズ向けエージェント構築基盤が本番環境対応

2026年3月のGTC 2026で発表されたMicrosoft Foundry Agent Serviceの一般提供開始。エージェント構築・運用・監視を統合し、NVIDIA Nemotron対応やVera Rubin NVL72の世界初稼働など、エンタープライズAI基盤の最新動向を解説します。

Microsoft AzureAIエージェントクラウドインフラ

AI2026-03-19

NVIDIA Physical AIとデジタルツイン — GTC 2026が示す産業AI革命の最前線

2026年3月にサンノゼで開催されたGTC 2026では、NVIDIA Isaac™とOmniverse™を核としたPhysical AIソリューションが発表されました。数十億ドル規模のAI工場をデジタルツインで事前検証する新時代の産業DX手法を解説します。

NVIDIAPhysical AIデジタルツイン

AI2026-03-17

NVIDIA NemoClawとは — GTC 2026で発表されたエンタープライズAIエージェント基盤の全貌

NVIDIAがGTC 2026で発表したNemoClawは、完全オープンソースのエンタープライズAIエージェントプラットフォームです。NeMo Framework、Nemotronモデル、NIM推論サービスの3コンポーネント構成、OpenShellサンドボックス、ハードウェア非依存設計など、企業が安全にAIエージェントを運用するための包括的な機能を解説します。

NVIDIANemoClawGTC 2026

AI2026-03-17

NemoClaw × OpenClaw — NVIDIAが提案するAIエージェント開発の新パラダイム

NVIDIAが2026年3月に発表したNemoClawとOpenClawの組み合わせによる、エンタープライズAIエージェント開発の新しいアプローチを解説。OpenShellによる安全な実行環境、Supervisor+Worker型マルチエージェントアーキテクチャ、LangChain・LlamaIndex等の主要フレームワーク統合について技術的に詳述します。

NemoClawOpenClawAIエージェント開発