Hermes Desktop 完全解説 — Nous Research が放つ OSS 常駐型パーソナルエージェントの全貌
Nous Research が公開した Hermes Desktop は、NVIDIA GTC キーノートで Jensen Huang が初お披露目した Hermes Agent のネイティブデスクトップアプリ版。MIT ライセンスの OSS として macOS・Windows・Linux に対応し、音声モード・cron スケジューラ・Computer Use・MCP ゲートウェイを統合した 常駐型パーソナルエージェント GUI を提供する。CLI・TUI・メッセンジャーと設定・スキル・メモリを完全共有し、ターミナルで開始した作業をデスクトップアプリでシームレスに継続できる点が最大の特徴。本コラムでは機能・競合比較・日本企業向け導入ポイントを詳説する。
TL;DR — Hermes Desktop の正体
Hermes Desktop は、AIモデル研究組織 Nous Research が開発・公開した Hermes Agent のネイティブデスクトップアプリ版(現行バージョン: v0.15.2)。MIT ライセンスの OSS として GitHub で公開されており、macOS 12 以上・Windows 10/11・Linux の3プラットフォームに対応する。Electron + React のフロントエンドと Python バックエンドで構成され、CLI・TUI・各種メッセンジャーインテグレーションと 同一エージェントコア・同一設定・同一メモリ を共有する点が最大の特徴だ。単なるチャット UI ではなく、音声モード・自然言語 cron スケジューラ・macOS Computer Use・MCP ゲートウェイ管理などを統合した 常駐型パーソナルエージェント GUI として設計されている。
公式発表と GTC でのデモ
Hermes Desktop は NVIDIA GTC 2026 キーノートにおいて Jensen Huang 氏によって初めて披露された。その後、公式 X アカウント(@NousResearch)が 'The next evolution of Hermes Agent is here! Introducing Hermes Desktop: everything you love about Hermes, now native on your machine. First demoed in Jensen's GTC keynote, it's now in public preview.' と発表し、Public Preview として一般公開された。共同創業者の Teknium 氏も 'It's finally here. The official Hermes Desktop app. Available on all platforms.' とポストしており、長らくコミュニティが待ち望んでいたマイルストーンリリースであることが伝わる。公式ページは hermes-agent.nousresearch.com/desktop、ドキュメントは 公式 User Guide で参照できる。
インストールと配布形態
各プラットフォームの配布形態は以下のとおり。macOS は署名・公証済み DMG として配布されるため、Gatekeeper による警告なしにインストールできる。Windows は署名済み EXE 形式で、WSL(Windows Subsystem for Linux)は不要なネイティブ実行を実現している。Linux は `curl` 経由のインストールスクリプトに `--include-desktop` フラグを付けるか、既存の Hermes CLI が導入済みであれば `hermes desktop` コマンド一発で起動できる。インストール先は環境変数 `HERMES_HOME`(デフォルト: `~/.hermes`)で、CLI と同一ディレクトリレイアウトを採用しているため、既存の CLI ユーザーは追加設定なしでデスクトップアプリに移行できる。なお、Microsoft Store や Homebrew、AppImage での公式配布については、執筆時点(2026-06-03)では公式ドキュメントで確認できていない。
主要機能:音声・cron・ファイルブラウザ・Computer Use
Hermes Desktop が提供する主要機能を列挙する。ストリーミング応答とツール実行可視化:エージェントがどのツールをどの順番で呼び出したかをリアルタイムに UI で確認できる。ファイルブラウザ:ローカルファイルへのアクセスをドラッグ&ドロップ含む GUI で操作可能。音声モード:マイクからの自然言語入力でエージェントを操作でき、ハンズフリーワークフローを実現する。自然言語 cron スケジューラ:'毎朝9時にメールを要約して Slack に投稿' のような自然言語でスケジュールを定義できる。プロファイル / スキル / ゲートウェイ管理 UI:これまで YAML ファイルを直接編集する必要があった設定をグラフィカルに管理できる。プロバイダ・モデル・API キー管理:OpenAI・Anthropic・xAI など複数プロバイダのキーを設定 UI から一元管理。macOS Computer Use:画面操作の自動化を macOS ネイティブで実行できる機能で、GUI アプリの自動操作・RPA 的ユースケースに対応する。
CLI / Desktop / メッセンジャー間の透過的セッション共有
Hermes Desktop の最大の差別化要素の一つが、CLI・ゲートウェイ・TUI・メッセンジャーインテグレーションとの完全な設定・セッション共有だ。同一の `HERMES_HOME` ディレクトリを参照しているため、ターミナルで `hermes run` コマンドで開始したタスクをデスクトップアプリで引き継ぐ、あるいはその逆も透過的に行える。API キー・スキル・メモリ・会話セッションはすべて共有されており、'どのフロントエンドから接続するか' はエージェントの動作に影響しない設計になっている。チームでゲートウェイサーバーを立ち上げつつ、個々のメンバーはデスクトップアプリ・CLI・Slack ボットのいずれからでも同じエージェントに接続する、というハイブリッド運用が可能だ。
v0.15 / v0.14 の進化点
現行バージョン v0.15.2 は 2026-05-29 にリリースされた。直前の v0.15.0 'Velocity Release'(2026-05-28、累計 1,302 コミット)ではエージェントアーキテクチャを大幅にリファクタリングし、コード量を 76% 削減しながらマルチエージェント Kanban ビューを強化した。v0.14.0(2026-05-16)では xAI Grok OAuth 統合・`x_search` ツール・OpenAI 互換プロキシ・Microsoft Teams 連携を追加している(詳細は Hermes Agent が X Premium・Grok 連携を強化した v0.14 の解説コラム を参照)。わずか2週間で2つのメジャーバージョンをリリースするペースは、OSS プロジェクトとして異例の開発速度といえる。
競合との位置づけ
Hermes Desktop のポジションを主要競合と比較する。Claude Code / OpenAI Codex CLI はターミナル中心のコーディング特化エージェントであり、GUI は提供していない(Claude Code の Agent View 解説、Codex Computer Use Windows 解説 も参照)。Cursor / Windsurf / Antigravity はエディタ統合型で、コードベースの編集に特化している(Cursor Automations、Windsurf × Devin 統合、Google Antigravity 2.0 も参照)。Hermes Desktop はコードエディタではなく OS 全体の自動化・メッセージング横断の常駐型パーソナルエージェント GUI として設計されており、Computer Use による画面操作・スケジューラ・音声入力を組み合わせた RPA 的ユースケースを担う。また、OSS + ローカル実行 + 永続メモリ の組み合わせは、クラウド完結型の競合サービスにはない強みだ。
NVIDIA RTX / DGX Spark との親和性
GTC キーノートでのデモという経緯からも明らかなように、Hermes Desktop は NVIDIA のエコシステムとの親和性が高い。NVIDIA ブログ では RTX AI Garage シリーズの一環として Hermes Agent と DGX Spark の組み合わせが紹介されており、ローカル GPU を活用したオンプレミス LLM 推論との統合が想定されている。RTX PC や DGX Spark でローカルモデルを動かしながら、Hermes Desktop の GUI からプロバイダ設定でそのエンドポイントを指定すれば、クラウド API を一切使わないフルローカル AI エージェント環境が構築できる。データが社外に出ないこの構成は、機密情報を扱う業務での採用に直結する。
エンタープライズ・データ主権視点
MIT ライセンスの OSS であるため、ソースコードを完全に検証した上でオンプレミス環境に閉じた形でデプロイできる。Hermes Portal 経由のホスト LLM アクセスは Free / Plus / Super / Ultra の4階層が存在するが、各プランの正確な価格は執筆時点で公式デスクトップページに記載がないため、最新情報は 公式ページ で確認されたい。ローカル LLM を使用する場合はデータが外部に送信されないため、個人情報・営業秘密・設計情報を含む業務への適用が検討しやすい。また、ゲートウェイサーバーを社内に設置し、各メンバーのデスクトップアプリが社内ゲートウェイ経由でのみ LLM にアクセスする構成を取れば、API キーの集中管理とアクセスログの一元取得が可能になる。
日本企業から見た意義
日本企業が Hermes Desktop に注目すべき理由は複数ある。第一に、Windows ネイティブ実行(WSL 不要)。日本企業の PC 環境は Windows が大多数であり、WSL のセットアップを社員全員に求めることが難しい場合でも、署名済み EXE を配布するだけで展開できる。第二に、GUI による設定の民主化。YAML を直接編集せずとも、スキルやゲートウェイを GUI で管理できるため、非エンジニアの業務担当者でも利用ハードルが下がる。第三に、音声モードによるアクセシビリティ向上。第四に、OSS によるカスタマイズ・内製化の余地。ベンダーロックインを嫌う企業や、独自スキル・独自ゲートウェイを実装したい企業にとって、MIT ライセンスは大きなアドバンテージだ。AI コンサルティング の観点からは、Hermes Desktop を社内 AI エージェント基盤の候補として評価・PoC するプロジェクトの引き合いが今後増加すると予想される。Forward Deployed Engineer (FDE) 的な役割を持つ人材が社内に居れば、カスタマイズと展開を内製で進めることも現実的だ。
公式に確認できなかった事項
本コラム執筆時点(2026-06-03)において、一次ソースで確認できなかった事項を明示する。正確な GA (General Availability) 日付: 現在は Public Preview の状態。GA の日程は公式アナウンスを待つ必要がある。Free / Plus / Super / Ultra の各プラン価格: 4階層の存在は確認されているが、公式デスクトップページ に価格の記載がなかった。Microsoft Store での公式配布: 現時点では確認できていない。Homebrew Cask や AppImage での公式配布: 同上。これらの情報は公式ドキュメントが更新され次第、随時確認されることを推奨する。
FAQ
Q1. Hermes Desktop は完全無料で使えますか? A. アプリ自体は MIT ライセンスの OSS として無償で利用できる。Hermes Portal 経由のホスト LLM アクセスには Free を含む4階層のプランがあるが、各プランの詳細価格は公式ページで確認のこと。自前の LLM エンドポイント(ローカルモデルや他社 API)を指定する場合はポータル課金は発生しない。 Q2. 既存の Hermes CLI ユーザーはデータを移行する必要がありますか? A. 不要。`HERMES_HOME`(`~/.hermes`)を CLI と共有するため、既存のスキル・メモリ・API キー・セッション履歴をそのままデスクトップアプリで利用できる。 Q3. Windows で WSL は必要ですか? A. 不要。Windows 10/11 向けにネイティブ実行する署名済み EXE が提供されており、WSL のセットアップは求められない。 Q4. macOS Computer Use は何ができますか? A. macOS のスクリーンショット取得・マウス/キーボード操作を通じて、GUI アプリの自動操作が可能。RPA 的なワークフロー自動化や、ブラウザ操作を伴うデータ収集などに活用できる。Linux / Windows での Computer Use サポート状況は公式ドキュメントで確認のこと。 Q5. エンタープライズ向けのセキュリティ機能はありますか? A. ゲートウェイサーバーを社内に設置し、デスクトップアプリがそのゲートウェイ経由でのみ外部 LLM にアクセスする構成を取ることで、API キーの集中管理とアクセスログの一元化が可能。OSS のため、ソースコードレベルの監査も実施できる。 Q6. Hermes Desktop と Cursor や Windsurf の違いは何ですか? A. Cursor・Windsurf はコードエディタへの AI 統合に特化している。Hermes Desktop はコードエディタではなく、OS 全体の自動化・メッセージング連携・スケジューラを統合した常駐型パーソナルエージェント GUI。開発業務に限らず、メール要約・スケジュール管理・ファイル操作といった一般業務自動化を主眼としている。 Q7. 日本語インターフェースはありますか? A. 執筆時点では公式ドキュメントに日本語 UI の記載は見当たらない。ただし、接続する LLM が日本語に対応していれば、チャット・スキル・スケジューラなどは日本語で操作できる。
まとめ
Hermes Desktop は、OSS・ローカル実行・永続メモリ・クロスプラットフォーム対応という4つの強みを兼ね備えた、次世代の常駐型パーソナルエージェント GUI だ。NVIDIA GTC でのデモという華々しいデビューから Public Preview まで短期間で到達し、v0.14 → v0.15 と矢継ぎ早にメジャーバージョンを重ねている開発速度は、このプロジェクトへの投資と注目の大きさを物語っている。Claude Code や Cursor が開発者向けのコーディングエージェントとして訴求するのに対し、Hermes Desktop は 業種・職種を問わない業務全般の自動化基盤 として設計されており、エンジニア以外の業務担当者へのリーチも想定している。データ主権を重視する日本企業にとっては、ローカル LLM との組み合わせによるオンプレミス構成も現実的な選択肢となる。導入検討・PoC 支援については オブライトの AI コンサルティング までお問い合わせいただきたい。
References
- Hermes Desktop 公式ページ - Hermes Desktop User Guide - Hermes Agent GitHub リポジトリ (MIT License) - NVIDIA ブログ: RTX AI Garage × Hermes Agent × DGX Spark - 関連コラム: Hermes Agent v0.14 — X Premium・Grok 連携強化 - 関連コラム: Claude Code Agent View と並列オーケストレーション - 関連コラム: Cursor Automations — Agents Window 2026 - 関連コラム: Google Antigravity 2.0 エージェントプラットフォーム - 関連コラム: OpenAI Codex Computer Use Windows 対応 - 関連コラム: Windsurf × Devin — Cognition 統合 - 関連コラム: Forward Deployed Engineer (FDE) 2026 ガイド - オブライト AI コンサルティング
お気軽にご相談ください
お問い合わせ