GPT-5.4 Computer Use API — AI業務自動化の実用化が本格始動
2026年3月5日にリリースされたGPT-5.4 Computer Use APIは、初の汎用AIモデルにネイティブ画面操作機能を搭載。OSWorld-Vベンチマークで人間を超える75%を達成し、レガシーシステム自動化やRPA代替への実用化が加速しています。
GPT-5.4 Computer Use APIの登場背景
2026年3月5日、OpenAIは初の汎用AIモデルにネイティブ画面操作機能を搭載したGPT-5.4 Computer Use APIをリリースしました。これまでAI業務自動化は主にAPI連携やスクリプト生成に限定されていましたが、GPT-5.4はPlaywright経由でブラウザ操作、マウス・キーボードの直接制御を実現。レガシーシステムやGUIベースのアプリケーションに対しても、人間と同様の操作で自動化を適用できるようになりました。特に、API未提供の古いシステムや、複雑な画面遷移を伴う業務プロセスの自動化において、従来のRPAツールを大きく上回る柔軟性と精度を発揮します。
OSWorld-Vベンチマークで人間超え — 75%の精度達成
GPT-5.4 Computer Use APIは、OSWorld-Vベンチマークにおいて75%のスコアを記録し、人間のパフォーマンス72.4%を超えました。このベンチマークは、実際のオペレーティングシステム環境でのマルチステップタスク実行能力を測定するもので、ブラウザ操作、ファイル管理、アプリケーション間連携など多岐にわたるタスクが含まれます。特筆すべきは、GPT-5.2と比較して個別主張エラーが33%減少、全体エラーが18%減少した点です。推論精度の向上により、複雑な条件分岐や例外処理を含む業務フローでも、安定した自動化が可能になっています。
100万トークンコンテキストと推論レベル最適化
GPT-5.4 API版は100万トークンのコンテキストウィンドウを提供し、大量のドキュメントやログファイルを一括処理できます。さらに、推論レベルを5段階(none/low/medium/high/xhigh)で設定可能で、タスクの複雑度に応じてコストと精度を最適化できます。例えば、単純なデータ入力作業には「low」、契約書解析や意思決定を伴うタスクには「high」または「xhigh」を選択することで、必要十分な推論リソースを割り当てられます。価格は$2.50/1M入力トークン、$15/1M出力トークン(Pro版は$30/$180)と、従来のRPAライセンス費用と比較しても競争力のある水準に設定されています。
Tool Searchによる47%トークン削減
GPT-5.4には、Tool Search機能が組み込まれています。これは、250のMCP Atlasタスクを対象とした検証で、47%のトークン削減を実現した技術です。従来、AIエージェントは利用可能なツールやAPIの一覧を毎回コンテキストに含める必要がありましたが、Tool Searchは必要なツールのみを動的に検索・ロードします。これにより、複雑な業務システム環境で数百のAPIやツールが利用可能な場合でも、コンテキストの肥大化を防ぎ、レスポンス速度とコスト効率を大幅に改善できます。大規模なエンタープライズ環境での運用に不可欠な機能です。
Playwright連携によるブラウザ自動化の実例
GPT-5.4はPlaywrightライブラリと統合されており、ChromeやEdgeなどのブラウザ操作を完全に自動化できます。具体的には、Webフォームへのデータ入力、複数画面にわたるワークフローの実行、スクレイピング、テスト実行などが可能です。従来のRPAツールでは画面レイアウトの変更に弱く、頻繁なメンテナンスが必要でしたが、GPT-5.4は視覚認識と自然言語理解を組み合わせることで、UIの小さな変更に対してもロバストに動作します。特に、レガシーな社内システムやSaaS管理画面の操作自動化において、導入・運用コストを大幅に削減できます。
RPA代替とテスト自動化への応用
GPT-5.4 Computer Use APIは、従来のRPAツールが苦手としていた非構造化タスクや判断を伴う業務フローに対応できます。例えば、請求書データの抽出→システム入力→承認フローの起動という一連の作業を、複数のアプリケーションをまたいで実行できます。また、ソフトウェアのUIテスト自動化においても、テストシナリオを自然言語で記述するだけで、GPT-5.4が画面操作とアサーションを自動生成・実行します。これにより、QAエンジニアはテストコードの記述ではなく、テスト設計に集中できるようになります。人間超えの精度と柔軟性により、業務自動化の適用範囲は急速に拡大しています。
まとめ — AI業務自動化の実用化支援
GPT-5.4 Computer Use APIは、AI業務自動化を「実証実験」から「実運用」へと引き上げる画期的な技術です。レガシーシステムの自動化、RPA代替、テスト自動化など、従来は人手に頼らざるを得なかった領域に、AIエージェントを適用できるようになりました。株式会社オブライトでは、GPT-5.4を活用した業務プロセス設計、システム連携開発、導入支援を行っています。既存システムを活かしながらAI自動化を実現したい企業様は、ぜひご相談ください。貴社の業務フローを最適化し、生産性向上を実現します。
お気軽にご相談ください
お問い合わせ