株式会社オブライト
AI2026-04-07

OpenAI Codex入門ガイド — クラウド型コーディングエージェントの始め方と基本操作【2026年版】

OpenAI Codexは2025年5月に発表されたクラウド型自律コーディングエージェントです。ChatGPTやデスクトップアプリから利用でき、GitHubリポジトリに接続してコードの作成・テスト・PRまでを自動化します。本ガイドでは基本概念から始め方5ステップ、対応モデル比較まで網羅します。


OpenAI Codexとは? — 旧Codexとの違い

OpenAI Codexは2025年5月に発表されたクラウド型自律コーディングエージェントです。タスクを入力するとクラウド上の隔離されたサンドボックスでコードを書き、テストを実行し、差分をユーザーに返します。 注意: 2021年にリリースされた旧Codex(GPT-3ベースのコード補完モデル)とは完全に別物です。現在のCodexはo3/GPT-5系モデルを基盤とする自律エージェントであり、コード補完ではなくタスク委任が主目的です。2026年2月にはデスクトップアプリ(macOS/Windows)とIDE拡張が公開されました。

アーキテクチャ図 — Codexはどう動くのか?

Codexの処理フローを図解します。 ``` [ChatGPT/デスクトップ/CLI] ↓ [App Server] ↓ [クラウドサンドボックス] ↓ [リポジトリクローン] ↓ [セットアップ: 依存関係インストール(ネット有)] ↓ [エージェント: コード編集・テスト実行(オフライン)] ↓ [差分・ログ・テスト結果] ↓ [ユーザーレビュー → GitHub PR] ``` セットアップフェーズではインターネット接続が許可され、npm/pip等の依存関係をインストールできます。エージェント実行フェーズはオフラインサンドボックスで動作し、外部への意図しないアクセスを防ぎます。

利用可能なインターフェースと対応モデル比較

インターフェース一覧

インターフェース特徴対象ユーザー
Web (chatgpt.com)ブラウザで即利用可能初心者・試用
デスクトップアプリ (macOS/Windows)ネイティブ動作、通知対応日常利用
VS Code拡張エディタ内でCodexを操作フロントエンド開発者
JetBrains拡張IntelliJ/PyCharm対応バックエンド開発者
Xcode拡張Swift/iOS開発向けiOSエンジニア
CLIスクリプト・自動化向けDevOps・上級者

2026年4月時点の対応モデル

モデルSWE-bench特徴リリース日
codex-1初代、o3ベース2025年5月
GPT-5.3-Codex78.2%本番標準・バランス型2026年2月
GPT-5.3-Codex-SparkCerebrasチップで15倍高速2026年2月
GPT-5.457.7%最新・1Mコンテキスト対応2026年3月

SWE-benchはGitHubの実際のissueを自動解決できる割合を示すベンチマークです。

始め方5ステップ — Codexをすぐに使う方法

以下の手順でCodexをすぐに使い始められます。 ``` ① ChatGPT Plus以上のプランに加入 ↓ ② chatgpt.com またはデスクトップアプリを開く ↓ ③ Codexパネルを開き、GitHubアカウントを連携(OAuth認証) ↓ ④ リポジトリを選択してタスクをテキストで入力 ↓ ⑤ 差分・テスト結果をレビューし、PRを作成・マージ ``` ステップ③の補足: Codexはリポジトリへの読み書き権限を要求します。初回は権限スコープを確認し、個人リポジトリのみに絞ることも可能です。

「Code」と「Ask」の使い分けは?

Codexには2つのモードがあります。

モード動作用途所要時間
Codeバックグラウンドでタスク実行コード作成・修正・テスト1〜30分
Askリアルタイム質問応答コード解説・設計相談・デバッグヒント数秒〜1分

Codeモードはサンドボックスを起動して実際にコードを書くため時間がかかりますが、ユーザーはその間に別作業ができます。Askモードはリポジトリのコードを参照しながらリアルタイムで回答します。 推奨フロー: Askで設計を相談 → Codeで実装委任 → Askで差分の疑問を解消 → PRマージ

対応プログラミング言語とサンドボックスモード

対応言語(テストランナーが動くLinuxコンテナなら原則対応)

言語テストフレームワーク例備考
Pythonpytest, unittest最も実績が豊富
TypeScript/JavaScriptJest, Vitest, MochaNode.js/Deno対応
Gogo test標準ツールで動作
Rustcargo testCargo依存関係を自動インストール
JavaJUnit, Maven, GradleJVM系全般対応
C/C++GoogleTest, CMakemakefileも認識

サンドボックスの3つのモード

モード説明推奨シーン
workspace-writeリポジトリ内のみ書き込み可能(デフォルト)ほとんどのケース
read-onlyファイル読み取りのみコードレビュー・解析専用
danger-full-accessホスト外部への書き込みも許可上級者向け・CI統合

テストが存在するリポジトリではCodexが修正の正確性を自己検証できるため、品質が大幅に向上します。

料金とプランは?

Codexの利用にはChatGPT Plusプラン以上が必要です。

プラン月額Codex利用並列タスク
Free無料不可
Plus3,500円/月制限付き利用可1〜3
Pro20,000円/月無制限最大10以上
Team/Enterprise要問合せ無制限+管理機能カスタム

企業での大規模利用はTeam/Enterpriseプランが適しています。APIを通じた直接利用はOpenAI APIの従量課金でも可能で、入力100万トークンあたり約1,800円〜が目安です(モデルにより変動)。

よくある質問(FAQ)

Q1. Codexはプライベートリポジトリにも対応していますか? はい。GitHub OAuth連携後、プライベートリポジトリを選択して利用できます。コードはタスク実行後にサンドボックスから削除されます。 Q2. 旧Codex APIとの互換性はありますか? ありません。旧Codex(davinci-codex等)は2023年3月に廃止済みです。現在のCodexエージェントはChatGPTのUIまたはAPIエンドポイントから別途利用します。 Q3. Codexが書いたコードは自動でマージされますか? いいえ。Codexは差分とPRドラフトを作成しますが、マージはユーザーが手動で承認します。 Q4. インターネットに接続できない環境でも使えますか? Codexはクラウドサービスのため、ユーザーのマシンからインターネット接続が必要です。オンプレミス版は現時点では提供されていません。 Q5. 1回のタスクでどれくらいのコード量を扱えますか? GPT-5.4では最大100万トークンのコンテキストウィンドウを持ち、大規模リポジトリも解析できます。ただし1タスクで変更するファイル数は少なく絞るほど品質が安定します。 Q6. テストが存在しないリポジトリでも使えますか? 使えます。ただしCodexは自動テスト実行によって結果を検証するため、テストがない場合はコードの正確性をユーザーが手動確認する必要があります。 Q7. CopilotやCursorと何が違うのですか? GitHub CopilotはエディタのリアルタイムAI補完、Cursorはローカルコードベースへのインラインエージェントです。Codexはバックグラウンドで完全なタスクを自律実行し、PRを作成するクラウドエージェントです。補完ツールとエージェントの違いと考えると分かりやすいです。

Codex導入でつまずいたらOflightへ

「リポジトリ連携がうまくいかない」「Codexに任せるタスクの切り分けが分からない」「エンタープライズ向けの安全なCodex運用フローを設計したい」といったご相談は、OflightのAIコンサルティングサービスへお気軽にどうぞ。 Oflightでは、Codexをはじめとする最新AIエージェントの導入支援・開発プロセス改善・チーム向けトレーニングを一貫して提供しています。まずは無料相談から始めましょう。 → AIコンサルティングサービスの詳細を見る

お気軽にご相談ください

お問い合わせ