OpenAI Codex入門ガイド — クラウド型コーディングエージェントの始め方と基本操作【2026年版】
OpenAI Codexは2025年5月に発表されたクラウド型自律コーディングエージェントです。ChatGPTやデスクトップアプリから利用でき、GitHubリポジトリに接続してコードの作成・テスト・PRまでを自動化します。本ガイドでは基本概念から始め方5ステップ、対応モデル比較まで網羅します。
OpenAI Codexとは? — 旧Codexとの違い
OpenAI Codexは2025年5月に発表されたクラウド型自律コーディングエージェントです。タスクを入力するとクラウド上の隔離されたサンドボックスでコードを書き、テストを実行し、差分をユーザーに返します。 注意: 2021年にリリースされた旧Codex(GPT-3ベースのコード補完モデル)とは完全に別物です。現在のCodexはo3/GPT-5系モデルを基盤とする自律エージェントであり、コード補完ではなくタスク委任が主目的です。2026年2月にはデスクトップアプリ(macOS/Windows)とIDE拡張が公開されました。
アーキテクチャ図 — Codexはどう動くのか?
Codexの処理フローを図解します。 ``` [ChatGPT/デスクトップ/CLI] ↓ [App Server] ↓ [クラウドサンドボックス] ↓ [リポジトリクローン] ↓ [セットアップ: 依存関係インストール(ネット有)] ↓ [エージェント: コード編集・テスト実行(オフライン)] ↓ [差分・ログ・テスト結果] ↓ [ユーザーレビュー → GitHub PR] ``` セットアップフェーズではインターネット接続が許可され、npm/pip等の依存関係をインストールできます。エージェント実行フェーズはオフラインサンドボックスで動作し、外部への意図しないアクセスを防ぎます。
利用可能なインターフェースと対応モデル比較
インターフェース一覧
| インターフェース | 特徴 | 対象ユーザー |
|---|---|---|
| Web (chatgpt.com) | ブラウザで即利用可能 | 初心者・試用 |
| デスクトップアプリ (macOS/Windows) | ネイティブ動作、通知対応 | 日常利用 |
| VS Code拡張 | エディタ内でCodexを操作 | フロントエンド開発者 |
| JetBrains拡張 | IntelliJ/PyCharm対応 | バックエンド開発者 |
| Xcode拡張 | Swift/iOS開発向け | iOSエンジニア |
| CLI | スクリプト・自動化向け | DevOps・上級者 |
2026年4月時点の対応モデル
| モデル | SWE-bench | 特徴 | リリース日 |
|---|---|---|---|
| codex-1 | — | 初代、o3ベース | 2025年5月 |
| GPT-5.3-Codex | 78.2% | 本番標準・バランス型 | 2026年2月 |
| GPT-5.3-Codex-Spark | — | Cerebrasチップで15倍高速 | 2026年2月 |
| GPT-5.4 | 57.7% | 最新・1Mコンテキスト対応 | 2026年3月 |
SWE-benchはGitHubの実際のissueを自動解決できる割合を示すベンチマークです。
始め方5ステップ — Codexをすぐに使う方法
以下の手順でCodexをすぐに使い始められます。 ``` ① ChatGPT Plus以上のプランに加入 ↓ ② chatgpt.com またはデスクトップアプリを開く ↓ ③ Codexパネルを開き、GitHubアカウントを連携(OAuth認証) ↓ ④ リポジトリを選択してタスクをテキストで入力 ↓ ⑤ 差分・テスト結果をレビューし、PRを作成・マージ ``` ステップ③の補足: Codexはリポジトリへの読み書き権限を要求します。初回は権限スコープを確認し、個人リポジトリのみに絞ることも可能です。
「Code」と「Ask」の使い分けは?
Codexには2つのモードがあります。
| モード | 動作 | 用途 | 所要時間 |
|---|---|---|---|
| Code | バックグラウンドでタスク実行 | コード作成・修正・テスト | 1〜30分 |
| Ask | リアルタイム質問応答 | コード解説・設計相談・デバッグヒント | 数秒〜1分 |
Codeモードはサンドボックスを起動して実際にコードを書くため時間がかかりますが、ユーザーはその間に別作業ができます。Askモードはリポジトリのコードを参照しながらリアルタイムで回答します。 推奨フロー: Askで設計を相談 → Codeで実装委任 → Askで差分の疑問を解消 → PRマージ
対応プログラミング言語とサンドボックスモード
対応言語(テストランナーが動くLinuxコンテナなら原則対応)
| 言語 | テストフレームワーク例 | 備考 |
|---|---|---|
| Python | pytest, unittest | 最も実績が豊富 |
| TypeScript/JavaScript | Jest, Vitest, Mocha | Node.js/Deno対応 |
| Go | go test | 標準ツールで動作 |
| Rust | cargo test | Cargo依存関係を自動インストール |
| Java | JUnit, Maven, Gradle | JVM系全般対応 |
| C/C++ | GoogleTest, CMake | makefileも認識 |
サンドボックスの3つのモード
| モード | 説明 | 推奨シーン |
|---|---|---|
| workspace-write | リポジトリ内のみ書き込み可能(デフォルト) | ほとんどのケース |
| read-only | ファイル読み取りのみ | コードレビュー・解析専用 |
| danger-full-access | ホスト外部への書き込みも許可 | 上級者向け・CI統合 |
テストが存在するリポジトリではCodexが修正の正確性を自己検証できるため、品質が大幅に向上します。
料金とプランは?
Codexの利用にはChatGPT Plusプラン以上が必要です。
| プラン | 月額 | Codex利用 | 並列タスク |
|---|---|---|---|
| Free | 無料 | 不可 | — |
| Plus | 3,500円/月 | 制限付き利用可 | 1〜3 |
| Pro | 20,000円/月 | 無制限 | 最大10以上 |
| Team/Enterprise | 要問合せ | 無制限+管理機能 | カスタム |
企業での大規模利用はTeam/Enterpriseプランが適しています。APIを通じた直接利用はOpenAI APIの従量課金でも可能で、入力100万トークンあたり約1,800円〜が目安です(モデルにより変動)。
よくある質問(FAQ)
Q1. Codexはプライベートリポジトリにも対応していますか? はい。GitHub OAuth連携後、プライベートリポジトリを選択して利用できます。コードはタスク実行後にサンドボックスから削除されます。 Q2. 旧Codex APIとの互換性はありますか? ありません。旧Codex(davinci-codex等)は2023年3月に廃止済みです。現在のCodexエージェントはChatGPTのUIまたはAPIエンドポイントから別途利用します。 Q3. Codexが書いたコードは自動でマージされますか? いいえ。Codexは差分とPRドラフトを作成しますが、マージはユーザーが手動で承認します。 Q4. インターネットに接続できない環境でも使えますか? Codexはクラウドサービスのため、ユーザーのマシンからインターネット接続が必要です。オンプレミス版は現時点では提供されていません。 Q5. 1回のタスクでどれくらいのコード量を扱えますか? GPT-5.4では最大100万トークンのコンテキストウィンドウを持ち、大規模リポジトリも解析できます。ただし1タスクで変更するファイル数は少なく絞るほど品質が安定します。 Q6. テストが存在しないリポジトリでも使えますか? 使えます。ただしCodexは自動テスト実行によって結果を検証するため、テストがない場合はコードの正確性をユーザーが手動確認する必要があります。 Q7. CopilotやCursorと何が違うのですか? GitHub CopilotはエディタのリアルタイムAI補完、Cursorはローカルコードベースへのインラインエージェントです。Codexはバックグラウンドで完全なタスクを自律実行し、PRを作成するクラウドエージェントです。補完ツールとエージェントの違いと考えると分かりやすいです。
Codex導入でつまずいたらOflightへ
「リポジトリ連携がうまくいかない」「Codexに任せるタスクの切り分けが分からない」「エンタープライズ向けの安全なCodex運用フローを設計したい」といったご相談は、OflightのAIコンサルティングサービスへお気軽にどうぞ。 Oflightでは、Codexをはじめとする最新AIエージェントの導入支援・開発プロセス改善・チーム向けトレーニングを一貫して提供しています。まずは無料相談から始めましょう。 → AIコンサルティングサービスの詳細を見る
お気軽にご相談ください
お問い合わせ