AI2026-04-07

OpenAI Codex入門ガイド — クラウド型コーディングエージェントの始め方と基本操作【2026年版】

OpenAI Codexは2025年5月に発表されたクラウド型自律コーディングエージェントです。ChatGPTやデスクトップアプリから利用でき、GitHubリポジトリに接続してコードの作成・テスト・PRまでを自動化します。本ガイドでは基本概念から始め方5ステップ、対応モデル比較まで網羅します。

OpenAI Codex コーディングエージェント ChatGPT 自動化 AI開発

OpenAI Codexとは？ — 旧Codexとの違い

OpenAI Codexは2025年5月に発表されたクラウド型自律コーディングエージェントです。タスクを入力するとクラウド上の隔離されたサンドボックスでコードを書き、テストを実行し、差分をユーザーに返します。注意: 2021年にリリースされた旧Codex（GPT-3ベースのコード補完モデル）とは完全に別物です。現在のCodexはo3/GPT-5系モデルを基盤とする自律エージェントであり、コード補完ではなくタスク委任が主目的です。2026年2月にはデスクトップアプリ（macOS/Windows）とIDE拡張が公開されました。

アーキテクチャ図 — Codexはどう動くのか？

Codexの処理フローを図解します。セットアップフェーズではインターネット接続が許可され、npm/pip等の依存関係をインストールできます。エージェント実行フェーズはオフラインサンドボックスで動作し、外部への意図しないアクセスを防ぎます。

Loading diagram...

利用可能なインターフェースと対応モデル比較

インターフェース一覧

インターフェース	特徴	対象ユーザー
Web (chatgpt.com)	ブラウザで即利用可能	初心者・試用
デスクトップアプリ (macOS/Windows)	ネイティブ動作、通知対応	日常利用
VS Code拡張	エディタ内でCodexを操作	フロントエンド開発者
JetBrains拡張	IntelliJ/PyCharm対応	バックエンド開発者
Xcode拡張	Swift/iOS開発向け	iOSエンジニア
CLI	スクリプト・自動化向け	DevOps・上級者

2026年4月時点の対応モデル

モデル	SWE-bench	特徴	リリース日
codex-1	—	初代、o3ベース	2025年5月
GPT-5.3-Codex	78.2%	本番標準・バランス型	2026年2月
GPT-5.3-Codex-Spark	—	Cerebrasチップで15倍高速	2026年2月
GPT-5.4	57.7%	最新・1Mコンテキスト対応	2026年3月

SWE-benchはGitHubの実際のissueを自動解決できる割合を示すベンチマークです。

始め方5ステップ — Codexをすぐに使う方法

以下の手順でCodexをすぐに使い始められます。

① ChatGPT Plus以上のプランに加入
          ↓
② chatgpt.com またはデスクトップアプリを開く
          ↓
③ Codexパネルを開き、GitHubアカウントを連携（OAuth認証）
          ↓
④ リポジトリを選択してタスクをテキストで入力
          ↓
⑤ 差分・テスト結果をレビューし、PRを作成・マージ

ステップ③の補足: Codexはリポジトリへの読み書き権限を要求します。初回は権限スコープを確認し、個人リポジトリのみに絞ることも可能です。

「Code」と「Ask」の使い分けは？

Codexには2つのモードがあります。

モード	動作	用途	所要時間
Code	バックグラウンドでタスク実行	コード作成・修正・テスト	1〜30分
Ask	リアルタイム質問応答	コード解説・設計相談・デバッグヒント	数秒〜1分

Codeモードはサンドボックスを起動して実際にコードを書くため時間がかかりますが、ユーザーはその間に別作業ができます。Askモードはリポジトリのコードを参照しながらリアルタイムで回答します。 推奨フロー: Askで設計を相談 → Codeで実装委任 → Askで差分の疑問を解消 → PRマージ

対応プログラミング言語とサンドボックスモード

対応言語（テストランナーが動くLinuxコンテナなら原則対応）

言語	テストフレームワーク例	備考
Python	pytest, unittest	最も実績が豊富
TypeScript/JavaScript	Jest, Vitest, Mocha	Node.js/Deno対応
Go	go test	標準ツールで動作
Rust	cargo test	Cargo依存関係を自動インストール
Java	JUnit, Maven, Gradle	JVM系全般対応
C/C++	GoogleTest, CMake	makefileも認識

サンドボックスの3つのモード

モード	説明	推奨シーン
workspace-write	リポジトリ内のみ書き込み可能（デフォルト）	ほとんどのケース
read-only	ファイル読み取りのみ	コードレビュー・解析専用
danger-full-access	ホスト外部への書き込みも許可	上級者向け・CI統合

テストが存在するリポジトリではCodexが修正の正確性を自己検証できるため、品質が大幅に向上します。

料金とプランは？

Codexの利用にはChatGPT Plusプラン以上が必要です。

プラン	月額	Codex利用	並列タスク
Free	無料	不可	—
Plus	3,500円/月	制限付き利用可	1〜3
Pro	20,000円/月	無制限	最大10以上
Team/Enterprise	要問合せ	無制限+管理機能	カスタム

企業での大規模利用はTeam/Enterpriseプランが適しています。APIを通じた直接利用はOpenAI APIの従量課金でも可能で、入力100万トークンあたり約1,800円〜が目安です（モデルにより変動）。

よくある質問（FAQ）

Q1. Codexはプライベートリポジトリにも対応していますか？ はい。GitHub OAuth連携後、プライベートリポジトリを選択して利用できます。コードはタスク実行後にサンドボックスから削除されます。 Q2. 旧Codex APIとの互換性はありますか？ ありません。旧Codex（davinci-codex等）は2023年3月に廃止済みです。現在のCodexエージェントはChatGPTのUIまたはAPIエンドポイントから別途利用します。 Q3. Codexが書いたコードは自動でマージされますか？ いいえ。Codexは差分とPRドラフトを作成しますが、マージはユーザーが手動で承認します。 Q4. インターネットに接続できない環境でも使えますか？ Codexはクラウドサービスのため、ユーザーのマシンからインターネット接続が必要です。オンプレミス版は現時点では提供されていません。 Q5. 1回のタスクでどれくらいのコード量を扱えますか？ GPT-5.4では最大100万トークンのコンテキストウィンドウを持ち、大規模リポジトリも解析できます。ただし1タスクで変更するファイル数は少なく絞るほど品質が安定します。 Q6. テストが存在しないリポジトリでも使えますか？ 使えます。ただしCodexは自動テスト実行によって結果を検証するため、テストがない場合はコードの正確性をユーザーが手動確認する必要があります。 Q7. CopilotやCursorと何が違うのですか？ GitHub CopilotはエディタのリアルタイムAI補完、Cursorはローカルコードベースへのインラインエージェントです。Codexはバックグラウンドで完全なタスクを自律実行し、PRを作成するクラウドエージェントです。補完ツールとエージェントの違いと考えると分かりやすいです。

Codex導入でつまずいたらOflightへ

「リポジトリ連携がうまくいかない」「Codexに任せるタスクの切り分けが分からない」「エンタープライズ向けの安全なCodex運用フローを設計したい」といったご相談は、OflightのAIコンサルティングサービスへお気軽にどうぞ。 Oflightでは、Codexをはじめとする最新AIエージェントの導入支援・開発プロセス改善・チーム向けトレーニングを一貫して提供しています。まずは無料相談から始めましょう。 → AIコンサルティングサービスの詳細を見る

お気軽にご相談ください

お問い合わせ