OpenAI、GPT-5.3-Codexを発表──長時間の実務タスクへ進むコーディングエージェント

2026.05.19

OpenAIは、コーディングエージェント向けの新モデル「GPT-5.3-Codex」を発表した。GPT-5.2-Codexのコーディング性能とGPT-5.2の推論・専門知識を統合し、同社は「これまでで最も高性能なエージェント型コーディングモデル」と位置づけている。

注目点は、単にコードを書く性能ではなく、調査、ツール利用、複雑な実行を含む長時間タスクを想定していることだ。OpenAIによると、GPT-5.3-CodexはGPT-5.2-Codexより25%高速で、作業中に人間が方針を変更しても文脈を保ったまま進められる。

何が新しいのか

項目	内容
対象領域	コーディング、調査、ターミナル操作、Web開発、長時間の実務作業
性能指標	SWE-Bench Pro、Terminal-Bench、OSWorld、GDPvalで強い性能を示したと説明
速度	GPT-5.2-Codex比で25%高速
運用イメージ	数時間から数日にわたる開発タスクを、人間が途中で監督・修正する

OpenAIは、Codexチームが初期版のGPT-5.3-Codexを使い、学習のデバッグ、デプロイ管理、テスト結果の診断に活用したと説明している。これは、AIエージェントが開発プロセスの一部を補助する段階から、開発基盤そのものを改善する段階へ近づいていることを示す。

開発現場では、AIエージェントに「短い関数を書かせる」だけでなく、調査、修正案作成、テスト、ドキュメント更新までをまとめて任せる運用が現実味を帯びる。特にレガシーコードの改修、社内ツールの改善、検証作業の自動化では効果が出やすい。

長時間動くエージェントほど、権限、ログ、レビュー、停止条件の設計が重要になる。速度と自律性が上がっても、本番環境への変更、機密情報へのアクセス、外部通信は人間の承認と監査を前提にすべきだ。