OpenAI、GPT-5.3-Codexを発表──長時間の実務タスクへ進むコーディングエージェント

Mynto編集部

OpenAIは、コーディングエージェント向けの新モデル「GPT-5.3-Codex」を発表した。GPT-5.2-Codexのコーディング性能とGPT-5.2の推論・専門知識を統合し、同社は「これまでで最も高性能なエージェント型コーディングモデル」と位置づけている。

注目点は、単にコードを書く性能ではなく、調査、ツール利用、複雑な実行を含む長時間タスクを想定していることだ。OpenAIによると、GPT-5.3-CodexはGPT-5.2-Codexより25%高速で、作業中に人間が方針を変更しても文脈を保ったまま進められる。

何が新しいのか

項目

内容

対象領域

コーディング、調査、ターミナル操作、Web開発、長時間の実務作業

性能指標

SWE-Bench Pro、Terminal-Bench、OSWorld、GDPvalで強い性能を示したと説明

速度

GPT-5.2-Codex比で25%高速

運用イメージ

数時間から数日にわたる開発タスクを、人間が途中で監督・修正する

「モデルが自分を作る」段階に近づいた

OpenAIは、Codexチームが初期版のGPT-5.3-Codexを使い、学習のデバッグ、デプロイ管理、テスト結果の診断に活用したと説明している。これは、AIエージェントが開発プロセスの一部を補助する段階から、開発基盤そのものを改善する段階へ近づいていることを示す。

日本企業への示唆

開発現場では、AIエージェントに「短い関数を書かせる」だけでなく、調査、修正案作成、テスト、ドキュメント更新までをまとめて任せる運用が現実味を帯びる。特にレガシーコードの改修、社内ツールの改善、検証作業の自動化では効果が出やすい。

注意点

長時間動くエージェントほど、権限、ログ、レビュー、停止条件の設計が重要になる。速度と自律性が上がっても、本番環境への変更、機密情報へのアクセス、外部通信は人間の承認と監査を前提にすべきだ。

参考:OpenAI公式発表

この記事に携わった人
Mynto編集部
Mynto.aiの編集部です。
関連記事
お問い合わせ各種

課題解決のためのお役立ち資料ダウンロードや、
サービスのお問い合わせが可能です。
お気軽にご相談ください。