OpenAI、GPT-5.3-Codexを発表──長時間の実務タスクに向けた開発AIを強化

Mynto編集部

OpenAIは、開発AIモデル「GPT-5.3-Codex」を発表した。GPT-5.2-Codexのコーディング性能とGPT-5.2の推論・専門知識を統合し、25%高速化したモデルとして説明している。

重要なのは、Codexが単なるコード生成から、調査、ツール利用、複雑な実行を含む長時間タスクへ軸足を移している点だ。OpenAIは、作業中でも人間が文脈を失わずに指示を加えられる「同僚のような」使い方を強調している。

発表の主なポイント

項目

内容

実務上の意味

性能

SWE-Bench Pro、Terminal-Benchなどで高い結果を主張

現実の開発タスクに近い評価が重視されている

速度

GPT-5.2系より25%高速化

長時間作業の待ち時間とコストを下げる可能性

作業範囲

研究、ツール利用、複雑な実行まで対象

コード補完ではなく開発工程の一部を任せる方向

自己活用

初期版が自分自身の開発・評価に使われた

AI開発プロセス自体にもエージェント化が進む

企業導入で問われること

開発AIが長時間タスクを担うほど、成果物だけでなく途中経過のログ、テスト、権限、レビュー責任が重要になる。AIがリポジトリを横断して変更する場合、どのブランチで作業し、どこで人間が承認し、どのテストを合格条件にするかを事前に決める必要がある。

日本企業にとっては、エンジニア不足の補助だけでなく、レガシーコード調査、テスト追加、ドキュメント整備、移行計画の下書きなど、後回しになりがちな作業をどう安全に切り出すかが焦点になる。

注意点

ベンチマークの向上は導入判断の出発点にすぎない。自社コード、社内ツール、セキュリティ要件での検証なしに本番変更を任せるのは危険だ。まずは読み取り専用や限定リポジトリで、ログとレビューを残す形から試したい。

参考:OpenAI公式発表

この記事に携わった人
Mynto編集部
Mynto.aiの編集部です。
関連記事
お問い合わせ各種

課題解決のためのお役立ち資料ダウンロードや、
サービスのお問い合わせが可能です。
お気軽にご相談ください。