OpenAIは、ChatGPT、API、Codex向けに「GPT‑5.4」を公開した。GPT‑5.4 ThinkingとGPT‑5.4 Proを軸に、専門職の知識労働、コーディング、コンピューター操作、長い文脈をまたぐエージェント作業を強化したと説明している。
注目点は、モデルが単に回答するだけでなく、作業計画を示しながらツールやソフトウェア環境を扱う方向へ進んでいることだ。企業にとっては、AIの評価軸が「チャットの賢さ」から「実務成果物をどれだけ少ない往復で仕上げられるか」へ移る。
GPT‑5.4で何が変わるのか
領域 | 発表内容 | 現場での意味 |
|---|---|---|
知識労働 | GDPvalで83.0%の勝ちまたは引き分け | 資料、表計算、分析、文書作成など成果物ベースの評価が進む |
コーディング | SWE-Bench Proで57.7% | Codexでの修正・検証・長時間タスクに使いやすくなる可能性 |
コンピューター操作 | OSWorld-Verifiedで75.0% | アプリ横断の操作やワークフロー自動化へ広がる |
長文脈 | 最大100万トークン文脈をサポート | 大規模なコードベース、資料群、業務ログを一度に扱いやすい |
「計画を見せるAI」は業務導入に効く
ChatGPTのGPT‑5.4 Thinkingでは、回答前に作業計画を示し、ユーザーが途中で方向修正できるようになる。これは、AIを業務に使う際に重要な変更だ。完成物だけを受け取るよりも、どの前提で進めているかを確認できる方が、誤解や手戻りを減らしやすい。
OpenAIは、深いWeb調査、スプレッドシート、プレゼンテーション、文書編集でも改善をうたう。日本企業で考えると、営業資料、経営会議向け分析、法務・財務の下書き、開発タスクの分解など、複数部署をまたぐ仕事で効果が出やすい。
導入時の注意点
高性能化しても、AIが扱うデータ、外部ツールへの接続、成果物のレビュー責任は設計が必要だ。特に100万トークン級の文脈やコンピューター操作を許可する場合、機密情報の混入、権限の過大付与、誤操作の影響範囲を事前に整理したい。
AIが「最後までやる」ほど便利になる一方、どこで人間が承認するかを曖昧にすると、業務リスクも増える。GPT‑5.4は、モデル性能だけでなく、AIを仕事の流れに組み込む設計力を企業に問う更新だ。
参考:OpenAI公式発表

.png&w=384&q=75)