OpenAI、GPT‑5.4を公開──知識労働AIは「計画しながら実行する」段階へ

2026.06.07

OpenAIは、ChatGPT、API、Codex向けに「GPT‑5.4」を公開した。GPT‑5.4 ThinkingとGPT‑5.4 Proを軸に、専門職の知識労働、コーディング、コンピューター操作、長い文脈をまたぐエージェント作業を強化したと説明している。

注目点は、モデルが単に回答するだけでなく、作業計画を示しながらツールやソフトウェア環境を扱う方向へ進んでいることだ。企業にとっては、AIの評価軸が「チャットの賢さ」から「実務成果物をどれだけ少ない往復で仕上げられるか」へ移る。

GPT‑5.4で何が変わるのか

領域	発表内容	現場での意味
知識労働	GDPvalで83.0%の勝ちまたは引き分け	資料、表計算、分析、文書作成など成果物ベースの評価が進む
コーディング	SWE-Bench Proで57.7%	Codexでの修正・検証・長時間タスクに使いやすくなる可能性
コンピューター操作	OSWorld-Verifiedで75.0%	アプリ横断の操作やワークフロー自動化へ広がる
長文脈	最大100万トークン文脈をサポート	大規模なコードベース、資料群、業務ログを一度に扱いやすい

ChatGPTのGPT‑5.4 Thinkingでは、回答前に作業計画を示し、ユーザーが途中で方向修正できるようになる。これは、AIを業務に使う際に重要な変更だ。完成物だけを受け取るよりも、どの前提で進めているかを確認できる方が、誤解や手戻りを減らしやすい。

OpenAIは、深いWeb調査、スプレッドシート、プレゼンテーション、文書編集でも改善をうたう。日本企業で考えると、営業資料、経営会議向け分析、法務・財務の下書き、開発タスクの分解など、複数部署をまたぐ仕事で効果が出やすい。

高性能化しても、AIが扱うデータ、外部ツールへの接続、成果物のレビュー責任は設計が必要だ。特に100万トークン級の文脈やコンピューター操作を許可する場合、機密情報の混入、権限の過大付与、誤操作の影響範囲を事前に整理したい。

AIが「最後までやる」ほど便利になる一方、どこで人間が承認するかを曖昧にすると、業務リスクも増える。GPT‑5.4は、モデル性能だけでなく、AIを仕事の流れに組み込む設計力を企業に問う更新だ。