OpenAI、GPT‑5.4を公開──知識労働AIは「計画しながら実行する」段階へ

Mynto編集部

OpenAIは、ChatGPT、API、Codex向けに「GPT‑5.4」を公開した。GPT‑5.4 ThinkingとGPT‑5.4 Proを軸に、専門職の知識労働、コーディング、コンピューター操作、長い文脈をまたぐエージェント作業を強化したと説明している。

注目点は、モデルが単に回答するだけでなく、作業計画を示しながらツールやソフトウェア環境を扱う方向へ進んでいることだ。企業にとっては、AIの評価軸が「チャットの賢さ」から「実務成果物をどれだけ少ない往復で仕上げられるか」へ移る。

GPT‑5.4で何が変わるのか

領域

発表内容

現場での意味

知識労働

GDPvalで83.0%の勝ちまたは引き分け

資料、表計算、分析、文書作成など成果物ベースの評価が進む

コーディング

SWE-Bench Proで57.7%

Codexでの修正・検証・長時間タスクに使いやすくなる可能性

コンピューター操作

OSWorld-Verifiedで75.0%

アプリ横断の操作やワークフロー自動化へ広がる

長文脈

最大100万トークン文脈をサポート

大規模なコードベース、資料群、業務ログを一度に扱いやすい

「計画を見せるAI」は業務導入に効く

ChatGPTのGPT‑5.4 Thinkingでは、回答前に作業計画を示し、ユーザーが途中で方向修正できるようになる。これは、AIを業務に使う際に重要な変更だ。完成物だけを受け取るよりも、どの前提で進めているかを確認できる方が、誤解や手戻りを減らしやすい。

OpenAIは、深いWeb調査、スプレッドシート、プレゼンテーション、文書編集でも改善をうたう。日本企業で考えると、営業資料、経営会議向け分析、法務・財務の下書き、開発タスクの分解など、複数部署をまたぐ仕事で効果が出やすい。

導入時の注意点

高性能化しても、AIが扱うデータ、外部ツールへの接続、成果物のレビュー責任は設計が必要だ。特に100万トークン級の文脈やコンピューター操作を許可する場合、機密情報の混入、権限の過大付与、誤操作の影響範囲を事前に整理したい。

AIが「最後までやる」ほど便利になる一方、どこで人間が承認するかを曖昧にすると、業務リスクも増える。GPT‑5.4は、モデル性能だけでなく、AIを仕事の流れに組み込む設計力を企業に問う更新だ。

参考:OpenAI公式発表

この記事に携わった人
Mynto編集部
Mynto.aiの編集部です。
関連記事
お問い合わせ各種

課題解決のためのお役立ち資料ダウンロードや、
サービスのお問い合わせが可能です。
お気軽にご相談ください。