OpenAIとBroadcomは、LLM推論に最適化した新しいAIアクセラレーター「Jalapeño」を発表した。OpenAIがモデル、カーネル、提供システム、製品ロードマップの知見をもとに設計し、BroadcomとCelesticaがチップ実装、ボード、ラック統合、高性能ネットワーク、量産体制を担う。
生成AIの競争軸は、モデル性能だけでなく、推論をどれだけ安く、速く、安定して提供できるかへ移っている。今回の発表は、OpenAIがプロダクト、モデル、クラウド運用に加え、専用シリコンまで含むフルスタック戦略を強める動きだ。
「汎用GPUの代替」ではなくLLM推論に特化
Jalapeñoは、既存のAIアクセラレーターをLLM向けに流用するのではなく、現代のLLM推論を前提にした設計とされる。OpenAIは、ChatGPT、Codex、API、将来のエージェント製品で日々発生する推論ワークロードを踏まえ、データ移動、メモリ、ネットワーク、サービングパターンを最適化したと説明している。
発表によれば、エンジニアリングサンプルはラボで本番目標の周波数と電力でMLワークロードを実行しており、初期テストでは現行の最先端と比べて性能あたり電力が大きく改善する見込みだ。詳細な性能レポートは今後公開される。
論点 | 発表内容 | 事業上の意味 |
|---|---|---|
設計思想 | LLM推論に特化 | 低遅延・高効率なAI提供につながる |
開発速度 | 設計から生産まで9カ月 | AIによる半導体開発支援の実例になる |
展開規模 | 複数世代でギガワット規模を想定 | データセンター投資と電力確保が競争力になる |
AIインフラの主導権争いが進む
Broadcomは、Tomahawkネットワーキングシリコンなどを含む大規模生産技術でプラットフォームを支える。発表では、Microsoftなどのデータセンターパートナーとともに、2026年からギガワット規模の展開を進める方向が示された。
これは、OpenAIがGPU調達だけに依存しない道を作ろうとしていることを意味する。NVIDIAの強さは続く一方で、主要AI企業が専用チップを持つことで、推論コスト、供給制約、サービス品質の交渉力が変わる可能性がある。
日本企業への示唆
日本の企業にとっても、AI利用コストは導入拡大の大きな制約だ。Jalapeñoのような推論専用チップが普及すれば、チャット、検索、業務エージェント、開発支援などの単価が下がり、AIを日常業務へ組み込みやすくなる。
ただし、専用インフラは特定事業者への依存も強める。企業はモデル性能だけでなく、価格、可用性、データ所在、契約上の継続性を含めてAI基盤を選ぶ必要がある。
参考:OpenAI公式発表

.png&w=384&q=75)
