NVIDIAとGoogle Cloudは、Agentic AIとPhysical AIを本番環境へ押し出すためのAIインフラ協業を拡大した。Google Cloud Nextで発表された内容には、Vera Rubin搭載A5X、Blackwell GPU上のGemini、Confidential VM、Gemini Enterprise Agent PlatformとNVIDIA Nemotron/NeMoの連携が含まれる。
AIの競争軸は、モデル単体から、推論コスト、データセンター効率、機密性、エージェント運用、ロボットやデジタルツインを支える計算基盤へ広がっている。
何が発表されたのか
領域 | 内容 | 意味 |
|---|---|---|
A5X | NVIDIA Vera Rubin NVL72搭載のベアメタルインスタンス | 大規模AIワークロード向けの次世代基盤 |
スケール | 単一サイトで最大8万、マルチサイトで最大96万Rubin GPU構想 | AIファクトリー級のクラスタ運用 |
Gemini on GDC | NVIDIA Blackwell/Blackwell Ultra上でGeminiを実行するプレビュー | 分散・規制環境でのAI活用を後押し |
Agent Platform連携 | Gemini Enterprise Agent PlatformとNemotron/NeMo | 企業エージェント構築を支援 |
AIファクトリーとは何か
AIファクトリーは、AIモデルの学習・推論を継続的に生産するための工場のような基盤だ。大量のGPU、ネットワーク、ストレージ、運用ソフトウェアを組み合わせ、コストと電力効率を管理しながらAIサービスを動かす。
日本企業への示唆
大企業がAIエージェントやデジタルツインを本番導入するには、単にAPIを使うだけでなく、データ所在地、機密計算、推論コスト、社内システム接続をまとめて検討する必要がある。クラウド基盤の選定はAI戦略そのものに近づいている。
注意点
大規模GPU基盤は投資負担が重い。自社で持つべき処理、クラウドで使う処理、軽量モデルで十分な処理を分け、ROIと運用人材を見積もることが重要だ。
参考:NVIDIA公式ブログ


.png&w=384&q=75)

