NVIDIA、Vera Rubinを本格投入──AIエージェント時代の推論コストと電力効率を下げる新基盤

2026.05.20

NVIDIAが、AI向け新基盤「Vera Rubin」を本格投入したとVentureBeatが報じた。報道によると、Vera Rubinは7種類のチップで構成され、OpenAI、Anthropic、Meta、Mistral AI、主要クラウド事業者が採用に関わる。

注目点は、モデルの賢さではなく、AIエージェントを大量に動かすためのコストと電力効率だ。NVIDIAはBlackwell世代に比べ、ワットあたり推論スループットを最大10倍、トークンあたりコストを10分の1にできると説明している。

Vera Rubinの構成

要素	役割
Vera CPU / Rubin GPU	大規模モデルの学習・推論を支える中核
NVLink 6 / Spectrum-6	ラック規模で高速に接続するネットワーク
BlueField-4 DPU	データ処理、セキュリティ、ストレージ周辺の負荷を分担
NVL72ラック	72基のRubin GPUと36基のVera CPUを統合する構成

AIエージェントは、単発の質問応答よりも多くの計算資源を使う。複数のツールを呼び出し、コードを実行し、長い文脈を保持し、失敗したらやり直すからだ。推論コストや電力効率が改善すれば、企業はより長いタスクをAIに任せやすくなる。

報道では、AWS、Google Cloud、Microsoft Azure、Oracle Cloud Infrastructureが提供に関わるとされる。日本企業にとっては、クラウド経由でどの地域・価格・SLAで使えるかが実務上の焦点になる。

AI導入の予算は、モデル利用料だけでなく、推論量、コンテキスト長、エージェント実行回数、ログ保管量で膨らむ。Vera Rubinのような基盤競争は、今後のAIサービス価格、レイテンシ、利用上限に直結する。

ベンダー発表の性能値は、実際のワークロードで検証する必要がある。長文処理、コード実行、検索連携、画像処理など、自社の使い方に近いベンチマークで比較しなければ、導入後のコスト差は見誤りやすい。