NVIDIA Vera CPU初ベンチマーク——88コアでEPYCに肉薄か

NVIDIAが12年ぶりに送り出すフルカスタムCPU——その初代「Vera」が、いきなりAMD EPYCに肉薄するベンチマーク結果を叩き出しました。88コアの初代サーバーコアでこの水準は「初代カスタムサーバーコアとしては衝撃的」と評価されており、AI時代のサーバーCPU勢力図を揺さぶる可能性がある一報です。一方で、テスト項目はNVIDIA本社で同社がキュレーションした限定セットで、電力効率は今回測定されていません。NVIDIAがx86サーバー市場の一角を本気で狙い始めたことが、これでようやく数字として見え始めた形です。

88コア「Olympus」コア、12年ぶりの独自CPU

NVIDIA Veraは、ARM命令セットを採用しながらARM社のコアライセンスは使わずに設計された88コアのフルカスタムサーバーCPUで、コア名は「Olympus」です。CPU本体は8枚のSOCAMM2メモリモジュール（LPDDR5X搭載、ガムスティック状の小型PCB）に囲まれた構成が公開されています。NVIDIAがカスタムCPUコアを作るのは、12年前にTegra K1で投入された「Denver」以来となります。Denverがモバイル電力枠に縛られたデスクトップ級設計だったのに対し、Veraはサーバー級電力枠を与えられたサーバー級モンスター、というのが今回の位置づけです。

比較対象はシングル/デュアル構成のAMD EPYC「Turin」シリーズと、Intel「Granite Rapids」世代のXeonチップです。Phoronixでテストを担当したMichael Larabel氏は「Intel/AMD x86_64 CPUに対する競争力は、これまで他のARM系・非x86_64プロセッサーで見たことがないレベル」とコメントしており、多くのテストで単独勝利こそしていないものの、EPYC構成と非常に近い水準で走っている点を、初代カスタムサーバーコアとしては衝撃的だと評価しています。テストはコードコンパイル、合成メモリベンチマーク、AV1ビデオエンコード、Python、Java OpenJDK、ファイル圧縮、Lua JIT、データベースベンチマークなど幅広い領域で実施されました。

per-thread性能でもx86に並ぶ場面——強い領域はFFT・DB・JVM

per-thread（コアあたり性能）の観点でも、興味深い結果が報告されています。Gem5のコンパイル時間テストでVeraを上回ったのは「AMD EPYC 9575Fのみ」とされ、Linuxカーネルのビルドではサーバーチップ群の中でVeraが先頭に立ったと伝えられています。従来ARMサーバーは「コア数で押し切るが単スレッド性能ではx86に届かない」とされてきましたが、その構図を覆しうる結果です。

幾何平均で見るとVeraがそれなりの差をつけてトップに立っており、特に以下の領域で強さを見せたとされています。各ベンチマークが何を測るかも合わせて整理します。

LuaJIT FFT — 高速フーリエ変換を含む数値計算系の処理。科学計算・信号処理に近い領域です。
ClickHouseデータベースサーバー — 大規模ログや分析用途で広く使われている列指向DB。クラウドの分析基盤やSaaSのバックエンドで採用が増えています。
Renaissance JVMベンチマーク — Java系ワークロードを総合的に測る指標。Larabel氏は同テストでVeraが「競合を完全に圧倒した」と表現しています。

ただしこれらは「Veraが想定する得意領域」を中心にした結果である点に注意が必要です。

ベンチマークはNVIDIAキュレーションの限定セット——電力効率は未測定

今回のデータには重要な留保があります。テストはNVIDIAのサンタクララ本社で同社が「intended markets（想定市場）・対象ユースケース」に合わせて選定したものであることが明記されており、Larabel氏自身も、今回の結果は普段サーバーCPU評価で使う一連のベンチマークの「small subset（小さな部分集合）」に過ぎず、データは妥当だがすべてのワークロードを代表するとは限らないと述べています。つまり、Veraが得意とする領域以外も含めた総合的な勝敗を語れる段階ではない、ということです。

電力効率も今回の測定対象から外されています。NVIDIAによるとVera本体のTDPは450Wで、使用される高速SOCAMM2メモリはさらに50Wを消費するとされています。これに対しXeonとEPYCは比較構成でプラットフォームのメモリ電力を除いて500Wと評価されていますが、実消費電力はTDP値から大きく離れることもあるため、別途の検証を待つ必要があると伝えられています。AIデータセンターでは電力インフラの逼迫が深刻化しており、ワット性能はベンチ数値以上に重みを持つ要素です。

オープンソース上流の対応も加点要素

ソフトウェア面では、Larabel氏が上流オープンソースでの対応が良好であると評しており、メインラインの対応状況が今後の普及に向けて好材料として挙げられています。長期運用を前提とするサーバー市場では、ベンダー独自ドライバーへの依存度が低いほど採用しやすく、Veraの普及シナリオを下支えする要素です。

読者にとっての「So What?」——AIクラウドのコスト構造への影響

サーバーCPUの話題は一見遠く見えますが、実は身近です。NVIDIAがGPUに続いてCPUでもAMD・Intelに迫る競争力を持てば、AIデータセンターの調達構造が大きく変わります。VeraはRubin GPUと組み合わせた構成のほか、Vera単体のサーバーとしても提供されると報じられており、NVIDIAスタックの一体提供が進むほど、私たちが使うクラウドサービス・生成AIサービスの料金や供給制約に影響が及ぶ可能性があります。現時点では「初代のカスタムサーバーCPUとしては想定以上の競争力を示したが、測定範囲は限定的で電力効率は未確認」と判断するのが妥当な情報です。独立系メディアによる広範なワークロード検証が出てくるのを待ちましょう。

Q&A

Q. NVIDIA Veraはどのような製品ですか？ NVIDIAが設計した88コアのカスタムサーバーCPUです。ARM命令セットを採用しつつ、ARM社のコアライセンスは使わず独自設計の「Olympus」コアを搭載しています。本体TDPは450Wで、LPDDR5X搭載のSOCAMM2メモリモジュール8枚と組み合わせた構成が示されています。

Q. いつ・どこで使えるようになりますか？ 具体的な出荷時期や、日本を含む各クラウド事業者での採用については現時点で明らかにされていません。Rubin GPUとセットでデータセンター向けに展開されるとみられます。

Q. 今回のベンチマーク結果はどこまで信頼できますか？ テスト自体はLinuxの標準的な定番ベンチマーク（Gem5コンパイル、Linuxカーネルビルド、LuaJIT FFT、ClickHouse、Renaissance JVMなど）を用いて実施されていますが、項目はNVIDIAが「想定市場・対象ユースケース」に合わせて選定したものです。担当者本人も「通常評価の小さな部分集合」と明言しており、電力効率は未測定、すべてのワークロードを代表するわけではない点に留意が必要です。