NVIDIAのArmベースのGrace CPU「GH200」とAMDのEPYC 9005「Turin」シリーズとの性能比較が実現した。これまで直接比較されていなかった両プロセッサのベンチマークが、新たにUbuntu 24.04 LTS環境で行われた。このテストは、72コアのGrace CPUと、EPYCのZen 5 Turinアーキテクチャを搭載する9575F(64コア)、9655(96コア)、9755(128コア)のシングルソケット構成により実施されている。
結果はCPU性能とワットあたりの効率性を軸に評価され、リモートアクセスによるハードウェア・ソフトウェアの違いが考慮された。両者の違いを明確にすることで、次世代CPUが求められる高性能計算環境にどれだけ貢献できるかが示されている。
Grace CPUとEPYC Turinのアーキテクチャの特性:ArmとZen 5の違い
NVIDIA Grace CPU「GH200」とAMD EPYC「Turin」は、異なるアーキテクチャを基盤としており、それが性能や使用用途に大きな影響を与える。GH200はArmのNeoverse-V2アーキテクチャを72コア構成で採用し、高度な電力効率と並列処理の性能に優れている。
一方、EPYC TurinはAMDの最新アーキテクチャZen 5を搭載し、特に高性能計算やデータセンター向けの用途で効果を発揮することが特徴だ。Zen 5は、これまでのEPYCシリーズからの改良が施され、より多くのスレッド処理と効率的な電力消費が期待されている。
Phoronixのベンチマーク結果は、CPUの純粋な性能だけでなく、ワットあたりの性能という効率面においても両者を比較する点が興味深い。GH200は、クラウド向けの高密度用途には適さないとされるものの、Armベースの利点を生かし特定の作業負荷において効率的に稼働する。
この違いがどのように影響するのか、性能を追求するAIやHPCシステムの運用者にとって注目に値する要素である。したがって、どちらのアーキテクチャが実環境で優位に立つかは用途に依存するだろう。
ベンチマーク環境の違いとその影響
両プロセッサの比較には、統一されたテスト環境が求められるが、今回のベンチマークではいくつかの要因が完全な公平性を妨げている。Phoronixによるテストでは、Ubuntu 24.04 LTSがベースとなり、NVIDIA Grace CPUシステムにはリモートアクセスによるGH200システムが使用された。これに対し、EPYC側は電力消費量を正確に測定するため、特別なパッチが適用されたカーネルを採用している。
また、GH200システムには単一のNVMeドライブが装備されており、AArch64の性能を引き出すために64Kページサイズのカーネルが用いられている点が特徴である。これらの環境設定の違いは、ベンチマーク結果に影響を与える可能性がある。
特に、AArch64に最適化されていないソフトウェアや動作しないパッケージがあることから、AMDやIntelのx86_64ベースのテスト結果と完全に比較することは難しい。しかし、こうしたハードウェア・ソフトウェアの違いを加味した上でも、ワットあたりの性能に関する洞察は、実運用に役立つ実験的データとして価値がある。
次世代CPUの可能性と今後の市場展望
今回のNVIDIA GH200とAMD EPYC Turinの比較は、次世代CPUが持つポテンシャルを示している。GH200は、Armアーキテクチャの強みを活かし、効率重視の環境に適している一方、EPYC Turinはその強力なスレッド処理能力と電力効率によってデータセンターや高性能計算分野で大きな役割を果たす可能性がある。
さらに、GPTshop.aiによるGH200のリモートアクセス提供は、AIとHPCシステム向けの利用を促進する取り組みであり、同社が今後GB200 Blackwellシステムの提供を予定していることも市場の注目を集めている。このようなCPUの進化は、単に性能面での向上にとどまらず、エネルギー効率や運用コストの削減にも寄与することで、次世代の高性能コンピューティング環境にとって欠かせない存在となるだろう。