最新GPUを用いたベンチマークレポート 2022年11月版

電磁界シミュレーションをGPUで実行することで大幅なスピードアップが図れます。 CST Studio Suiteにおいても、GPUを使用することで最新CPUと比べても10倍以上高速に計算することも可能です。本トピックスでは2022年11月現在におけるGPU製品情報に基づき、GPUによるCST演算性能と解析環境に関する情報をご紹介致します。

GPUを用いた高速演算

GPU（Graphics Processing Unit）は画像処理用プロセッサで、コンピュータゲームや3DCGなどのリアルタイムレンダリング処理を可能とするため、大量の演算を並列にパイプライン処理することに適した構成となっています。 GPUが持つ優れた並列演算性能を数値解析に応用する技術が一般化しており、GPGPU（General Purpose Computing on Graphics Processing Units）と呼ばれています。 CSTではいち早く2007年からGPUによる解析に対応しており、大規模問題を高速に解析することに大きな成果をあげてきました。

数値解析に用いるGPU

CSTのシミュレーションに使用するGPUは、ハイエンドグラフィックボード製品または数値演算用途に専用設計されたGPU製品になります。 CSTでは長年NVIDIA社製品を活用しており、ここ数年は性能向上が著しいAMD社製品にも対応しております。

2022年現在、NVIDIA社GPUで最も性能が高い製品は、NVIDIA A100です。通常のグラフィックボードのようにPCI Expressでワークステーションのマザーボードに接続するタイプの他、専用システム向けのタイプも用意されています。

NVIDIA A100（出典；NVIDIA Corporation）

GPUによるシミュレーションの高速化

GPU計算に対応するCSTのソルバーは、現在のところ、時間領域ソルバー、Integral Equationソルバー、Multilayerソルバー、Asymptoticソルバー、PICソルバー、EsPICソルバーになります。このうち、時間領域ソルバーが最もGPU計算が利用されています。時間領域ソルバーでは解析対象の3次元空間をメッシュで離散化し、時間ステップごとに電磁界の支配方程式を解きながら過渡応答を求めます。有限要素法などの他のソルバーに比べて支配方程式自体の計算負荷は低いものの、大容量のデータをメモリとCPU間でやり取りを行うため、メモリ帯域幅が解析スピードに大きな影響を与えます。 GPUの場合、構造的にプロセッサとVRAM間のメモリ帯域幅がCPUに比べて大きいという特徴があり、時間領域ソルバーでは計算速度向上に大きく寄与します。

実際の計算例によるベンチマーク

計算速度の比較として用意した課題としてスマートフォン通話状態の解析モデルを採用しました。人体頭部及び手を含み、メッシュを通常よりもあえて細かく設定するなど高負荷の設定としました。

ベンチマークモデル

解析端末は以下の表の通り5タイプです。基準となるCPUは最新の第3世代Intel Xeon Scalableプロセッサをデュアル構成としたシステムです。 GPUは NVIDIA RTX A6000、NVIDIA A100（80GBモデル）の2パターンを用意しました。 NVIDIA RTX A6000はプロフェッショナル用のハイエンドグラフィックカード最上位機種であり、数値演算専用製品のNVIDIA A100と並んでGPU計算に適した選択肢です。 GPUの駆動数は1台と2台で比較します。

名称	CPU	1×RTX A6000	2×RTX A6000	1×A100	2×A100
CPU/GPU	Intel Xeon Gold 6354 Dual	NVIDIA RTX A6000		NVIDIA A100 (80GB)
メモリ帯域	409.6GB/s (Dual構成)	786GB/s (1台あたり)		1953GB/s (1台あたり)
GPU駆動数	0	1	2	1	2

計算時間の比較

CPUによる計算時間を基準とし、計算速度の倍率をグラフにまとめました。計算時間全体のうち、電磁界の過渡応答を計算する主要部分の時間で比較しています。実際にはメッシュ処理や電磁界分布の生成と言った前後のプロセスが加わります。

計算速度の比較

NVIDIA RTX A6000 1台使用する場合、CPUによる計算に比べて 3.55倍速く計算が出来ます。 2台並列処理を行うことでさらに速度が向上していることが判ります。最も性能の高いNVIDIA A100ではさらに高速に計算が可能となっており、短時間のうちに数多くの解析を可能とする魅力的な製品と言えます。

GPUを搭載する解析端末

今回のベンチマークに採用したGPUを搭載する実際の解析端末の例をご紹介します。ハイエンドGPUの場合、消費電力、PCI Express拡張バスの空間サイズ、GPUによる発熱を冷却する性能等の観点で安定運用を担えるワークステーション・サーバー機を選択することが重要となります。

GPU搭載ワークステーション（出典；HPCシステムズ株式会社）

写真の製品は最大4基のNVIDIA RTX A6000 / NVIDIA A100を搭載可能なワークステーションです。電源容量や排熱能力など、高負荷の連続解析でも安定した稼働が可能な製品です。

なお、シミュレーションの他にもAIなどの機械学習にも広く利用されるGPUの製品サイクルは非常に早く、次々に高性能な製品がリリースされます。また、GPUと組み合わせるCPUの製品動向や、ワークステーションやサーバーの製品情報も絶えず更新されています。当社では常に最新情報の把握に努めており、解析環境に関する知識と経験を基に、CST Studio Suiteを活用するユーザー様に対して設置環境や導入コストに応じた最適な解析環境の選定と導入のサポートを致しております。

以上、GPUによるCST演算性能と解析環境に関する情報をご紹介しました。高速化技術を含め、CST Studio Suiteのご利用をぜひご検討ください。

※ GPUを用いた解析を行うためには、高速化オプション Acceleration Tokenのご契約が必要です。詳しくは、弊社までお問い合わせください。