導入事例

2025.10.02

熊本大学工学部 眞山・圓谷研究室様

GPUサーバを導入いただきました。

研究室紹介

熊本大学工学部 眞山・圓谷研究室様は主に2つの分野の研究をされています。結晶塑性解析分野では金属材料の微視組織と変形挙動の関係をもとに、力学特性を高精度に予測する手法を開発されており、第一原理計算分野では構造材料や熱電変換材料などの物性と機能を理論的に予測する研究を行われています。

圓谷先生と研究室の皆さん

先生からもらうキャプチャ画像

熊本大学工学部 眞山・圓谷研究室

https://www.msre.kumamoto-u.ac.jp/~koriki/

固体材料の第一原理電子状態計算用 GPUサーバ

今回、解析用に使われている GPUサーバのご提案から設置作業まで HPCテックで執り行なわせていただきました。とても早いサイクルで多様な GPUが発売されており、特に AI用のものが大半でそれらが研究にマッチするのか等を心配した経緯もありましたので眞山・圓谷研究室様の研究内容や GPUサーバをどの分野で使われていてどのくらい有効なのかを圓谷先生にお聞きしました。

HPCテック 横山、 HPCテック 片山、 熊本大学 圓谷貴夫 准教授

圓谷先生の研究内容を教えてください。
私の研究は、物質・材料の電子構造や原子配列を、第一原理計算や統計熱力学的手法を用いて明らかにすることを主軸としています。特に、熊本大学で開発が進められているマグネシウム合金をはじめとする軽金属材料に注目し、相の安定性や変態、さらに急冷や加工といった非平衡状態で現れる構造や界面の形成メカニズムを解明することを目指しています。また、「力学特性の素過程」に着目することで、強度や延性といった機械的特性が原子レベルでどのように生まれるのかを理解することも重要なテーマです。こうした研究を通じて、新しい材料設計の指針を提案するとともに、実験だけでは得ることが難しい情報を計算科学的な視点から補い、材料特性の発現メカニズムをより深く理解することに取り組んでいます。

前回納品させていただいた計算機の選択ポイントや今回導入いただきました GPU選択の理由などをお伺いいたしました。

プロセッサについて
当時、第3世代 Intel Xeon(IceLake-SPプロセッサ)のマシンにおいては、Xeon Gold 6338(56コア)、6330(64コア)なども候補に挙がりました。しかし、これらは 1ノードあたりの消費電力が高く、当時は 100V20Aのコンセントを利用していたため、電源容量に制約がございました。その点、Xeon Gold 6326(32コア)であれば、2ノードを 1つの 1500W電源タップおよび 1台の UPSに接続して安定稼働できることから、同 CPUを選定いたしました。
クラスタの効果について。
当初は Intel Xeon Gold 6326と NVIDIA A800を搭載した計算機 1台構成で運用しておりましたが、GPUを用いた計算では CPU資源が十分に活用されない場面がありました。そこで、CPUによる第一原理計算を効率的に実行できるように、計算ノードを 1台追加してクラスタ化いたしました。その結果、GPU計算とCPU計算を分散させて同時並行的に利用できるようになり、計算資源の有効活用と計算効率の向上につながっております。
NVIDIA A800 40GB Activeを選定した理由について
GPU導入の経緯としては大きく2点ございます。
 
1点目は、当方の専門である固体材料の第一原理電子状態計算において、GPU対応が進んでいたものの、当時は倍精度演算に対応した GPUが望ましかったため、NVIDIA A800を選定いたしました。なお、NVIDIAソフトウェアによる擬似倍精度計算(混合精度による倍精度相当の計算)は、Volta 世代(V100, 2017年頃)から実用的に利用可能となっておりましたが、導入当時(2022年前後)は依然として「ハードウェアで倍精度に対応している GPU」が安心して利用できる選択肢であると考えました。
 
2点目は、分子動力学(MD)計算を量子力学に基づく第一原理計算の精度を保ちながら古典力場並みの速度で実行することを目的とし、機械学習型原子間ポテンシャルの開発に取り組んでいたことによります。この際、原子配置と第一原理計算から得られるエネルギー・力・応力を大量のデータとして学習させる必要があり、大容量の GPUメモリが不可欠でした。そのため、高容量メモリを搭載した NVIDIA A800が最適であると判断いたしました。
さらに当時は、NVIDIA A100や NVIDIA H100が入手困難で価格も高騰していた時期であり、コスト面とのバランスも考慮しました。以上の理由から、倍精度対応と大容量メモリを兼ね備えた NVIDIA A800を導入した次第です。
今回の増設で単精度メインの NVIDIA RTX PRO 6000 Blackwell Max-Q Workstation Editionを選定された理由について。
平面波基底に基づく第一原理計算 VASPの GPU対応プログラムでは、単一の GPUでの計算は CPUで40~60コアを用いた並列計算とほぼ同等の計算時間となります。しかし、複数の GPUを並列利用すると計算スピードが大幅に向上するため、NVIDIA A800に加えて同等のパフォーマンスを発揮できる GPUの導入を検討しました。その結果、NVIDIA RTX PRO 6000 Blackwell Max-Q Workstation Editionを選定しました。本 GPUは単精度ですが、NVIDIAのソフトウェア(CUDA)により擬似倍精度で使用することが可能であり、既に導入している NVIDIA A800と組み合わせた並列計算も想定できます。さらに、従来の GPUより消費電力が低い点も考慮し、大容量メモリと低消費電力、そしてコスト面のバランスが良い選択肢として判断いたしました。

「擬似倍精度」というのは VASPが CUDAベースの GPUライブラリ(cuBLAS/cuFFT 等)を内部で利用して、単精度演算で倍精度相当の精度を確保する仕組みを指しています。

導入時に特別なソフトを追加するのではなく、VASPの GPU対応版+CUDAライブラリで利用可能です。

今後の展望について、教えてください。
今後は、大型計算機(スーパーコンピュータ)のGPU化がますます進むと考えています。第一原理計算手法もGPU対応が不可欠になりつつあり、さらに近年注目されている汎用的な機械学習ポテンシャルの多くもGPU環境でしか動作しません。こうした背景から、GPUを活用した研究の重要性は今後さらに高まるでしょう。そのため、いきなりスパコンに取り組むのではなく、まずは研究室のクラスタ計算機やGPUマシンを活用して、計算条件の確認や環境構築、設定をしっかりと確立しておくことが大切です。その意味でも、研究現場で使いやすいGPUマシンや技術的なサポートを提供してくださるHPCテック社のような存在は、研究を着実に進める上で大きな支えとなっています。今後もこうした連携を通じて、GPU時代に対応した新しい研究スタイルを築いていきたいと考えています。

導入システム

HPCT WRSX32 [管理ノード兼ストレージ]
・CPU:Intel Xeon Gold 6326 x2
・RAM:DDR4-3200 Total 256GB
・SSD:SATA 960GB x2 RAID1
・HDD:SATA 4TB x5 RAID5
・OS:Ubuntu 22.04 LTS
・APP:Jobスケジューラ、他

HPCT WRSX32-4GP [計算ノード]
・CPU:Intel Xeon Gold 6326 x2
・RAM:DDR4-3200 Total 256GB
・SSD:SATA 3.84TB x2
・GPU1:NVIDIA A800 x1
・GPU2:NVIDIA RTX PRO 6000 Max-Q x1
・OS:Ubuntu22.04LTS

無停電電源装置
・1500VA/1200W 100V

 

最後に

圓谷先生 ご多忙な中、お忙しいところ貴重なお時間を頂きありがとうございました。
これからも研究活動に少しでもお役にたてる様、弊社も微力ながらお手伝いをさせていただきます。

弊社では、科学技術計算や解析などの各種アプリケーションについて動作検証を行い、
すべてのセットアップをおこなっております。
お客様が必要とされる環境にあわせた最適なシステム構成をご提案いたします。