京都工芸繊維大学数値材料デザイン研究室様

トップ
導入事例
京都工芸繊維大学数値材料デザイン研究室様

2022.03.02

NVIDIA A100 Tensor Core GPU 搭載サーバと静音ラックを導入頂きました。

京都工芸繊維大学　数値材料デザイン研究室高木知弘教授、坂根慎治助教にお話を伺いました。

DeepEyeVision 株式会社は、AIの力で眼科医療の水準を向上させ、失明を減らすことをビジョンとする自治医科大学眼科学講座発のスタートアップ企業です。同社は、眼底写真を AIによって遠隔読影するサービスや医療機器プログラム（眼科向け画像診断支援 AI）を開発・販売しています。目は透明な臓器なので、眼底写真に写った神経や血管を診ることで、糖尿病や高血圧といった全身疾患の早期発見も可能になります。

研究室のご紹介

数値材料デザイン研究室様はフェーズフィールド法 (phase-field method）を中心とする様々な数値モデルや数値解析手法を用いることで、一連の加工工程で形成される材料組織を予測する技術の開発とそれらを用いた現象解明に関する研究をされています。また、材料組織予測のみではなく、フェーズフィールド法を様々な現象や分野に適用する研究も進められています。

YouTube 機械工学系高木知弘教授の研究テーマ「材料組織の高精度予測シミュレーション」の紹介動画

GPU を使い研究を加速

研究室ではどのような研究をされているのか教えてください。: Phase-field 法を用いた材料組織形成のシミュレーションに関する研究を行っています．最近では、特に凝固組織予測に注力しており、デンドライトと呼ばれる樹枝状結晶の成長シミュレーションを行っています。凝固は、固液相変態、溶質や熱の輸送、液相流動、固体運動などが同時に生じるマルチフィジックス現象ですので、このような現象を効率的に再現可能な数値計算法の構築も行っています。Phase-field シミュレーションは GPU 計算と非常に相性がいいですので、当研究室で行っているほぼすべての数値シミュレーションは GPU を用いて行っています。

Computational Materials Design Lab., Kyoto Institute of Technology

フェーズフィールド法や格子ボルツマン法などの解析で GPU サーバをお使いですが、旧 GPU と新 GPU で違い等は感じられましたでしょうか。 感想などをお聞きしたいと思います。: 新しく導入した NVIDIA Tesla A100 は非常にパワフルですね。V100 に比べると計算速度は約 1.5倍、メモリは約 2.5倍となっています。大規模計算は東工大の TSUBAME を使わせて頂いていますが，現在のTSUBAME3.0 は P100 が搭載されていますので、P100 に比べると速度は約 2倍、メモリは約 5倍であり、A100 の 8基並列計算は P100の 40基並列に対応します。Phase-field 法と実験観察結果をデータ同化で融合する研究も行っていますが、データ同化のように複数の計算を同時に走らせるような場合に威力を発揮しています。

京都工芸繊維大学機械工学系数値材料デザイン研究室ホームページ

http://www.cmd.kit.ac.jp

導入システム

HPCT RS4E32-8GP

　GPU : NVIDIA A100-PCIe x8
　　　　 80GB HBM2e
　CPU : AMD EPYC 7003 Series x2
　　　　 48Core 2.3GHz
　RAM : DDR4-3200 Total 1,024GB
　SSD : 1.92TB PCIe4（OS）x1
　SSD : 7.68TB PCIe4（Data）x1
　OS : Ubuntu 20.04 LTS

HPCT SR80

18U 防音特化型静音ラック
GPU 計算機用改
騒音減衰量：-30.2dB(A)

HPCT SR45

12U 防音特化型静音ラック
GPU 計算機用改
騒音減衰量：-26.3dB(A)

HPCT R426gs-10GPDL

GPU : NVIDIA Tesla V100 x8
　　　32GB HBM2
CPU : Xeon Gold 6200 Series x2
　　　 16Core 2.8GHz
RAM : DDR4-2933 Total 768GB
SSD : 960GB（OS）x1
HDD : 2TB（Data）x1
OS : Ubuntu 18.04 LTS

営業担当コメント

HPC テックでは、今回ミニスパコンとも言える NVIDIA A100 を８基搭載したハイエンドサーバ HPCT RS4E32-8GP 1台と NVIDIA TESLA V100 32GB を 8基搭載したハイエンドサーバ HPCT R426gs-10GP 1台、サーバルームではなく居室に設置されるとのことで静音ラック HPCT SR80 のご提案をしました。大きな特徴は 1CPU あたり DDR4-3200を 8チャンネル搭載できることと、PCI-Express Gen4 に対応したことで最新アーキテクチャの GPU や NVMe SSD などを使用することができるようになったことです。

オンプレミス GPU サーバ vs スーパーコンピュータ

大規模な計算が出来ることではスーパーコンピュータには敵いませんが、手元に置いて使えるミニスパコンの良さなどについてお話をお聞かせください。: なんと言っても取り回しの良さが抜群です。共有利用型のスーパーコンピュータの場合、ジョブを投入してから実際に計算が回り始めるまでにリソース確保のためのタイムラグがあるのですが、研究室マシンの場合それがありません。特に、コード開発・デバッグの際に小回りが利くため重宝しております。また、数日を超えるような長時間計算を連続的に実行できる点や、データ整理のための再計算が容易な点も研究を進めるにあたっての利点かと思います。

今後の展望

導入されてまだ日は浅いと思いますが、導入後の感想やこれからの展望をお聞かせください。: GPU 1枚当たりのグローバルメモリサイズが 80GB になったことで、これまで複数の GPU を並列しないとできないような規模の計算が 1枚の GPU で計算可能になりました。これにより、開発コストの高い複数 GPU 並列コードの実装を飛ばして、計算コストの高い数値モデルの基礎的な性能評価が行えるようになり、特に研究初動の速度感が上がったように感じます。また、研究室に在籍するメンバーが実施する計算の内、大半は A100 のリソースを使いきれないような小規模な計算が主です。そこで、A100 から新しく追加された一枚の GPU を最大 7枚の仮想 GPU に分割して個別に計算を実行するマルチインスタンス GPU (MIG) 機能なども活用して、研究室マシンの有効活用を進めていきたいと考えております。