導入事例

2021.03.09

京都大学 西浦博研究室様

NVIDIA A100 搭載ハイエンドサーバを導入頂きました。

京都大学 西浦博教授にお話を伺いました。

研究室のご紹介

京都大学 西浦博研究室様では、主に感染症を対象とした研究をされています。感染症の理論疫学(数理疫学)を大枠として、数理モデルおよび統計モデルを利用した感染症自然史等の推定や感染ダイナミクスの解明、流行対策の評価および流行予測の実現などに取り組まれています。また、アウトブレイク調査やサーベイランス、新規モデリング技術開発、人口学研究にも取り組まれています。

西浦先生は新型コロナ感染症対策専門家会議後「8割おじさん」と親しみを持って呼ばれ、研究以外にもテレビ出演やメディア取材などご多忙の中、今回の導入事例掲載にご協力をいただきました。コロナ禍ということもあり、詳しいお話は次回お手すきの時に今回導入された計算機についてお伺いしたいと思います。
なんだか記念撮影みたいになってしまいましたが、設置、設定作業を済ませた際に一緒に撮影をさせていただきました。

西浦先生が取り組む研究の中に新型コロナウイルス感染症流行の際、計算機でシミュレーションする「数理モデル」でウイルス流行状況の特徴を明らかにする研究やクラスター対策、1人の感染者が何人にうつすかを示す「実効再生産数」の感染状況試算などをされています。『これから感染がどのくらい広がるのか』や、『拡大を防ぐには』などの話題には触れず、今回導入された最新のアクセラレータを搭載した計算機をどのように活用されるのかなどをお聞きしたいと思っています。

この計算機はアクセラレータに PCI Express 4.0 接続の NVIDIA A100 および内部ストレージに PCI Express 4.0 接続の NVMe を採用する事で、計算性能と I/O ボトルネックの問題を同時に解決し全体のパフォーマンスを向上させています。ニューノーマルな計算機は一段と活躍するのではないかと思っています。

HPC テックでは機種選定から製造と各種インストール、そして設置作業まで行わせて頂きました。

京都大学 西浦博先生   HPC テック代表 奥山義弘

http://sph.med.kyoto-u.ac.jp/

西浦博研究室ホームページ

https://hygiene.med.kyoto-u.ac.jp/research.html

デスクサイドのワークステーションはスパコン並の計算能力

 

今回導入されたシステムを使い、どのような研究をされるのかお聞かせください。
これまで大規模計算は統計数理研のスパコンか自分で組んだ並列計算用サーバを使ってきました。ただ大型スパコンだとどうしても待ち時間・順番待ちが生じてしまいますし、自作サーバは5年が経過して交換の時期が来ていました。感染症のデータ分析では、ジョブを待っていては、これから直ぐシミュレーションして明日までには結果が欲しいという状況には向きません。また Approximate Bayesian Computation やデータ同化手法などの計算統計学的手法を頻用するのですが、その際にトライアンドエラーしながら研究を深めて正解にたどり着くような研究にも共用サーバは向きません。これまで取り組んできた感染症のデータも沢山集まってきたのでそれらを有意義に使ってみたいと思いました。

 

サーバ選択において重視したのは、どのあたりでしょうか?
これまでは Deep Learning Box などの計算サーバ(CPU)を使った数値シミュレーションが多かったのですが次元性の高いデータとモデルを同化するような計算を行いたいと思いました。今回発売されたばかりの NVIDIA A100 40GB Memory を搭載した GPU カードは 9.7TFLOPS の倍精度演算性能や 19.5TFLOPS の単精度演算性能、そして 152TFLOPS TF32 Tensor Core を有しており、それが4個も搭載した最新の GPU 計算機でなので、率直と言いますか純粋に「使ってみたい!」と思いました。また京大に移動して新体制を整備しつつあり、サーバの場所も少しずつ広がっているので、部屋で使えると同時に新しいサーバールームができたらラックにも将来載せられる製品なので今後の拡張性も高いため選びました。

 

今後の展望について、教えてください。
研究室では計算統計学の手法を活用した直接観察が不能なパラメータ推定やモデル適合についての研究課題の解決に取り組んできました。新型コロナウイルス感染症の多次元流行データに機構的なモデルを適合するものです。ここから先は更に地理的情報を取り込んだ予測システムをリアルタイムで実装したいと考えています。その場合はアップデートごとに計算時間が長いサーバを要しており、サーバルーム構築後は HPCT WR17as-4GP とラックマウント型の導入を合わせて、ジョブを区別して割り振りつつ研究室内で大規模計算研究が同時に複数が走っている状態を作り上げることがこの5年間くらいの目標です。

導入システム

HPCT WR17as-4GP

GPGPU:NVIDIA A100 40GB x4
CPU:AMD EPYC 7002 Series
  (64Core, 2.25GHz)x1
Memory:DDR4-3200 Total 512GB
SSD : 1.92TB PCIe4(OS)x1
SSD : 7.68TB PCIe4(Data)x1
LAN : 10GBase-T LAN ports x2
OS : Ubuntu 20.04LTS
Form Factor : 4U Rackmount/Workstation

 

ちょっとした計算問題を解いてみたのですが、その速さに恐れ入りました。これはかつてのスーパーコンピュータ(少なくともラックマウント型で使っていたもの)が研究室内で実装されている状態で、それが HPC の PC ケースに入った状態で足下近くの環境に置けている、というのは時代の革新なのだろうと感じています。

最後に

西浦先生、そして撮影にご協力をいただきました研究室の皆様、コロナ感染症対策を行っていただき誠にありがとうございました。
これからも研究活動に少しでもお役にたてる様、弊社も微力ながらお手伝いをさせていただきます。

弊社では、科学技術計算や解析などの各種アプリケーションについて動作検証を行い、
すべてのセットアップをおこなっております。
お客様が必要とされる環境にあわせた最適なシステム構成をご提案いたします。