東工大、AI性能20倍の次世代スパコン「TSUBAME4.0」。24年春稼働

PC Watch

TSUBAME4.0 スーパーコンピュータの完成イメージ図

 東京工業大学学術国際情報センターは、次世代スパコン「TSUBAME4.0」について、2024年春稼働開始に向けてシステム構築を開始すると発表した。2017年に稼働した現行のTSUBAME3.0と比べ、科学技術計算性能は約5.5倍、AI性能は約20倍に達する見込み。

 政府調達「TSUBAME4.0スーパーコンピュータ」を実施した結果、日本ヒューレット・パッカード合同会社(HPE)が落札し、東工大やHPEに加え、NVIDIAや関連各社とともに構築していく。これまでのTSUBAMEシリーズの継承し、x86_64アーキテクチャCPUとCUDA対応GPUで構成しており、これまでのプログラム資産はそのまま活用できるほか、最新の計算科学技術もすばやく導入できるとしている。

 計算ノード部にはHPE Cray XD6500シリーズのサーバー240台を採用し、各ノードは2基の第4世代EPYC、4基のNVIDIA H100、768GiBのメインメモリ、4ポートのNVIDIA Quantum-2 InfiniBandを搭載する。ストレージシステムにはHPE Cray ClusterStor E1000を採用し、44.2PBの共有ストレージ(HDDベース)と327TBの高速ストレージ(SSDベース)を接続。また、各計算ノードにも1.92TBのNVMe SSDを備える。

 GPU数は従来の2,160台に対し、半分以下の960台しか搭載しないが、GPU自体の高性能化と理論分割機構の活用で、従来より高い性能やユーザービリティを実現。浮動小数点演算性能は従来のTSUBAME3.0と比べ、科学技術計算などで用いられる倍精度で約5.5倍の66.8PFLOPS、AI分野などで用いられる半精度では約20倍の952PFLOPSを発揮し、どちらも国内では富岳に次ぐ2位に相当する性能だとしている。

 TSUBAME4.0の稼働により、AI学習処理やバイオインフォマティクスをはじめとした幅広いアプリケーションを大幅に加速できるほか、TSUBAME3.0には引き続き仮想化技術を活用し、より多くのアプリケーションの同時実行を可能にすることで、計算待ち時間の削減も図れるという。

Source

コメント