トップページ 研究活動 研究チーム紹介 高性能計算モデリング研究チーム
高性能計算モデリング研究チーム
Englishチームリーダー Jens DOMKE(イエンス ドンケ)
- jens.domke [at] riken.jp (拠点:神戸)
- Emailの[at]は@にご変更ください。
- 2017
- ドレスデン工科大学 理学博士
- 2017
- 東京工業大学 学術国際情報センター 松岡・遠藤研究室 博士研究員
- 2019
- 東京工業大学 リサーチフェロー
- 2019
- R-CCS 高性能ビッグデータ研究チーム 特別研究員
- 2021
- R-CCS 高性能ビッグデータ研究チーム 研究員
- 2022
- R-CCS 高性能計算モデリング研究チーム チームリーダー(現職)
キーワード
- 性能モデリングと予測
- HPC向けハードウェア・ソフトウェアコデザイン
- アーキテクチャ・アプリケーション評価
- インストゥルメンテーション・モニタリングツール
- 自動チューニングとポータビリティ
研究概要
現代のスーパーコンピュータは、着実にその複雑さを増しています。
これまでは、G.ムーアによって観測された持続的なトランジスタ縮小の波(「ムーアの法則」)に乗ることができたので、上がり続ける計算性能への要求に対する技術的解決策を見つけることに集中することができました。しかし現在、これらのマシンを効果的かつ効率的に活用することは、ますます困難になってきています。
これらの課題に取り組み、また現実世界のモデリングとシミュレーションを行うHPCユーザに最良かつ最速のマシンを提供するために、私たちのチームはさまざまなアーキテクチャを評価するための最先端の手法を適用し、研究し、開発しています。また、新しい性能監視・分析ツールを導入し、HPCアーキテクチャとソフトウェアサブシステムの詳細な性能調査を行っています。私たちのチームのミッションは、一般のユーザにも最高の性能をお届けすることです。適切なツール、自動パフォーマンスチューニングのフレームワーク、そして適切なコデザインを行うことで、「富岳」のユーザーエクスペリエンスを向上させることができ、さらには日本の次のフラッグシップマシンをユーザのニーズに合った、しかも高度な計算科学の知識を必要としない形で、設計することができます。
主要論文
- T.N. Truong, F. Trahay, J. Domke, A. Drozd, E. Vatai, J. Liao, M. Wahib, B. Gerofi,
"Why Globally Re-shuffle? Revisiting Data Shuffling in Large Scale Deep Learning,"
in Proceedings of the 36th IEEE International Parallel & Distributed Processing Symposium (IPDPS), (Lyon, France), IEEE Computer Society, May 2022. - J. Domke, E. Vatai, A. Drozd, P. Chen, Y. Oyama, L. Zhang, S. Salaria, D. Mukunoki, A. Podobas, M. Wahib, S. Matsuoka,
"Matrix Engines for High Performance Computing: A Paragon of Performance or Grasping at Straws?,"
in Proceedings of the 35th IEEE International Parallel & Distributed Processing Symposium (IPDPS), (Portland, Oregon, USA), IEEE Computer Society, May 2021. - M. Besta, J. Domke, M. Schneider, M. Konieczny, S.D. Girolamo, T. Schneider, A. Singla, T. Hoefler,
"High-Performance Routing with Multipathing and Path Diversity in Supercomputers and Data Centers,"
IEEE Transactions on Parallel and Distributed Systems, vol. 32, no. 4, pp. 943-959, 2021. - M. Wahib, H. Zhang, T.T. Nguyen, A. Drozd, J. Domke, L. Zhang, R. Takano, S. Matsuoka,
"Scaling Distributed Deep Learning Workloads beyond the Memory Capacity with KARMA,"
in Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis, SC ’20, (Piscataway, NJ, USA), IEEE Press, Nov. 2020. - J. Domke, S. Matsuoka, I.R. Ivanov, Y. Tsushima, T. Yuki, A. Nomura, S. Miura, N. McDonald, D.L. Floyd, N. Dube,
"HyperX Topology: First at-scale Implementation and Comparison to the Fat-Tree,"
in Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis, SC ’19, (Piscataway, NJ, USA), IEEE Press, Nov. 2019. - J. Domke, K. Matsumura, M. Wahib, H. Zhang, K. Yashima, T. Tsuchikawa, Y. Tsuji, A. Podobas, S. Matsuoka,
"Double-precision FPUs in High-Performance Computing: an Embarrassment of Riches?,"
in Proceedings of the 33th IEEE International Parallel & Distributed Processing Symposium (IPDPS), (Rio de Janeiro, Brazil), IEEE Computer Society, May 2019. - S. Smith, C. Cromey, D.K. Lowenthal, J. Domke, N. Jain, J.J. Thiagarajan, A. Bhatele,
"Mitigating Inter-Job Interference Using Adaptive Flow-Aware Routing,"
in Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis, SC ’18, (Piscataway, NJ, USA), IEEE Press, Nov. 2018. - J. Domke and T. Hoefler,
"Scheduling-Aware Routing for Supercomputers,"
in Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis, SC ’16, (Piscataway, NJ, USA), pp. 13:1-13:12, IEEE Press, 2016. - J. Domke, T. Hoefler, and S. Matsuoka,
"Routing on the Dependency Graph: A New Approach to Deadlock-Free High-Performance Routing,"
in Proceedings of the 25th ACM International Symposium on High-Performance Parallel and Distributed Computing, HPDC ’16, (New York, NY, USA), pp. 3-14, ACM, 2016. - J. Domke, T. Hoefler, and S. Matsuoka,
"Fail-in-place Network Design: Interaction Between Topology, Routing Algorithm and Failures,"
in Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis, SC ’14, (Piscataway, NJ, USA), pp. 597-608, IEEE Press, 2014.