トップページ
研究活動
研究チーム紹介
高性能ビッグデータ研究チーム
高性能ビッグデータ研究チーム
English
チームリーダー 佐藤 賢斗(さとう けんと)
kento.sato[at]riken.jp (拠点:神戸)
- Emailの[at]は@にご変更ください。
- 2014
- 東京工業大学大学院 数理計算科学専攻 博士(理学)
- 2014
- 東京工業大学 学術国際情報基盤センター ポスドク
- 2014
- 米国ローレンスリバモア国立研究所 ポスドク
- 2017
- 米国ローレンスリバモア国立研究所 研究員
- 2018
- 理化学研究所 計算科学センター 高性能ビッグデータ研究チーム チームリーダー(現職)
キーワード
- ビッグデータ処理基盤
- 機械学習/深層学習処理基板
- 耐障害性技術
- ファイルシステム
- 仮想化・コンテナ技術
研究概要
理化学研究所 計算科学研究センター 高性能ビッグデータ研究チームでは、スーパーコンピュータ「富岳」のような高性能計算機の高度化のためのシステム開発をしています。特に高性能計算(HPC)、ビッグデータ(Big Data)および人工知能(AI)の融合を目指しています。これを実現するために、高性能計算機の高度化に普遍的に必要とされる要素技術の研究開発を行うとともに、「ビッグデータや人工知能」計算の高度化のためのシステム開発(HPC for Big Data/AI)や「ビッグデータや人工知能」の技術を用いた高性能計算の高度化(Big Data/AI for HPC)の開発を行っており、また、将来の高性能計算機の設計するための技術開発も行っています。具体的には、並列I/Oの高速化・スケール化、階層型メモリ・ストレージ技術を活用した機械学習・深層学習の高速化・スケール化、不揮発性メモリの活用、スケーラブルかつ効率的な耐障害技術、高速ネットワーク上でのデータ圧縮・転送の効率化、プログラミング環境の高度化、次世代大規模システムのためにアーキテクチャ探索を行なっています。我々は国内外の企業、大学、国立研究所の研究者と積極的に連携し、高性能ビッグデータ処理基盤の確立を目指しています。
主な研究成果
AI技術を活用したデータ圧縮
近年のディープニューラルネットワーク(DNN)の進歩により、時間発展型データの時間発展性を予測することが容易になっています。本研究では、AI技術を活用した圧縮フレームワーク(TEZIP)を開発しました。このTEZIPは、時間発展型データの連続したフレームに対し、高い圧縮率で高速なデータサイズ削減を可能とします。TEZIPは、まずPredNetと呼ばれるRecurrent Neural Networkで対象データの時間発展性を学習します。その後、圧縮の際にベースとなるフレームに基づいて将来の画像フレームを予測し、予測フレームと実際のフレームとの差分データに対し、量子化や符号化を行うことにより高い圧縮率を実現します。TEZIPの評価の結果、TEZIPは圧縮率の点で、x265などの既存の可逆圧縮手法に対し最大3.2倍、SZなどの不可逆圧縮手法に対し最大3.3倍の圧縮率を実現しました。
主要論文
- Rupak Roy, Kento Sato, Subhadeep Bhattacharya, Xingang Fang, Yasumasa Joti, Takaki Hatsui, Toshiyuki Hiraki, Jian Guo and Weikuan Yu:
“Compression of Time Evolutionary Image Data through Predictive Deep Neural Networks”
In proceedings of the 21 IEEE/ACM International Symposium on Cluster, Cloud and Internet Computing (CCGrid 2021), (2021).
- J. Domke, E. Vatai, A. Drozd, P. Chen, Y. Oyama, L. Zhang, S. Salaria, D. Mukunoki, A. Podobas, M. Wahib, S. Matsuoka:
“Matrix Engines for High Performance Computing: A Paragon of Performance or Grasping at Straws?”
In proceedings of the 35th IEEE International Parallel & Distributed Processing Symposium (IPDPS), (Portland, Oregon, USA), IEEE Computer Society, (2021).
- Tonmoy Dey, Kento Sato, Bogdan Nicolae, Jian Guo, Jens Domke, Weikuan Yu, Franck Cappello, and Kathryn Mohror:
“Optimizing Asynchronous Multi-Level Checkpoint/Restart Configurations with Machine Learning”
The IEEE International Workshop on High-Performance Storage, (2020).
- M. Besta, J. Domke, M. Schneider, M. Konieczny, S.D. Girolamo, T. Schneider, A. Singla, T. Hoefler:
“High-Performance Routing with Multipathing and Path Diversity in Supercomputers and Data Centers”
Accepted at the IEEE Transactions on Parallel and Distributed Systems (TPDS).
- M. Wahib, H. Zhang, T.T. Nguyen, A. Drozd, J. Domke, L. Zhang, R. Takano, S. Matsuoka:
“Scaling Distributed Deep Learning Workloads beyond the Memory Capacity with KARMA”
In Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis, SC ’20, (Piscataway, NJ, USA), IEEE Press, (2020).
- Chapp, D., Rorabaugh, D., Sato, K., Ahn, D. H., & Taufer, M:
“A three-phase workflow for general and expressive representations of nondeterminism in HPC applications”
The International Journal of High Performance Computing Applications, 33(6), 1175–1184. (2019)
- Chapp, D., Rorabaugh, D., Sato, K., Ahn, D. H., & Taufer, M.:
“A three-phase workflow for general and expressive representations of nondeterminism in HPC applications”
The International Journal of High Performance Computing Applications, 33(6), 1175–1184. (2019).
- J. Domke, S. Matsuoka, I.R. Ivanov, Y. Tsushima, T. Yuki, A. Nomura, S. Miura, N. McDonald, D.L. Floyd, N. Dube:
“HyperX Topology: First at-scale Implementation and Comparison to the Fat-Tree”
Accepted at the International Conference for High Performance Computing, Networking, Storage and Analysis, SC ’19, (Piscataway, NJ, USA), IEEE Press, (2019).
- J. Domke, S. Matsuoka, I.R. Ivanov, Y. Tsushima, T. Yuki, A. Nomura, S. Miura, N. McDonald, D.L. Floyd, N. Dube:
“The First Supercomputer with HyperX Topology: A Viable Alternative to Fat-Trees?”
Peer-reviewed short paper presented at the 2019 IEEE 26th Symposium on High-Performance Interconnects (HOTI 26), (2019).
- J. Domke, K. Matsumura, M. Wahib, H. Zhang, K. Yashima, T. Tsuchikawa, Y. Tsuji, A. Podobas, S. Matsuoka:
“Double-precision FPUs in High-Performance Computing: an Embarrassment of Riches?”
In Proceedings of the 33th IEEE International Parallel & Distributed Processing Symposium (IPDPS), (Rio de Janeiro, Brazil), IEEE Computer Society, (2019).