トップページ
研究活動
研究チーム紹介
大規模並列数値計算技術研究チーム
大規模並列数値計算技術研究チーム
English
チームリーダー 今村 俊幸(いまむら としゆき)
imamura.toshiyuki[at]riken.jp (拠点:神戸)
- Emailの[at]は@にご変更ください。
- 1996
- 京都大学大学院工学研究科応用システム
- 科学専攻単位取得退学
- 1996
- 日本原子力研究所計算科学技術推進センター
- 並列処理基本システム開発グループ
- 2000
- 博士(工学)取得
- 2002
- ドイツ・シュツッツガルト大学HLRS
- Guest Scientist
- 2003
- 電気通信大学講師・助教授(2007 より准教授)
- 2012
- AICS 大規模並列数値計算技術研究チーム チームリーダー(現職)
キーワード
- 並列数値アルゴリズム
研究概要
研究チームでは、「京」コンピュータ上での大規模・高並列・高性能な数値計算ソフトウェアライブラリの研究開発を推進します。シミュレーションプログラム開発には、連立一次方程式や固有値計算、高速フーリエ変換、非線形方程式など様々な数値計算アルゴリズムが欠かすことでできませんが、「京」の能力を最大限に利用するには、「高並列」「高性能」「高精度」「耐障害性」「大規模化」といった観点からアルゴリズムを選定しライブラリとして整備する必要があります。これらの研究は、計算科学(シミュレーション)、計算機科学(ハードウェア、ソフトウェア)と応用数学などの強固な連携によって達成されます。R-CCSにおける強固な協力体制のもとに次世代の高性能計算システムも視野に入れた数値計算ライブラリKMATHLIBにおける基盤技術の確立を進めたいと考えています。
主な研究成果
世界最高速の固有値計算に成功
行列の固有値計算は、大規模なコンピュータシミュレーションや、ビッグデータにおけるデータ相関関係の解析などで必ず使用されますが、その計算量が行列の次元の3 乗に比例して増加し、計算時間がかかるために大規模問題を高速に計算することが難しいのです。従来の計算アルゴリズムでは、(1)密行列を三重対角行列に変換する前処理を行い、(2)その後に、三重対角行列の固有値計算を行って固有ベクトルを得、(3)最後に、もとの行列の固有ベクトルにします(図の緑線部分)が、計算が大規模になると(1)に膨大な時間がかかります。この問題への解決方法として、前処理として一度、帯行列に変換し、さらに三重対角行列に変換する2段階のスキーム(図の青線部分)も開発されましたが、前処理部分を高速化できるものの、後処理部分の計算量が2倍以上に増加してしまいます。EigenExa は、帯行列を直接導くことで、この流れを効率化する新たなスキーム(図の赤線部分)に基づくソフトウェアであり、「京」の全プロセッサを用いることで、100万×100万の行列の固有値問題を1 時間以内で解くことができました。過去の我々が知る世界最大規模の固有値計算は、地球シミュレータ(初代)の4992プロセッサを用いて40万×40万行列を3 時間半で解いた記録でした。
主要論文
- Toshiyuki Imamura, Takeshi Fukaya, Yusuke Hirota, Susumu Yamada and Masahiko Machida.:
"CAHTR: Communication-Avoiding Householder TRidiagonalization"
Proc. ParCo2015, Advances in Parallel Computing, Vol. 27: Parallel Computing: On the Road to Exascale, pp. 381-390, 2016.
- Yusuke,Hirota.,and Toshiyuki Imamura.:
"Divide-and-Conquer Method for Banded Generalized Eigenvalue Problems"
Journal of Information Processing Computing System, Vol.52,Nov,20,2015.
- Kawamura,Takuma.,Idomura,Yasuhiro.,Miyamura,Hiroko.,Imamura,Toshiyuki.,and Takemiya,Hiroshi.:
"Visualization technique for large-scale data by particle-based volume rendering"
Transactions of ISCIE,Vol.28, No.5,pp.221-227,May,15,2015.
- Seikichi,Matsuoka.,Shinsuke,Satake.,Yasuhiro,Idomura.,and Toshiyuki,Imamura.:
"Quality and Performance of a Pseudo-Random Number Generator in Massively Parallel Plasma Particle Simulations"
Proceedings of ANS MC2015 - Joint International Conference on Mathematics and Computation (M&C), Supercomputing in Nuclear Applications (SNA) and the Monte Carlo (MC) Method.
- Takeshi,Fukaya., and Toshiyuki,Imamura.:
"Performance evaluation of the EigenExa eigensolver on Oakleaf-FX: tridiagonalization versus pentadiagonalization"
Parallel and Distributed Processing Symposium Workshop (IPDPSW), 2015 IEEE International, pp. 960-969, May 25 2015.
- T,Imamura.:
"The EigenExa Library - High Performance & Scalable Direct Eigensolver for Large-Scale Computational Science"
International Supercomputing Conference (ISC14), Leipzig, June (2014). (invited talk)
- D,Mukunoki., T,Imamura., and D,Takahashi.:
"Fast Implementation of General Matrix-Vector Multiplication (GEMV) on Kepler GPUs"
23rd Euromicro International Conference on Parallel, Distributed and Network-based Processing (PDP 2015), March 2015 (2015).
- T,Fukaya., Y,Nakatsukasa., Y,Yanagisawa., and Y,Yamamoto.: CholeskyQR2.:
"A Simple and Communication-Avoiding Algorithm for Computing a Tall-Skinny QR Factorization on a Large-Scale Parallel System"
Proceedings of the 5th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Systems (ScalA), (2014).
- T,Miyoshi., K,Kondo., and T,Imamura.:
"The 10,240-member ensemble Kalman filtering with an intermediate AGCM"
Geophysical Research Letters, Vol.41 (2014).
- Y,Idomura., M,Nakata., S,Yamada., M,Machida., T,Imamura., T,Watanabe., M,Nunami., H,Inoue., S,Tsutsumi., I,Miyoshi., and N,Shida.:
"Communication-overlap techniques for improved strong scaling of gyrokinetic Eulerian code beyond 100k cores on the K-computer"
International Journal of High Performance Computing Applications, 28(1) 73-86 (2014), SAGE publications, doi: 10.1177/1094342013490973.