5 「富岳」を用いた研究活動等

5-2 その他の研究活動

R-CCSでは、計算機科学と計算科学の連携・融合により先進の科学的成果と技術的ブレークスルーを生み出す国際的な研究拠点の形成を目指して、次のような研究事業にも取り組んだ。

5-2-1 文部科学省「HPCIの運営」(HPCIの運営企画・調整)

2022年度に引き続き拠点間データを二重化することにより、2023年度も年間を通じて東大・R-CCS両拠点間でデータを冗長構成とした運用を実施した。データ二重化運用により、片方の拠点でメンテナンス実施や障害発生のために運用を停止しても、もう一方の拠点を運用することによりサービスを停止することなく連続して稼働することができた。特に2023年度は、利用量の増大により年間を通してレプリカ数を2以上とし、東大、R-CCSそれぞれレプリカを一つ以上保持するようにした。 2023年度では、年間合計8回のメンテナンスを実施し、基本ソフトウェアのバージョンアップ、SINET6の緊急メンテナンス、各拠点の機材メンテナンス、各拠点の計画停電対応、各拠点のネットワーク停止への対応を行った。いずれのメンテナンスも東大、R-CCSで交互に片拠点運用を実施することでサービスを継続した。

具体的には、2023年9月に、東大柏キャンパスの計画停電及び機材メンテナンスのため1周間ほど東大拠点のHPCI共用ストレージ機器を停止せざるをえなかったが、R-CCS設置機器による片拠点運用を実施した。HPCI共用ストレージはその間もR-CCS設置機器でサービスを継続した。2024年2月には、R-CCS計画停電のためR-CCS設置機器を停止したが、東大設置機器により片拠点運用を実施することで、HPCI共用ストレージはサービスを継続した。また2023年3月には、HPCIの新認証方式に対応するため、HPCI共用ストレージ全サーバーをGfarm2.8.4に更新し、認証に関する設定ファイルを更新した。 SINET6のメンテナンス時には、R-CCSではSINET間のネットワーク回線が冗長化されているため、影響を受けないものの東大では冗長化が行われていないため、SINET6のメンテナンス作業(回線断などが発生する)の影響を受けた。マスターメタデータサーバーを東大/R-CCSで切り替える事などにより、HPCI共用ストレージのサービスを継続した。

機能整備では、サービス監視を高度化し、2022年度に実施したKubernetes(コンテナ管理基盤)の構築作業で再整備したElasticSearch(全文検索エンジン)及びKibana(ダッシュボード/可視化ツール)の監視強化を行なった。本監視強化では、HPCI共用ストレージのログパーザを作成し、ログを元にした可視化や情報統計の収集を行えるようにすることを目的としている。
ElasticSearchではログパーザを利用しタグ付けを行うことで、可視化を高速に処理することが可能になる。例えば、HPCI共用ストレージのファイルシステムであるGfarmのI/Oログをパースすることで、I/Oに要した時間、サイズ、認証方法、ユーザー名、I/O元ホスト、I/O先ホストなどの情報を収集することができ、これにより今後容易に遅延が発生しているI/Oや、遅延が発生した際のI/O元ホストやユーザー、プロセスごとの平均I/O速度などの情報を自動収集し、必要に応じてKibanaでの可視化を行うことが可能になる。このログパーザは2024年度に東京大学とR-CCSの双方に設置する予定であり、パースしたログ情報を1つにまとめることで、ログ環境の統計情報や可視化をHPCI共用ストレージ全体に実現することを目指している。また、このようなログパーザの作成を省力化するためにOpenAIをはじめとしたLLMを用いてコードの生成を行い、簡略に作成できることを試行している。今後も監視環境整備では積極的にLLMを利用しコード生成を行うことで、可視化環境及びパーザ、情報収集スクリプトの制作の省力化を進める予定である。
また、Prometheus(メトリクス監視ソフトウェア)およびGrafana(ダッシュボード/可視化ツール)用いて構築していたメトリクス監視やユーザーの利用情報収集環境については、東京大学とR-CCS間で監視環境の見直し及び階層化を行い、双方の情報を集約する環境の整備が完了した。これによりユーザー及び管理者へHPCI共用ストレージ全体の運用状況をよりわかりやすく提供できるようになっている。今後の課題としては、メトリクス監視だけでは取得できていない詳細な書き込み情報などを前述の方法で取得し、本監視環境及び可視化環境と連携することが上げられる。

5-2-2 計算科学振興財団「研究教育拠点(COE)形成推進事業」

兵庫県、神戸市協調のもとで研究助成事業を受け、2017年度より、防災・減災や創薬などの地域の課題解決等に資する分野における「京」及び「富岳」を活用した最先端の研究を遂行している。また、研究成果の地域への還元を図るための普及啓発活動を通じて、計算科学・計算機科学の研究教育拠点(COE)の形成とその振興を図っている。

2023年度は、Society 5.0社会の実現を見据え、地域の課題解決等に資する研究として、下記の8課題に取り組んだ(課題①は2021年度で終了)。また、SPring-8/SACLAの大規模データを活用するためのAIによるデータ圧縮の基盤技術の開発など兵庫県にある大型研究施設の連携を引き続き進めた。

①ポスト「京」、ポスト・ポスト「京」を見据えたハードウェア・アルゴリズム・ソフトウェアの総合的研究(2021年度で終了)
②シミュレーションとインフォマティクスの融合による新エネルギー材料設計
③異なる時間スケールを考慮したレジリエント社会形成に資する計算科学研究
④テンソルネットワーク(TN)スキームに基づく異分野融合型計算科学研究
⑤ハイパフォーマンスコンピューティングによる構造生物学の革新
⑥分子シミュレーションに基づくゲノム医療・ゲノム創薬基盤の構築
⑦Society 5.0を担う学際的人材育成のための研究開発
⑧Society 5.0を支える大規模研究施設連携によるビッグデータ収集・解析・利活用基盤の研究開発
⑨「富岳」による社会シミュレーションの研究

5-2-3 その他の受託・助成プロジェクト

2023年度、R-CCSでは、前述の他にも政府系プロジェクト、助成事業等多様な外部資金課題を獲得し、センター内外の研究者・機関と連携し研究を遂行した。

政府系機関に係る受託プロジェクトでは、BINDS、ASPIRE,CREST、SATREPS、さきがけ共創の場形成支援、ムーンショット型研究開発事業等により、社会課題や政策に係る研究活動に寄与した。

表1 2023年度の外部資金

(千円)

外部資金種類 課題件数
(継続課題・予定課題含)
受託・助成額
(外部機関配分額含)
政府関係受託・JST(ASPIRE 、CREST、 SATREPS、さきがけ、共創の場形成支援、ムーンショット型研究開発事業) 10 171,144
政府関係受託・NEDO 1 4,087,838
政府関係受託・文科省 7 472,499
政府関係受託・その他
(AMED(BINDS),JAXA,内閣府,厚生労働省等)
4 36,415
研究教育拠点(COE)形成推進事業研究助成金 8 116,649
科研費(補助金) 28 70,635
科研費(基金) 25 25,050
合計 83 4,980,230