7 「富岳」の成果公開・普及

7-1 利用研究成果の報告・公開

7-1-1 はじめに

「特定高速電子計算機施設の共用の促進に関する基本的な方針」(平成23年文部科学省告示第120号)では、「施設利用研究の成果は、科学技術の振興を図るとともに、スーパーコンピュータの利用分野等に関する新たな知見を生かした特定高速電子計算機施設の更なる利用を促進する観点から、知的公共財として積極的に公表し、普及されるべきものである。」とされている。

この方針に従い、「京」及び「富岳」を中核とするHPCIでは、基本的に利用者に以下の要請を行っている。

  • 利用報告書の提出(課題実施終了後60日以内)
  • 成果公開(課題実施終了後3年以内)
  • HPCI成果発表データベースへの登録(随時)

2022年度は、「富岳」R3年A期課題(一般、若手、産業)のほか、機動的課題、試行課題等の利用報告書、計191件をHPCIポータルサイトに公開した(2021年度は「富岳」試行的利用課題(早期利用、利用準備)、「富岳」試行課題(一般、産業)等の利用報告書、計160件)。

また、「京」の成果公開対象課題及び「富岳」成果創出加速プログラム、「富岳」一般利用枠(全954課題)のうち91課題(通算805課題)の成果公開の認定が行われた。

さらに、2015年9月から公開を開始した「HPCI利用研究成果集」(登録機関RIST発行の電子ジャーナル)は2022年6月に第7巻No.1(10編の論文を収録)を、12月に第7巻No.2(4編の論文を収録)を発行し、通算公開論文数は91編となった(2021年度から14件増)。

利用報告書のダウンロード(DL)総数は2014年7月の統計データ取得開始以降、2022年度末で通算220,724件に達し、成果の公表・普及が進んだ。ダウンロードを行った企業は通算約1,276社となり、その業種は東京証券取引所の33業種中32業種に及ぶ。

HPCI成果発表データベースに登録された「京」及び「富岳」に関する成果発表件数は、「京」一般利用枠では通算2,494件(うち査読付き論文数は789)、ポスト「京」研究開発枠(重点課題及び萌芽的課題)では通算3,050件(うち査読付き論文数は964)、戦略プログラムでは通算3,604件(うち査読付き論文数は620)、京調整高度化枠(※)では通算838件(うち査読付き論文数は89)に達した。なお、2022年度は、「富岳」の本格稼働に伴う成果発表件数が増加しており、「富岳」一般利用枠では通算304件(昨年70件)(うち査読付き論文数は125(昨年17))、「富岳」成果創出加速プログラムでは、通算613件(昨年248件)(うち査読付き論文数は189(昨年58))に達した(2023年3月31日時点、各成果件数には課題の種類間で重複がある)。以下の各項で、それぞれの詳細を記す。

※「富岳」高度化利用拡大枠、新型コロナウイルス対策を目的としたスーパーコンピュータ「富岳」の優先的な試行的利用を含む。

7-1-2 利用報告書の公開

2022年度は、2020年3月に共用を開始した「富岳」の初期の課題の利用が終了し、それらの課題の利用報告書が公開される年度となる。「富岳」のR3年A期課題のほか、機動的課題、試行課題、利用促進課題、成果創出加速枠課題、政策対応枠課題の利用報告書、計191件をHPCIポータルサイトに公開した。(2023年7月時点)

表1 2021年度末に終了した「富岳」課題数と利用報告書公開数の利用枠別内訳
利用枠 課題数 公開数
「富岳」R3年A期課題(一般、若手、産業) 59 56
「富岳」機動的課題(一般、若手、産業) 14 10
「富岳」試行課題(一般、産業) 70 69
「富岳」試行課題(一般、産業)(ファーストタッチオプション) 17 17
「富岳」利用促進課題 15 12
「富岳」成果創出加速枠課題 22 22
「富岳」政策対応枠課題 5 5
合計 202 191

また、2015年度末より、利用者等の利便性向上を目的として「利用報告書検索サイト」の運用を開始しており、現在公開されている全課題の利用報告書がWebブラウザ上にて検索可能である。本サイトはカテゴリー検索(課題番号、課題名、課題代表者、所属機関名、利用ソフトウェア、利用枠、実施期間、利用計算資源提供機関、研究分野の9項目)及び任意のキーワードによる検索機能を有し、利用報告書の高機能検索が可能である。

7-1-3 成果公開マネジメント

登録機関RISTが定める「HPCIシステム利用研究課題実施後の成果等の取扱いに関する基本的考え方」において、成果公開が義務付けられている課題は、課題実施終了後3年以内に、以下の4つのいずれかの方法により研究成果を公開することが義務付けられている。

  • a)課題番号が明記されている査読付き公開論文(査読付き公開プロシーディングス、博士学位論文を含む)
  • b) HPCI利用研究成果集(登録機関RISTが発行する電子ジャーナル)
  • c)企業の公開技術報告書(産業利用のみ)
  • d)特許(特許権の取得)

成果公開が義務付けられている課題の代表者に対して課題実施終了後60日以内にa)~d)のどの方法で成果を公開するかの予定(又は実績)の申告を依頼している。過去、この申告手続きはメールベースで行っていたが、2016年以降はWEBを介したオンラインワークフロー管理システムである成果公開マネージメントシステム(PUMAS)を用いて行っている。

登録機関RISTが定める前述の基本的考え方において、上記の公開成果の認定・審査は登録機関RIST理事長の下に設置されている利用研究課題審査委員会(以下、「課題審査委員会」という。)が行うことが定められている。上記a)、c)、d)については公開された成果の認定が課題審査委員会によって行われる。2022年度に開催された第6回及び第7回課題審査委員会で、「京」の一般利用枠、HPCI戦略プログラム利用枠、ポスト「京」研究開発枠、及び「富岳」一般利用枠、「富岳」成果創出加速プログラム((全954課題)のうち91課題に対して成果公開の認定が行われた。課題枠別の内訳を表2に示す。

表2 「京」及び「富岳」の利用枠別2022年度認定課題数 (括弧内は累積値)
利用枠 終了年度 成果公開対象
課題数
認定課題数
「京」一般利用枠 2012 2 - (2)*
2013 77 0 (76)
2014 63 0 (61)
2015 74 0 (70)
2016 78 3 (72)
2017 71 4 (59)
2018 63 16 (54)
2019
(共用終了8/16まで)
35 9 (24)
HPCI戦略プログラム 2012 31 - (31)*
2013 25 - (25)*
2014 25 - (25)*
2015 25 - (25)*
ポスト「京」研究開発枠 <注> 2015 31 - (31)*
2016 56 2 (56)*
2017 60 7 (57)
2018 58 13 (53)
2019 58 9 (44)
「富岳」一般利用枠 2021 60 16(16)
「富岳」成果創出加速プログラム 2020 20 2(14)
2021 22 10(10)
総計 954 91 (805)

*全数認定済み

<注>2019年度のポスト「京」研究開発枠における課題は、「京」の共用終了後も引き続き「京」以外のHPCI共用計算機資源を利用したため、課題自体の終了は2019年度末であり、従って成果認定は2020年度以降となる。

7-1-4 HPCI利用研究成果集の公開

HPCI利用研究成果集は、一般のジャーナルの査読付き論文になりがたい課題の成果を公開論文化することを主たる目的としている。積極的にとらえれば、挑戦的な計算やその他の理由で計算が不成功に終わった場合や期待通りの結果が得られなかった場合でも、他の研究者の有益な情報になるように、その原因を詳細に記述することにより論文発表を行うことが出来る。これは一般のジャーナルには見られないユニークな特徴である。

2022年度は、第7巻No.1を2022年6月27日に、同No.2を同年12月22日に、それぞれ発行した。掲載論文はセクションA学術研究成果計8編、セクションB産業利用成果計6編の全14編である。

公開論文の全ダウンロード数は2023年3月31日時点で128,834回であり、そのうちダウンロード数トップの論文は3,906回であった。

7-1-5 成果発表データベース

HPCI利用研究分野別(図1)及び利用枠別(図2)の成果発表状況を表示する成果発表データベースを公開している。分野別と利用枠別の表示は、「表示オプション」ボタンで切り替える。

成果発表データベース登録アプリケーションには、DOI(Digital Object Identifier)番号によるDOIデータベースからのインポート機能(DOIインポート機能)やCSV一括登録機能も用意されている。DOIインポート機能は、利用者が入力した論文DOI番号をシステムがリアルタイムにDOIデータベースに問い合わせ、当該論文の属性を入力画面にインポートする機能である。またCSV一括登録機能は、利用者が手元に用意したCSVファイルをアップロードすることにより一度に複数の成果情報を登録できる機能である。

図1 HPCI成果発表データベースの表示画面(HPCI利用研究分野別表示)
図2 HPCI成果発表データベースの表示画面(HPCI利用枠別表示)

7-1-6 成果の普及

1. 利用報告書ダウンロード分析

「富岳」、「京」以外のHPCI分を含む利用報告書のダウンロード(DL)総数は、2014年7月の統計データ取得開始以降、2022年度末で通算約220,724件に達した。2022年度の年間DL数は約29,665件であり、前年度と比較して約15%減少した。図3にダウンロード数及びその蓄積値の月次変化を示す。2017年2月頃からは月間2千件レベルをほぼ連続的に維持し、2018年10月からは月間1,800~5,000件の範囲で変動しつつ現在に至っている。また、今年度からは、2016年以降の実施課題についてのダウンロード数が半数を上回っている。

図3 利用報告書ダウンロード数の月次変化

図4 (上)に全ダウンロード数に対する課題枠別ダウンロード割合を示す。「京」産業利用(実証利用)のダウンロード数が最も多く、次いでHPCI一般、「京」一般、戦略プログラムの順に大きい。図4(下)には各課題枠における1課題あたりのダウンロード数を示す。「京」産業利用(実証利用)が最も大きく、次いでHPCI産業利用及び戦略プログラム、「京」一般の順に大きい。「富岳」関連のダウンロード数はまだかなり少ないが、利用報告書公開数も2022年度末で400を超え、今後の増加が予想される。

図4 (上) 課題枠別利用報告書ダウンロード割合(%)、(下) 1課題当たりのダウンロード数<br>(ダウンロードのあった課題枠のみ表示)
図4 (上) 課題枠別利用報告書ダウンロード割合(%)、(下) 1課題当たりのダウンロード数
(ダウンロードのあった課題枠のみ表示)

図5に機関分類別ダウンロード割合を示す。ネットワーク事業サービスを通じて利用者が直接ダウンロードした場合(ネットワーク事業)以外では、大学等(367機関)、企業(1,400社)の順に多い。また、国外からのダウンロードが約11.7%を占めており、昨年度より3か国増の92の国と地域に亘っており、海外からの関心が高まっていることを示している。

図5 機関分類別利用報告書ダウンロード割合(%)
図5 機関分類別利用報告書ダウンロード割合(%)

図6にHPCI利用企業及びダウンロード元企業の業種分布を示す。HPCI利用実績のある業種名は赤色で記載している。HPCI利用企業の業種数は、2022年度末時点の累積で、24業種(東京証券取引所の業種分類計33業種の73%)、また、同時点のダウンロード元企業の業種数は水産・農林業を除く32業種に及んでおり、HPCI利用実績のない企業(1,276社)からも幅広くダウンロードされている。以上のことから、我が国産業界における産業利用課題による成果への一層の関心の高まりとその普及が確認できる。

図6 HPCI利用企業及びダウンロード元企業の業種分布(東証1部33業種で分類)

7-1-7 成果発表状況

HPCI成果発表データベースに登録された「京」及び「富岳」に関する成果発表件数は、「京」一般利用枠では通算2,494件(うち査読付き論文数は789)、ポスト「京」研究開発枠(重点課題及び萌芽的課題)では通算3,050件(うち査読付き論文数は964)、戦略プログラムでは通算3,604件(うち査読付き論文数は620)、京調整高度化枠/「富岳」高度化利用拡大枠/新型コロナウイルス対策を目的とした「富岳」の優先的な試行的利用では通算838件(うち査読付き論文数は89)に達した。また、「富岳」に関する成果発表件数については、「富岳」一般利用枠では通算304件(うち査読付き論文数は125)、「富岳」成果創出加速プログラムでは、通算613件(うち査読付き論文数は189)に達した(2023年3月31日時点、各成果件数には課題の種類間で重複がある)。

図7は、(a) 査読付き論文、(b) 国際会議・シンポジウム、(c) 国内会議・シンポジウムの発表件数の年度推移を示したものである。

査読付き論文は、戦略プログラムが2015年度末に終了した後は、ポスト「京」研究開発枠重点課題関係が増えて、2017年度発表分以降はその割合が最も多くなっている。これは、「京」からポスト「京」に係る研究開発へと成果発表対象が移行していることを表している。2020年度からは「富岳」成果創出加速プログラム、「富岳」一般利用課題の成果論文発表が始まり、2021年度は「富岳」成果創出加速プログラム関係の成果論文の登録が最も多くなっている。なお、2021年度以降分については、論文発表データの登録までに遅れがあるため、今後増加が見込まれる。

国際会議・シンポジウム及び国内会議・シンポジウムについては、2015年度まではHPCI戦略プログラム関係の発表が突出しており、その後はそれを引き継ぐように、ポスト「京」研究開発重点課題関係の発表が最も多くなっている。また、査読付き論文の場合と同様に2020年度に「富岳」関連の発表が始まり、2021年度は「富岳」成果創出加速プログラム関係の登録が最も多くなっている。また、発表データの登録までに遅れがあるため、今後増加が見込まれる。

表3は、成果発表データベースとWeb of Scienceの両方に登録されている査読付き論文(論文の種別のうちArticleとReviewに限定)における高被引用論文の割合を日本全体の論文データと比較して示したものである。日本全体の論文の高被引用論文(Top10%)の割合は8.2%であるのに対して、「京」一般利用の成果論文における割合は15.2%と2倍近い。重点的利用の課題についても日本全体よりも高い値を示し、「京」の利用研究成果として注目度の高い論文が産出されていることが分かる。「富岳」については、論文が出始めたところで、まだ統計誤差が大きい状況にあり、今後が期待される。

表3のカッコ内は、国際共著論文の数、及び国際共著論文の中での高被引用論文の割合を示す。一般に国際共著論文については高被引用論文の割合が高くなる傾向があるが、「京」においても同様に一般利用、重点的利用とも国際共著論文では高被引用論文の割合が高いことが分かる。国際共著論文についても、「京」一般利用のTop 10%の割合は23.7%であり、日本全体のデータ(15.1%)と比較して約1.6倍高くなっている。

図7 成果発表データベースに登録されている
(a) 査読付き論文、(b) 国際会議・シンポジウム、(c) 国内会議・シンポジウムの年度推移
表3 成果発表データベースとWeb of Scienceの両方に登録されている査読付き論文(1)
及び日本全体の論文(2)の論文数及び高被引用論文の割合
(カッコ内は、国際共著論文の数、及び国際共著論文の中での高被引用論文の割合)
表3 成果発表データベースとWeb of Scienceの両方に登録されている査読付き論文(1)及び日本全体の論文(2)に対する高被引用論文の割合(カッコ内は国際共著論文の中での割合)

(1) 論文種別のうち、ArticleとReviewに限定、HPCI計算機資源を用いた成果に限定、課題の種類間で重複あり。高被引用論文はInCiteデータ (2022/11/1)に基づく。

(2)出典:文部科学省 科学技術・学術政策研究所、科学研究のベンチマーキング2021、NISTEP RESEARCH MATERIAL, No. 312、2021年8月、2017-2019年(平均値)