7 「富岳」の成果公開・普及

7-1 利用研究成果の報告・公開

7-1-1 はじめに

「特定高速電子計算機施設の共用の促進に関する基本的な方針」(平成23年文部科学省告示第120号)では、「施設利用研究の成果は、科学技術の振興を図るとともに、スーパーコンピュータの利用分野等に関する新たな知見を生かした特定高速電子計算機施設の更なる利用を促進する観点から、知的公共財として積極的に公表し、普及されるべきものである。」とされている。

この方針に従い、「京」及び「富岳」を中核とするHPCIでは、基本的に利用者に以下の要請を行っている。

  • 利用報告書の提出(課題実施終了後60日以内)
  • 成果公開(課題実施終了後3年以内)
  • HPCI成果発表データベースへの登録(随時)

2021年度は、「富岳」成果創出加速プログラム、「富岳」試行的利用課題(早期利用、利用準備)、「富岳」試行課題(一般、産業)の利用報告書、計160件をHPCIポータルサイトに公開した(2020年度は「京」及びポスト「京」利用課題の利用報告書、計55件)。また、2019年8月16日(「京」の共用終了)までに終了した「京」の成果公開対象課題及び「富岳」成果創出加速プログラム(全852課題)のうち102課題(通算713課題)の成果公開の認定が行われた。

さらに、2015年9月から公開を開始した「HPCI利用研究成果集」(登録機関RIST発行の電子ジャーナル)は2021年6月に第6巻No.1(3編の論文を収録)を、12月に第6巻No.2(8編の論文を収録)を発行し、通算公開論文数は77編となった(2020年度から11件増)。

利用報告書のダウンロード(DL)総数は2014年7月の統計データ取得開始以降、2021年度末で通算約191,000件に達し、成果の公表・普及が進んだ。ダウンロードを行った企業は通算約1,326社に増加し、その業種は東京証券取引所の33業種中32業種に及ぶ。

HPCI成果発表データベースに登録された「京」及び「富岳」に関する成果発表件数は、「京」一般利用枠では通算2,400件(うち査読付き論文数は750)、ポスト「京」研究開発枠(重点課題及び萌芽的課題)では通算2,897件(うち査読付き論文数は881)、戦略プログラムでは通算3,565件(うち査読付き論文数は607)、京調整高度化枠(※)では通算737件(うち査読付き論文数は86)に達した。また、「富岳」に関する成果発表件数については、「富岳」一般利用枠では通算70件(うち査読付き論文数は17)、「富岳」成果創出加速プログラムでは、通算248件(うち査読付き論文数は58)に達した(2022年8月15日時点、各成果件数には課題の種類間で重複がある)。以下の各項で、それぞれの詳細を記す。

※富岳高度化利用拡大枠、新型コロナウイルス対策を目的としたスーパーコンピュータ「富岳」の優先的な試行的利用を含む。

7-1-2 利用報告書の公開

2021年度は、「富岳」成果創出加速プログラム、「富岳」試行的利用課題(早期利用、利用準備)、「富岳」試行課題(一般、産業)の利用報告書、計160件をHPCIポータルサイトに公開した(2020年度は「京」及びポスト「京」利用課題の利用報告書、計55件)。利用枠毎の内訳は表1のとおり。

表1  2020年度末に終了した「富岳」課題数と利用報告書公開数の利用枠別内訳
利用枠 課題数 公開数
「富岳」成果創出加速プログラム 20 20
「富岳」試行的利用課題(早期利用) 30 30
「富岳」試行的利用課題(利用準備) 92 90
「富岳」試行課題(一般) 16 16
「富岳」試行課題(産業) 4 4
合計 162 160

また、2015年度末より、利用者等の利便性向上を目的として「利用報告書検索サイト」の運用を開始しており、現在公開されている全課題の利用報告書がWebブラウザ上にて検索可能である。本サイトはカテゴリー検索(課題番号、課題名、課題代表者、所属機関名、利用ソフトウェア、利用枠、実施期間、利用計算資源、研究分野の9項目)及び任意のキーワードによる検索機能を有し、利用報告書の高機能検索が可能である。

7-1-3 成果公開マネジメント

登録機関RISTが定める「HPCI システム利用研究課題実施後の成果等の取扱いに関する基本的考え方」において、成果公開が義務付けられている課題は、課題実施終了後3年以内に、以下の4つのいずれかの方法により研究成果を公開することが義務付けられている。

  • a)課題番号が明記されている査読付き公開論文(査読付き公開プロシーディングス、博士学位論文を含む)
  • b)HPCI利用研究成果集(登録機関RISTが発行する電子ジャーナル)
  • c)企業の公開技術報告書(産業利用のみ)
  • d)特許(特許権の取得)

成果公開が義務付けられている課題の代表者に対して課題実施終了後60日以内にa)~d)のどの方法で成果を公開するかの予定(または実績)の申告を依頼している。過去、この申告手続きはメールベースで行っていたが、2016年以降はWEBを介したオンラインワークフロー管理システムである成果公開マネージメントシステム(PUMAS)を用いて行っている。

登録機関RISTが定める前述の「成果等の取扱いに関する基本的考え方」において、上記の成果の認定・審査は登録機関RIST理事長の下に設置されている利用研究課題審査委員会(以下、「課題審査委員会」という。)の下で行うことが定められている。上記a)、c)、d)については公開された成果の認定が課題審査委員会によって行われる。2021年度に開催された第4回及び第5回課題審査委員会で、2012年度から2019年8月16日(「京」の共用終了)までに終了した「京」の一般利用枠、HPCI戦略プログラム利用枠、及びポスト「京」研究開発枠、及び「富岳」成果創出加速プログラム((全852課題)のうち102課題に対して成果公開の認定が行われた。課題枠別の内訳を表2に示す。

表2 「京」及び「富岳」の利用枠別2021年度認定課題数 (括弧内は累積値)
利用枠 終了年度 成果公開対象
課題数
認定課題数
「京」一般利用枠 2012 2 - (2)*
2013 77 0 (76)
2014 63 0 (61)
2015 74 1 (69)
2016 78 5 (69)
2017 71 10 (55)
2018 63 19 (38)
2019
(共用終了8/16まで)
35 7 (15)
HPCI戦略プログラム 2012 31 - (31)*
2013 25 - (25)*
2014 25 - (25)*
2015 25 1 (25)
ポスト「京」研究開発枠 <注> 2015 31 2 (31)
2016 56 3 (54)
2017 60 5 (50)
2018 58 17 (40)
2019 58 20 (35)
「富岳」成果創出加速プログラム 2020 20 12(12)
総計 852 102 (713)

*全数認定済み

<注>2019年度のポスト「京」研究開発枠における課題は、「京」の共用終了後も引き続き「京」以外のHPCI共用計算機資源を利用したため、課題自体の終了は2019年度末であり、従って成果認定は2020年度以降となる。

7-1-4 HPCI利用研究成果集の公開

HPCI利用研究成果集は、一般のジャーナルの査読付き論文になりがたい課題の成果を公開論文化することを主たる目的としている。積極的にとらえれば、挑戦的な計算やその他の理由で計算が不成功に終わった場合や期待通りの結果が得られなかった場合でも、他の研究者の有益な情報になるように、その原因を詳細に記述することにより論文発表を行うことが出来る。これは一般のジャーナルには見られないユニークな特徴である。

2021年度は、第6巻No.1を2021年6月25日に、同No.2を同年12月28日に、それぞれ発行した。掲載論文はセクションA学術研究成果計8編、セクションB産業利用成果計3編の全11編である。

公開論文の全ダウンロード数は2022年3月31日時点で15,830回であり、そのうちダウンロード数トップの論文は734回であった。

7-1-5 成果発表データベース

HPCI利用研究分野別(図1)及び利用枠別(図2)の成果発表状況を表示する成果発表データベースを公開している。分野別と利用枠別の表示は、「表示オプション」ボタンで切り替える。

成果発表データベース登録アプリケーションには、DOI(Digital Object Identifier)番号によるDOIデータベースからのインポート機能(DOIインポート機能)やCSV一括登録機能も用意されている。DOIインポート機能は、利用者が入力した論文DOI番号をシステムがリアルタイムにDOIデータベースに問い合わせ、当該論文の属性を入力画面にインポートする機能である。またCSV一括登録機能は、利用者が手元に用意したCSVファイルをアップロードすることにより一度に複数の成果情報を登録できる機能である。

図1 HPCI成果発表データベースの表示画面(HPCI利用研究分野別表示)
図2 HPCI成果発表データベースの表示画面(HPCI利用枠別表示)

7-1-6 成果の普及

1. 利用報告書ダウンロード分析

「富岳」、「京」以外のHPCI分を含む利用報告書のダウンロード(DL)総数は、2014年7月の統計データ取得開始以降、2021年度末で通算約191,059件に達した。2020年度の年間DL数は約34,839件であり、前年度と比較して約17%増加した。図3にダウンロード数及びその蓄積値の月次変化を示す。2017年2月頃からは月間2千件レベルをほぼ連続的に維持し、2018年10月からは月間1,800~5,000件の範囲で変動しつつ現在に至っている。また、前年度からは、2015年以降の実施課題についてのダウンロード数が半数を上回っている。

図3 利用報告書ダウンロード数の月次変化

図4 (上)に全ダウンロード数に対する課題枠別ダウンロード割合を示す。「京」産業利用(実証利用)のダウンロード数が最も多く、次いでHPCI一般、「京」一般、戦略プログラムの順に大きい。図45(下)には各課題枠における1課題あたりのダウンロード数を示す。「京」産業利用(実証利用)が最も大きく、次いでHPCI産業利用および戦略プログラム、「京」一般の順に大きい。「富岳」関連のダウンロード数はまだかなり少ないが、利用報告書公開数も2021年度末で150を超え、今後の増加が予想される。

図4 (上) 課題枠別利用報告書ダウンロード割合(%)、(下) 1課題当たりのダウンロード数<br>(ダウンロードのあった課題枠のみ表示)
図4 (上) 課題枠別利用報告書ダウンロード割合(%)、(下) 1課題当たりのダウンロード数
(ダウンロードのあった課題枠のみ表示)

図5に機関分類別ダウンロード割合を示す。ネットワーク事業サービスを通じて利用者が直接ダウンロードした場合(ネットワーク事業)以外では、大学等(360機関)、企業(1326社)の順に多い。また、国外からのダウンロードが約11.5%を占めており、昨年度より4か国増の89の国と地域に亘っており、海外からの関心が高まっていることを示している。

図5 機関分類別利用報告書ダウンロード割合(%)
図5 機関分類別利用報告書ダウンロード割合(%)

図6にHPCI利用企業及びダウンロード元企業の業種分布を示す。HPCI利用実績のある業種名は赤色で記載している。HPCI利用企業の業種数は、2020年度末時点の累積で、21業種(東京証券取引所の業種分類計33業種の64%)、また、同時点のダウンロード元企業の業種数は水産・農林業を除く32業種に及んでおり、HPCI利用実績のない企業(1326社)からも幅広くダウンロードされている。以上のことから、我が国産業界における産業利用課題による成果への一層の関心の高まりとその普及が確認できる。

図6 HPCI利用企業及びダウンロード元企業の業種分布(東証1部33業種で分類)

7-1-7 成果発表状況

HPCI成果発表データベースに登録された「京」および「富岳」に関する成果発表件数は、「京」一般利用枠では通算2,400件(うち査読付き論文数は750)、ポスト「京」研究開発枠(重点課題及び萌芽的課題)では通算2,897件(うち査読付き論文数は881)、戦略プログラムでは通算3,565件(うち査読付き論文数は607)、京調整高度化枠/「富岳」高度化利用拡大枠/新型コロナウイルス対策を目的とした「富岳」の優先的な試行的利用では通算737件(うち査読付き論文数は86)に達した。また、「富岳」に関する成果発表件数については、「富岳」一般利用枠では通算70件(うち査読付き論文数は17)、「富岳」成果創出加速プログラムでは、通算248件(うち査読付き論文数は58)に達した(2022年8月15日時点、各成果件数には課題の種類間で重複がある)。

図7は、(a) 査読付き論文、(b) 国際会議・シンポジウム、(c) 国内会議・シンポジウムの発表件数の年度推移を示したものである。

査読付き論文は、戦略プログラムが2015年度末に終了した後は、ポスト「京」研究開発枠重点課題関係が増えて、2017年度発表分以降はその割合が最も多くなっている。これは、「京」からポスト「京」に係る研究開発へと成果発表対象が移行していることを表している。年度ごとの査読付き論文総数も、2017年度に重点課題、萌芽的課題の論文発表が大きく伸びて以降、2015年度以前に比較すると、全体に高いレベルにある。2020年度からは「富岳」成果創出加速プログラム、「富岳」一般利用課題の成果論文発表が始まり、2021年度は「富岳」成果創出加速プログラム関係の成果論文の登録が最も多くなっている。なお、2020年度以降分については、論文発表データの登録までに遅れがあるため、今後増加が見込まれる。

国際会議・シンポジウムおよび国内会議・シンポジウムについては、2015年度まではHPCI戦略プログラム関係の発表が突出しており、その後はそれを引き継ぐように、ポスト「京」研究開発重点課題関係の発表が最も多くなっている。また、査読付き論文の場合と同様に2020年度に「富岳」関連の発表が始まり、2021年度は「富岳」成果創出加速プログラム関係の登録が最も多くなっている。また、発表データの登録までに遅れがあるため、今後増加が見込まれる。

表3は、成果発表データベースとWeb of Science両方に登録されている査読付き論文(論文の種別のうちArticleとReviewに限定)に於ける高被引用論文の割合を日本全体の論文データと比較して示したものである。日本全体の論文の高被引用論文(Top10%)の割合は8.2%であるのに対して、「京」一般利用の成果論文における割合は16.7%と2倍近い。重点的利用の課題(ポスト「京」研究開発枠萌芽的課題を除く)についても日本全体よりも高い値を示し、「京」の利用研究成果として注目度の高い論文が産出されていることが分かる。

表3には、それぞれの国際共著論文の中での高被引用論文の割合を括弧内に示している。一般に国際共著論文については高被引用論文の割合が高くなるが、「京」においても同様で、一般利用、重点的利用とも高被引用論文の割合が高くなることが分かる。例えば、「京」一般利用のTop 10%の割合は27.4%であり、日本全体のデータ(15.1%)と比較して約1.8倍、高被引用論文割合が高い。

図7 成果発表データベースに登録されている
(a) 査読付き論文、(b) 国際会議・シンポジウム、(c) 国内会議・シンポジウムの年度推移
表3 成果発表データベースとWeb of Science両方に登録されている査読付き論文(1)
及び日本全体の論文(2)に対する高被引用論文の割合
(カッコ内は国際共著論文の中での割合)
表3 成果発表データベースとWeb of Science両方に登録されている査読付き論文(1)<br>及び日本全体の論文(2)に対する高被引用論文の割合<br>(カッコ内は国際共著論文の中での割合)

(1) 論文種別のうち、ArticleとReviewに限定、HPCI計算機資源を用いた成果に限定、課題の種類間で重複あり。高被引用論文はInCiteデータ (2022/5/10)に基づく。

(2)出典:文部科学省 科学技術・学術政策研究所、科学研究のベンチマーキング2021、NISTEP RESEARCH MATERIAL, No. 312、2021年8月、2017-2019年(平均値)