7 「富岳」の成果公開・普及

7-1 利用研究成果の報告・公開

はじめに

「特定高速電子計算機施設の共用の促進に関する基本的な方針」(平成23年文部科学省告示第120号)では、「施設利用研究の成果は、科学技術の振興を図るとともに、スーパーコンピュータの利用分野等に関する新たな知見を生かした特定高速電子計算機施設の更なる利用を促進する観点から、知的公共財として積極的に公表し、普及されるべきものである。」とされている。

この方針に従い、「京」及び「富岳」を中核とするHPCIでは、基本的に利用者に以下の要請を行っている。

  • 利用報告書の提出(課題実施終了後60日以内)
  • 成果公開(課題実施終了後3年以内)
  • HPCI成果発表データベースへの登録(随時)

2020年度には、「京」、ポスト「京」利用課題の利用報告書、計55件をHPCIポータルサイトに公開した(2019年度は204件)。また、2019年8月16日(「京」の共用終了)までに終了した「京」の成果公開対象課題(全774課題)のうち84課題(通算611課題)の成果公開の認定が行われた。さらに、2015年9月から公開を開始した「HPCI利用研究成果集」(登録機関RIST発行の電子ジャーナル)は2020年6月に第5巻No.1(5編の論文を収録)を、12月に第5巻No.2(6編の論文を収録)を発行し、通算公開論文数66編となった(2019年度から11件増)。

利用報告書のダウンロード(DL)総数は2014年7月の統計データ取得開始以降、2020年度末で通算約160,200件に達し、成果の公表・普及が進んだ。ダウンロードを行った企業は通算約1,246社に増加し、その業種は東京証券取引所の33業種中32業種に及ぶ。

HPCI成果発表データベースに登録された2020年度末までの「京」に関する成果発表件数は、「京」一般利用枠では通算2,337件(うち査読付き論文数は694)、ポスト「京」研究開発枠(重点課題及び萌芽的課題)では通算2,795件(うち査読付き論文数は810)、戦略プログラムでは通算3,555件(うち査読付き論文数は599)、京調整高度化枠(※)では通算700件(うち査読付き論文数は83)に達した。また、「富岳」に関する成果発表件数については、「富岳」一般利用枠では通算13件(うち査読付き論文数は5)、「富岳」成果創出加速プログラムでは、通算171件(うち査読付き論文数は39)に達した(2021年10月25日時点、各成果件数には課題の種類間で重複がある)。以下の各項で、それぞれの詳細を記す。

※富岳高度化利用拡大枠、新型コロナウイルス対策を目的としたスーパーコンピュータ「富岳」の優先的な試行的利用を含む。

利用報告書の公開

2020年度は、「京」、ポスト「京」利用課題の利用報告書、計55件をHPCIポータルサイトに公開した(2019年度は204件)。このうち、2020年度に終了した京調整高度化枠を含む課題(91課題)の利用報告書が87件(表1)であった。

表1 2019年度末に終了したポスト「京」利用課題数と利用報告書公開数の利用枠別
「京」利用枠 課題数 公開数
ポスト「京」研究開発枠 58 54
重点化促進枠 1
京調整高度化枠 32 32
合計 91 87

2021年度に予定されていた「富岳」の共用開始が2020年度内の3月9日に前倒しとなり、2021年度A期「富岳」課題の利用が同日から開始した。また、「富岳」のシステム調整段階における試行的利用として利用者拡大を促進する観点から募集・選定した「富岳」試行的利用課題(早期利用課題30件、利用準備課題92件)が、2021年3月末までに実施された。

また、2015年度末より、利用者等の利便性向上を目的として「利用報告書検索サイト」の運用を開始しており、現在公開されている全課題の利用報告書がWebブラウザ上にて検索可能である。本サイトはカテゴリー検索(課題番号、課題名、課題代表者、所属機関名、利用ソフトウェア、利用枠、実施期間、利用計算資源、研究分野の9項目)及び任意のキーワードによる検索機能を有し、利用報告書の高機能検索が可能である。

2016年度以降は、大型実験施設との連携利用の成果の可視化のため、利用報告書のページに「大型実験施設との連携利用」という項目を設け、これまでに連携利用を行った課題の利用報告書をまとめて表示している。課題毎に連携した実験施設とその関連課題番号を示し、それらの実験報告書にリンクできるようになっている。図1にJ-PARC 及び SPring-8との連携利用の表示例を示す。

図1 利用報告書「大型実験施設との連携利用」ページ表示例
図1 利用報告書「大型実験施設との連携利用」ページ表示例

成果公開マネジメント

登録機関RISTが定める「HPCI システム利用研究課題実施後の成果の認定・審査に関する基本的考え方(※)」において、成果公開が義務付けられている課題は、課題実施終了後3年以内に、以下の4つのいずれかの方法により研究成果を公開することが義務付けられている。

  • a)課題番号が明記されている査読付き公開論文(査読付き公開プロシーディングス、博士学位論文を含む)
  • b)HPCI利用研究成果集(登録機関RISTが発行する電子ジャーナル)
  • c)企業の公開技術報告書(産業利用のみ)
  • d)特許(特許権の取得)

※ 2021年9月1日付けで、「HPCIシステム利用研究課題実施後の成果等の取扱いに関する基本的考え方」に改正

成果公開が義務付けられている課題の代表者に対して課題実施終了後60日以内にa)~d)のどの方法で成果を公開するかの予定(または実績)の申告を依頼している。過去、この申告手続きはメールベースで行っていたが、2016年以降はWEBを介したオンラインワークフロー管理システムである成果公開マネージメントシステム(PUMAS)を用いて行っている。

登録機関RISTが定める前述の「成果の認定・審査に関する基本的考え方」において、上記の成果の認定・審査は登録機関RIST理事長の下に設置されている利用研究課題審査委員会(以下、「課題審査委員会」という。)の下で行うことが定められている。上記a)、c)、d)については公開された成果の認定が課題審査委員会によって行われる。2020年度に開催された第1回及び第2回課題審査委員会で、2012年度から2019年8月16日(「京」の共用終了)までに終了した「京」の一般利用枠、HPCI戦略プログラム利用枠、及びポスト「京」研究開発枠(全832課題)のうち84課題に対して成果公開の認定が行われた。課題枠別の内訳を表2に示す。

表2 「京」の利用枠別2020年度認定課題数 (括弧内は累積値)
利用枠 終了年度 成果公開対象
課題数
認定課題数
「京」一般利用枠 2012 2 - (2)*
2013 77 0 (76)
2014 63 3 (61)
2015 74 8 (68)
2016 78 10 (64)
2017 71 12 (45)
2018 63 7 (19)
2019
(共用終了8/16まで)
35 3 (8)
HPCI戦略プログラム 2012 31 - (31)*
2013 25 - (25)*
2014 25 - (25)*
2015 25 0 (24)
ポスト「京」研究開発枠 <注> 2015 31 1 (29)
2016 56 6 (51)
2017 60 9 (45)
2018 58 10 (23)
2019 58 15 (15)
総計 832 84 (611)

<注>2019年度のポスト「京」研究開発枠における課題は、「京」の共用終了後も引き続き「京」以外のHPCI共用計算機資源を利用したため、課題自体の終了は2019年度末であり、従って成果認定は2020年度以降となる。

HPCI利用研究成果集の公開

HPCI利用研究成果集は、一般のジャーナルの査読付き論文になりがたい課題の成果を公開論文化することを主たる目的としている。積極的にとらえれば、挑戦的な計算やその他の理由で計算が不成功に終わった場合や期待通りの結果が得られなかった場合でも、他の研究者の有益な情報になるように、その原因を詳細に記述することにより論文発表を行うことが出来る。これは一般のジャーナルには見られないユニークな特徴である。

2020年度は、第5巻No.1を2020年6月23日に、同No.2を同年12月25日に、それぞれ発行した。掲載論文はセクションA学術研究成果計3編、セクションB産業利用成果計8編の全11編である。

公開論文の全ダウンロード数は2021年3月31日時点で12,443回であり、そのうちダウンロード数トップの論文は705回であった。

成果発表データベース

HPCI利用研究分野別(図2)及び利用枠別(図3)の成果発表状況を表示する成果発表データベースを公開している。分野別と利用枠別の表示は、「表示オプション」ボタンで切り替える。

成果発表データベース登録アプリケーションには、DOI(Digital Object Identifier)番号によるDOIデータベースからのインポート機能(DOIインポート機能)やCSV一括登録機能も用意されている。DOIインポート機能は、利用者が入力した論文DOI番号をシステムがリアルタイムにDOIデータベースに問い合わせ、当該論文の属性を入力画面にインポートする機能である。またCSV一括登録機能は、利用者が手元に用意したCSVファイルをアップロードすることにより一度に複数の成果情報を登録できる機能である。

2020年度から利用が始まった「富岳」成果創出加速プログラム利用枠のリポジトリを新たに追加した。

図2 HPCI成果発表データベースの表示画面(HPCI利用研究分野別表示)
図3 HPCI成果発表データベースの表示画面(HPCI利用枠別表示)

成果の普及

利用報告書ダウンロード分析

「京」以外のHPCI分を含む利用報告書のダウンロード(DL)総数は、2014年7月の統計データ取得開始以降、2020年度末で通算約160,200件に達した。2020年度の年間DL数は約34,000件であり、前年度と比較して約2%増加した。図4にダウンロード数及びその蓄積値の月次変化を示す。2017年2月頃からは月間2千件レベルをほぼ連続的に維持し、2018年10月からは月間2千~5千件の範囲で変動しつつ現在に至っている。また、前年度までは、2014年度以前の実施課題の利用報告書のダウンロード数が全体の半分以上を占めていたが、今年度は2015年以降の実施課題についてのダウンロード数が半数を上回った。

図4 利用報告書ダウンロード数の月次変化

図5 (上)に全ダウンロード数に対する課題枠別ダウンロード割合を示す。「京」産業利用(実証利用)のダウンロード数が最も多く、次いでHPCI一般、「京」一般、戦略プログラムの順に大きい。図5(下)には各課題枠における1課題あたりのダウンロード数を示す。「京」産業利用(実証利用)が最も大きく、次いでHPCI産業利用、戦略プログラムの順に大きい。

図5 (上) 課題枠別利用報告書ダウンロード割合(%)、<br>
                    (下) 1課題当たりのダウンロード数
図5 (上) 課題枠別利用報告書ダウンロード割合(%)、
(下) 1課題当たりのダウンロード数

図6に機関分類別ダウンロード割合を示す。ネットワーク事業サービスを通じて利用者が直接ダウンロードした場合(ネットワーク事業)以外では、大学等(346機関)、企業(1246社)の順に多い。また、国外からのダウンロードが約11.8%を占めており、昨年度より5か国増の85の国と地域に亘っており、海外からの関心が高まっていることを示している。

図6 機関分類別利用報告書ダウンロード割合(%)
図6 機関分類別利用報告書ダウンロード割合(%)

図7にHPCI利用企業及びダウンロード元企業の業種分布を示す。HPCI利用実績のある業種名は赤色で記載している。HPCI利用企業の業種数は、2020年度末時点の累積で、21業種(東京証券取引所の業種分類計33業種の64%)、また、同時点のダウンロード元企業の業種数は水産・農林業を除く32業種に及んでおり、HPCI利用実績のない企業(1139社)からも幅広くダウンロードされている。以上のことから、我が国産業界における産業利用課題による成果への一層の関心の高まりとその普及が確認できる。

図7 HPCI利用企業及びダウンロード元企業の業種分布(東証1部33業種で分類)

成果発表状況

HPCI成果発表データベースに登録された2020年度末までの「京」に関する成果発表件数は、「京」一般利用枠では通算2,337件(うち査読付き論文数は694)、ポスト「京」研究開発枠(重点課題及び萌芽的課題)では通算2,795件(うち査読付き論文数は810)、戦略プログラムでは通算3,555件(うち査読付き論文数は599)、京調整高度化枠では通算700件(うち査読付き論文数は83)に達した。また、「富岳」に関する成果発表件数については、「富岳」一般利用枠では通算13件(うち査読付き論文数は5)、「富岳」成果創出加速プログラムでは、通算171件(うち査読付き論文数は39)に達した(2021年10月25日時点、各成果件数には課題の種類間で重複がある)。

図8は、(a) 査読付き論文、(b) 国際会議・シンポジウム、(c) 国内会議・シンポジウムの発表件数の年度推移を示したものである。

査読付き論文は、戦略プログラムが2015年度末に終了した後は、ポスト「京」研究開発枠重点課題関係が増えて、2017年度発表分以降はその割合が最も多くなっている。これは、「京」からポスト「京」に係る研究開発へと成果発表対象が移行していることを表している。年度ごとの査読付き論文総数も、2017年度に重点課題、萌芽的課題の論文発表が大きく伸びて以降、2015年度以前に比較すると、全体に高いレベルにある。2020年度からは「富岳」成果創出加速プログラム、「富岳」一般利用課題の成果論文発表が始まった。なお、2020年度分については、論文発表データの登録までに遅れがあるため、今後増加が見込まれる。

国際会議・シンポジウムおよび国内会議・シンポジウムについては、2015年度まではHPCI戦略プログラム関係の発表が突出しており、その後はそれを引き継ぐように、ポスト「京」研究開発重点課題関係の発表が最も多くなっている。また、査読付き論文の場合と同様に2020年度については、「富岳」関連の発表が始まっている。また、発表データの登録までに遅れがあるため、今後増加が見込まれる。

表3は、成果発表データベースとWeb of Science両方に登録されている査読付き論文(論文の種別のうちArticleとReviewに限定)に於ける高被引用論文の割合を日本全体の論文データと比較して示したものである。日本全体の論文の高被引用論文(Top10%)の割合は8.4%であるのに対して、「京」一般利用の成果論文における割合は15.1%と2倍近い。重点的利用の課題(ポスト「京」研究開発枠萌芽的課題を除く)についても日本全体よりも高い値を示し、「京」の利用研究成果として注目度の高い論文が産出されていることが分かる。

表3には、それぞれの国際共著論文の中での高被引用論文の割合を括弧内に示している。一般に国際共著論文については高被引用論文の割合が高くなるが、「京」においても同様で、一般利用、重点的利用とも高被引用論文の割合が高くなることが分かる。例えば、「京」一般利用のTop 10%の割合は24.0%であり、日本全体のデータ(15.4%)と比較して約1.6倍、高被引用論文割合が高い。

図8 成果発表データベースに登録されている
(a) 査読付き論文、(b) 国際会議・シンポジウム、(c) 国内会議・シンポジウムの年度推移
表3 成果発表データベースとWeb of Science両方に登録されている査読付き論文(1)及び日本全体の論文(2)に対する高被引用論文の割合
(カッコ内は国際共著論文の中での割合)
課題の種類 論文数 高被引用論文
[Top 10%](%)
高被引用論文
[Top 1%](%)
「富岳」一般利用 0(0) - -
「富岳」成果創出加速
プログラム
8(4) 12.5(25.0) 12.5(25.0)
「京」一般利用 425(125) 15.1(24.0) 1.4(1.6)
HPCI戦略プログラム 452(154) 19.9(31.8) 1.5(2.6)
ポスト「京」研究開発枠
重点課題
516(161) 15.3(28.6) 2.3(3.7)
ポスト「京」研究開発枠
萌芽的課題
92(21) 6.5(14.3) 1.1(4.8)
日本全体(2) 78,747(25,886) 8.4(15.4) 1.0(-)

(1) 論文種別のうち、ArticleとReviewに限定、HPCI計算機資源を用いた成果に限定、課題の種類間で重複あり。高被引用論文はInCiteデータ (2021/2/26)に基づく。

(2)出典:文部科学省 科学技術・学術政策研究所、科学研究のベンチマーキング2019、調査資料-284、2019年8月、2015-2017(平均値)