理化学研究所計算科学研究センター(R-CCS)が開発した「GENESIS」は、生体分子の分子動力学シミュレーションを実行するソフトウェアです。原子間の相互作用力を力場と呼ばれる経験的な関数を用いて計算し、その力を元にニュートンの運動方程式(*1)を繰り返し解いていくことで、一つ一つの原子がどう動き、どこに向かうのかを計算します。その結果、分子全体の動きをコンピュータ上に再現することが可能となります。
(*1) ニュートン運動方程式:ニュートン力学における、運動の第二法則を式で表わしたもの。質点の運動の姿を定める微分方程式。
理化学研究所杉田理論分子科学研究室の優 乙石さんもGENESISを使用する研究者のひとり。研究課題は、バクテリアの細胞質に含まれる分子の動きを詳細にシミュレートすることにあります。
細胞質は細胞の中の均一な部分ではありますが、その中には数多くのタンパク質や生体高分子がまるで満員のプールのようにひしめき合っています。
そのため、従来のシミュレーターでは、細胞質を丸ごとシミュレートしようと思ってもモデルが大きすぎて扱いきれませんでした。
そこで選んだのが「GENESIS」。
優さんはGENESISの優位性として以下の要素を挙げています。
まず、GENESISには、膨大な数のCPUコアを持つスーパーコンピュータを効率良く使うための方法が色々組み込まれています。そのひとつとして、MPIとOpen MP(*2)の並列化方法が組み合わされていることが挙げられます。さらに、計算を並列化するためには、モデルを空間ごとに分割してそれぞれを別のCPUコアで計算するだけでなく、CPUコア同士でデータを通信する必要があります。GENESISには、通信量を減らすための手法が数多く実装されています。これらの工夫のおかげで、スーパーコンピュータ「京」の多数のCPUコアを用いた超並列計算でも、効率が落ちないのがポイントです。
それまでは、シミュレーションを行える範囲がリボゾームやシャペロニンといった巨大な生体分子一つ程度を含む、100万原子レベルでした。GENESISとスーパーコンピュータ「京」を利用することによって、1000万から1億原子レベルの巨大な生体系のシミュレーションまで広がりました。
もうひとつはシミュレーションにかかる初期設定の時間を大きく省ける点。分子動力学シミュレーションには、最初に原子の位置や速度を読み込むなどの初期設定を行う必要があります。
優さんの手がける1億原子ものモデルでは、これまで初期設定だけで数時間を要していました。しかしGENESISでは、空間ごとの原子の位置や速度をあらかじめ空間ごとに分割したファイルとして保存し、同時並列的に読み込んでスタートできるため、初期設定にかかるプロセスが少なく、その分シミュレーションに十分な時間を割けることができたのです。
(*2) MPIとOpen MP:いずれも並列計算の規格のこと。
GENESISを用いた結果、優さんを含めた国際共同研究グループ(*3)はバクテリアの細胞の中の複雑な分子の動きをシミュレーションに成功。混み合った細胞野中の、タンパク質や生体高分子の動きをコンピュータ上でつぶさに再現しています。(図1)
図1 A:バクテリア(マイコプラズマ・ジェニタリウム)の模式図。全長は約400nm(*4)。DNA(赤)と細胞膜(緑)を除いた部分が細胞質。B:シミュレーションで用いた細胞質モデル。各生体高分子を異なる色で表示している。一辺が100 nmの立方体に水分子を含め約1億個の原子で構成されている。C:細胞質モデルの一部を拡大表示したもの。タンパク質などの生体高分子(リボン表示)の他に、ATPやアミノ酸などの代謝物、イオン、水分子も全て原子レベルでモデリングされている
(*4) nm(ナノメートル)= 10-9 m
この成功を元に、優さんは来るべき生体分子の動態研究の未来をこう語ります。「細胞質に含まれる生体分子の集団から、さらに規模が拡大し、細胞丸ごとに近いモデルのシミュレーションが分子レベルでできるような時代が来ると実感しています。今回のシミュレーションの成功は、その重要な第一歩と言えるでしょう」こうした細胞内の生体分子のシミュレーションは、今後創薬の分野での活躍も期待されています。例えば、創薬の現場では一般的に、タンパク質と薬の候補となりそうな化合物を一対一でシミュレーションをして評価をしています。一方で、細胞環境のシミュレーションは、生体分子が高濃度でひしめき合う細胞の中で、薬の化合物がどのような経路をたどり、どのようにして標的のタンパク質に結合するかといった疑問を解明したり、薬剤分子による標的以外の蛋白質への副作用やまだ知られていない効果を予測することに役立てる事が期待されています。
(*3)国際共同研究グループ
理化学研究所 杉田理論分子科学研究室、計算科学研究センター(R-CCS)・粒子系生物物理研究チームと米国ミシガン州立大学生化学分子生物学科 マイケル・ファイグ研究室との共同研究グループ
バクテリアの細胞内分子の運動解析では、スーパーコンピュータ「京」の能力を活かす超並列計算を実行したGENESISですが、その利用の範囲は広く、また導入までの敷居が低いのも特長です。現在は一般的なPCやワークステーション、GPGPU(*5)マシンにも対応しています。なによりも無償で公開されているため、ソフトの入手が非常に容易。また、幅広い構造を効率よくサンプリングするためのアルゴリズムや、自由エネルギー計算の手法も数多く実装されているため、タンパク質の構造変化の解析などにも利用が可能です。さらに、粗視化シミュレーションの発展的な開発も進められており、今後巨大な分子の長時間の動きや高分子系材料の物性評価などを研究課題とする人々の間にも浸透していくことが予想されています。
(*5)GUGPU
GPU(画像処理のための演算資源)を活用した汎用計算
(2017.12 取材)