gREST/REUSでの計算について

Viewing 3 reply threads
  • Author
    Posts
    • #16378

      t-yamane
      Participant

      分子デザイン計算知能ユニットの山根です。
      現在、FugakuでGENESIS2.0 betaをもちいて、
      gREST/REUS(gREST:8replica, REUS: 40replica)
      の計算を行っておりますが、かなり頻回に計算が落ちます
      大体が、300,000step以内に落ちており、remファイルが
      出力されません。
      エラーは以下のようなものが出力されております。

      jwe0019i-u The program was terminated abnormally with signal number SIGBUS.

      以前のTopicsでこのエラーが出た時はメモリー不足の可能性があるとの記述があり、
      Statsファイルを確認するようにとの記載があったので、それも見たのですが、

      REASONの部分が”-“となっており、メモリー不足ではなさそうです。
      何か対処方法がありましたら、教えてください。よろしくお願いいたします。

    • #16379

      ckobayashi
      Moderator

      GENESIS開発チーム、小林です。

      このメッセージ自体はメモリ関係のエラーですが、分子が不安定な場合やマシントラブルでも起きることがあります。

      問題の切り分けをするために以下の点を教えていただきたく思います。

      1. 富岳の言語環境のバージョン(ログ[STEP 0]の Build_Information>のfortranの欄をご覧ください)
      2. 原子数
      3. 1レプリカ当たりの並列数(MPIとOpenMPの数)
      4. 3で回答した1レプリカ当たりの並列数で通常のMD (300K当たりで)は計算できるのか?
      5. remファイルが出力できないとありますが、crd/rst等の他のファイルの書き出しは可能か?
      6. コントロール、ログファイルの提示は可能か?

      お手数をおかけしますが、特に4については試していただければ、お互いにより実りある議論ができると思います。よろしくお願いいたします。

    • #16380

      t-yamane
      Participant

      小林様

      お世話になっております。
      ご質問いただいた内容は以下の通りです。

      1.富岳の言語環境のバージョン
      fortran = frtpx: Fujitsu Fortran Compiler 4.5.0 tcsds-1.2.31
      C = fccpx: Fujitsu C/C++ Compiler 4.5.0 tcsds-1.2.31

      2.原子数
      49933

      3.1レプリカ当たりの並列数(MPIとOpenMPの数)
      MPI:32, OpenMP:12

      4. 3で回答した1レプリカ当たりの並列数で通常のMD (300K当たりで)は計算できるのか?
      同じ並列数で300,000stepの計算を5回試しましたが、計算できました。

      5.remファイル以外のファイルの書き出し
      dcd, rstともに出力されております。

      6.コントロール、ログファイルの提示は可能か?
      はい、もちろん可能です。

      以上、よろしくお願いいたします。

    • #16381

      ckobayashi
      Moderator

      山根様

      GENESIS開発チームの小林です。ご回答いただきありがとうございました。

      ご回答いただいた内容から、マシンやシステム(コンパイラ問題、メモリ不良、ファイルの書き出しエラー)やMDの問題(原子数とMPI/OMPI数のつり合い等)というより、gREST/REUSの問題かなと思っています。

      次にご確認いただきたいのは、

      1. [REMD]のexchange_periodはいくつでしょうか?(これが0だとremファイルは書き出されないはずです)
      2. 各レプリカのエネルギーファイルをご確認いただき、エネルギー値が異常に不安定になっているレプリカはありませんか? (RESTRAINT_TOTALやTEMPERATUREなど)
      3. genesis2.0bを利用時で、dt=3.5fs、MTS等の先端的な手法を行う場合、HMRやgroup_tp等のパラメータも適切に設定されているか? (https://github.com/genesis-release-r-ccs/genesis-2.0/blob/master/doc/brief_user_guide.pdfをご覧ください)

      もし、1でexchange_period > 0で、かつ2,3も問題ない場合は、富岳のユーザサポートを経由する可能性も考えていますので、一度私の方へ直接連絡いただけると幸いです。

      よろしくお願いいたします。

Viewing 3 reply threads

You must be logged in to reply to this topic.