富岳におけるREMDのジョブ指定について

Viewing 2 reply threads
  • Author
    Posts
    • #16054

      ishida-hisashi
      Participant

      量研機構の石田です。

      富岳にてREMDを実行しようとしています。
      [REMD]
      nreplica1 =1
      parameters1 = 300.0
      として(1レプリカ)、以下のジョブスクリプトでジョブを流すと

      #!/bin/bash
      #PJM -L node=10
      #PJM -L recunit=rscunit_ft01
      #PJM -L rscgrp=small
      #PJM -L elapse=00:05:00
      #PJM –mpi ma-proc-pre-node=4
      #PJM -s
      mpiexec -stdout logfile ~/genesis-2.0-master/src/spdyn/spdyn input_remd

      は正常に実行できます。logfileには
      Setup_Mpi_Remd> Summary of Setup MPI
      number of MPI processes = 40
      number of MPI processes in one replica = 40
      number of OpenMP threads = 12
      total number of CPU cores = 480
      と表示されています。

      次に
      [REMD]
      nreplica = 2
      parameters1 = 300.0 310.0
      として(2レプリカ)、同じジョブを流すと
      Setup_Mpi_Remd> Summary of Setup MPI
      number of MPI processes = 40
      number of MPI processes in one replica = 20
      number of OpenMP threads = 12
      total number of CPU cores = 480
      と表示されますが、
      Setup_Processor_Number> MPI Process number can not be defined, please set them manualy rank_no = ..
      (manualyはmanuallyのタイポと思われます。)

      とエラーとなります。対処のしかたを教えてください。
      (通常のPCクラスターではmpirun -np 40 spdyn input_remdで1レプリカでも2レプリカでも実行できました。)

    • #16055

      ckobayashi
      Moderator

      GENESIS開発チーム、小林です。

      提示いただいたエラーは、

      1. controlファイルにdomain_[x,y,z]の記述がされていない、かつ、1レプリカ当たりのMPI数が8の倍数でない、かつ、1, 2, 4のいずれでもない。
      2. domain_x * domain_y * domain_z の値が1レプリカ当たりのMPI数 (今回は20)でない

      のいずれかの場合に起こります。

      1レプリカの時にはMPI数は40ですので1の条件に合致しないためエラーを回避したものと思われます。

      2レプリカの際にはMPI数は20ですので、回避策はdomain_[x,y,z]の値を正しく設置することになります。ワークステーションで実行できたのは、正しくdomain_[x,y,z]の値が書かれているのではないかと思います。よろしくお願いいたします。

      小林

    • #16056

      ishida-hisashi
      Participant

      回答ありがとうございました。

      PCクラスターではmpirun -np 40ではなくmpirun -np 48で実行しておりました。

      GENESIS-2.0マニュアルのTROUBLE SHOOTINGには
      Setup_Processor_Number> MPI Process number can not be defined, please set them manualy rank_no
      がなかったので、質問しました。

      3.1.3 Limitation of the available MPI processors
      を読みべきでしたのですね。失礼いたしました。

Viewing 2 reply threads

You must be logged in to reply to this topic.