-
AuthorPosts
-
-
ishida-hisashiParticipant量研機構の石田です。
富岳にてREMDを実行しようとしています。
[REMD]
nreplica1 =1
parameters1 = 300.0
として(1レプリカ)、以下のジョブスクリプトでジョブを流すと#!/bin/bash
#PJM -L node=10
#PJM -L recunit=rscunit_ft01
#PJM -L rscgrp=small
#PJM -L elapse=00:05:00
#PJM –mpi ma-proc-pre-node=4
#PJM -s
mpiexec -stdout logfile ~/genesis-2.0-master/src/spdyn/spdyn input_remdは正常に実行できます。logfileには
Setup_Mpi_Remd> Summary of Setup MPI
number of MPI processes = 40
number of MPI processes in one replica = 40
number of OpenMP threads = 12
total number of CPU cores = 480
と表示されています。次に
[REMD]
nreplica = 2
parameters1 = 300.0 310.0
として(2レプリカ)、同じジョブを流すと
Setup_Mpi_Remd> Summary of Setup MPI
number of MPI processes = 40
number of MPI processes in one replica = 20
number of OpenMP threads = 12
total number of CPU cores = 480
と表示されますが、
Setup_Processor_Number> MPI Process number can not be defined, please set them manualy rank_no = ..
(manualyはmanuallyのタイポと思われます。)とエラーとなります。対処のしかたを教えてください。
(通常のPCクラスターではmpirun -np 40 spdyn input_remdで1レプリカでも2レプリカでも実行できました。) -
ckobayashiModeratorGENESIS開発チーム、小林です。
提示いただいたエラーは、
- controlファイルにdomain_[x,y,z]の記述がされていない、かつ、1レプリカ当たりのMPI数が8の倍数でない、かつ、1, 2, 4のいずれでもない。
- domain_x * domain_y * domain_z の値が1レプリカ当たりのMPI数 (今回は20)でない
のいずれかの場合に起こります。
1レプリカの時にはMPI数は40ですので1の条件に合致しないためエラーを回避したものと思われます。
2レプリカの際にはMPI数は20ですので、回避策はdomain_[x,y,z]の値を正しく設置することになります。ワークステーションで実行できたのは、正しくdomain_[x,y,z]の値が書かれているのではないかと思います。よろしくお願いいたします。
小林
-
ishida-hisashiParticipant回答ありがとうございました。
PCクラスターではmpirun -np 40ではなくmpirun -np 48で実行しておりました。
GENESIS-2.0マニュアルのTROUBLE SHOOTINGには
Setup_Processor_Number> MPI Process number can not be defined, please set them manualy rank_no
がなかったので、質問しました。3.1.3 Limitation of the available MPI processors
を読みべきでしたのですね。失礼いたしました。
-
You must be logged in to reply to this topic.