CGモデルのdcd→pdb変換について

Viewing 4 reply threads

Author

Posts
- Actions
  May 23rd, 2022 at 6:34 pm #23822
  Hiroki_Yamamura
  Participant
  
  JSR株式会社の山村と申します。
  
  CGモデルのdcd→pdb変換について、教えていただけないでしょうか。
  
  genesis-1.7.1を用いて、AICG2+モデルのMD計算(1本のタンパク質のみ)を行っています。計算で得られたdcdファイルをpdb形式へ変換したいのですが、下記インプットファイルをcrd_convertで実行すると、TER文字がmodelの最後だけでなく1残基毎に記述されたpdbファイルが得られます(下記result1)。またcg_convertも使ってみたところ、こちらは全てのmodelにおいて1残基目の座標しか記録されませんでした(下記result2)。
  
  コンバーターの使い方を何か間違っているのかと思いますが、対処法をご教示いただけないでしょうか。お手数おかけしますが、よろしくお願いいたします。
  
  インプット———————————————————
  [INPUT]
  psffile = protein_cg.psf # protein structure file
  reffile = protein_cg.pdb # PDB file
  
  [OUTPUT]
  trjfile = output.pdb # trajectory file
  
  [TRAJECTORY]
  trjfile1 = pro_md1.dcd # trajectory file
  md_step1 = 50000000 # number of MD steps
  mdout_period1 = 10000 # MD output period
  ana_period1 = 10000 # analysis period
  trj_format = DCD # (PDB/DCD)
  trj_type = COOR+BOX # (COOR/COOR+BOX)
  trj_natom = 0 # (0:uses reference PDB atom count)
  
  [SELECTION]
  group1 = all # select all atoms
  group2 = an:CA
  
  [FITTING]
  fitting_method = NO # [NO,TR,TR+ROT,TR+ZROT,XYTR,XYTR+ZROT]
  
  [OPTION]
  check_only = NO
  trjout_format = PDB # write PDB
  trjout_type = COOR+BOX
  trjout_atom = 1 # output all atoms
  centering = YES # protein is centered at the origin
  centering_atom = 2
  center_coord = 0.0 0.0 0.0
  pbc_correct = MOLECULE # molecules are wrapped into the unit cell
  ——————————————————————
  
  result1———————————————————————-
  CRYST1 180.000 180.000 180.000 90.00 90.00 90.00 P 1 1
  MODEL 1
  ATOM 1 CA ALA A 1 -6.262 72.645 -61.534 0.00 0.00 A
  TER
  ATOM 2 CA GLN A 2 -3.791 75.591 -61.523 0.00 0.00 A
  TER
  ATOM 3 CA GLY A 3 -3.271 75.270 -65.281 0.00 0.00 A
  TER
  ・・・
  —————————————————————————–
  
  result2———————————————————————-
  CRYST1 0.000 0.000 0.000 90.00 90.00 90.00 P 1 1
  MODEL 1
  ATOM 1 CA ALA A 1 -13.938 34.068 -23.143 0.00 0.00 PROT
  TER
  ENDMDL
  CRYST1 0.000 0.000 0.000 90.00 90.00 90.00 P 1 1
  MODEL 2
  ATOM 1 CA ALA A 1 -13.921 34.070 -23.148 0.00 0.00 PROT
  TER
  ENDMDL
  ・・・
  —————————————————————————–
- Actions
  May 24th, 2022 at 9:43 am #23823
  ckobayashi
  Moderator
  
  GENESIS開発グループ　小林です。
  
  まず、最初にcg_convertは選択された原子グループ内の座標の平均を出力するツールですので、１粒子分の座標が出力されるのは仕様上正しいです。今回の目的には適さないと思います。
  
  いただいた情報から “molecule”の設定が正しくできていないように思われます。このツールは分子ファイル(今回はpsf)からbondの情報を読み取り、bondがつながっている範囲を1分子とみなします。
  
  crd_convertの標準出力ログを見ていただいて、[STEP2]の”Define Molecule> Summary of Molecule”からの数行をご確認していただくと、”num_bonds = “や”num_molecules = “という項目があるかと思います。こちらの数が、正しく表示されているかご確認いただければと思います。（AICG2+のタンパク質モデルならnum_bondsは残基数-1でしょうし、num_molecules は1ではないかと推測)
  
  もしMoleculeの情報が正しい場合は、psf/pdbファイルを一度提示いただければと思います。
- Actions
  May 24th, 2022 at 2:20 pm #23825
  Hiroki_Yamamura
  Participant
  
  小林様
  
  ご返信いただきありがとうございます。
  cg_convertは用途が違うとのこと、承知いたしました。
  
  また、ご指摘いただいたcrd_convertのログ[STEP2]を確認したところ、num_bonds=0、num_molecules=残基数となっておりました。
  genesis_cg_tool(aa_2_cg.jl)を使ってインプットファイル群を作っていましたので、psfではなくgrotopを読み込む設定にしたところ、num_bonds=残基数-1、num_molecules=1となり、各modelの最後のみTERが付くpdbファイルを得られました。
  
  今回crd_convertのサンプルページに合わせてpsfを読み込んでいたのですが、aa_2_cg.jlで出力できるpsfは他の解析に使用するためのものでコンバーターに使うものではなかったという理解でいいのでしょうか？
  問題自体は解決しましたので勉強のためという形になりますが、ご教示いただけますと幸いです。
  よろしくお願いいたします。
- Actions
  May 24th, 2022 at 2:59 pm #23826
  ckobayashi
  Moderator
  
  ご確認ありがとうございます。
  
  aa_2_cg.jlで作成されるpsfファイルはvmd/pymol等のGENESISのgrotop形式が使えない外部viewer、ツール等で利用するための物です。
  
  crd_convertを始めとしたGENESISの解析ツール群ではMDと同様にgrotopファイルを利用していただくようにお願いします。
- Actions
  May 24th, 2022 at 4:21 pm #23829
  Hiroki_Yamamura
  Participant
  
  小林様
  
  psfファイルは外部ソフト用とのこと承知いたしました。今後、注意いたします。
  色々とご教示いただき、ありがとうございました。

Viewing 4 reply threads

You must be logged in to reply to this topic.

GENESIS

Generalized-Ensemble Simulation System