バイオインフォマティクス

生命情報学に関する基本的な理論や解析ソフトウェアの使用方法について.

Windowsマシンへのインストール

アカデミック版のPyMOLをインストールする.PyMOLのオフィシャルページ (http://www.pymol.org/educational) の最下部にあるリンク,register here と記してある部位をクリックし,情報を入力する.入力後,メールが返ってくるので,そこの最下部に記載されているURLからダウンロードページへ進む.また,ダウンロードページに入るためのユーザー名とパスワードもメールの最下部に記載されている.ダウンロードが完了したらインストーラーを起動してそのまま Next を押し続けるだけで完了する.

ato_pymol_basic_usage_01.jpg

スクリプト

PyMOL はスクリプトファイルを受け付ける.例えば,特定の残基 (アラニン) に色を付けたい場合,PyMOL コンソールで以下のようにコマンドを入力すれば良いが,これを全ての残基に異なる色を用いて塗り分けるとすると,何度もコマンドを入力しなければならず,労力もかかるしミスも増える.このような場合はスクリプトを用いると良い.

color aquamarine, resn ala

ALA, ASP, GLU, GLY, LYS, PRO をアクアマリンに,CYS, ILE, LEU, PHE, TRP, TYR をピンクに,それ以外の残基をグレーに色分けしたい場合は以下のようなファイルを作成し,適当な名前をつけ拡張子を .pml にして保存する (color.pml).

color aquamarine, resn ALA
color grey90, resn ARG
color grey90, resn ASN
color aquamarine, resn ASP
color pink, resn CYS
color grey90, resn GLN
color aquamarine, resn GLU
color aquamarine, resn GLY
color grey90, resn HIS
color pink, resn ILE
color pink, resn LEU
color aquamarine, resn LYS
color grey90, resn MET
color pink, resn PHE
color aquamarine, resn PRO
color grey90, resn SER
color grey90, resn THR
color pink, resn TRP
color pink, resn TYR
color grey90, resn VAL

このように作成したスクリプトを起動させたい場合は,メニューバーの File → Run と進み,選択画面にて上で保存したファイル color.pml を選択すれば良い.このスクリプトを実行した結果が以下の画像である.PDB ID:101Mのタンパク質の残基を塗り分けた.

ato_pymol_basic_usage_02.jpg

部分構造の切り出し

タンパク質全長からある領域に限って切り出したい,または,抜き出したいときは以下のようにする.153aa からなるタンパク質 101M の1-50aa を切り出す.まず,メニューバーから Display → Sequence と進みシーケンスセレクターを表示する.次に切り出したい部位,1-50aa を選択する.

ato_pymol_basic_usage_03.jpg

次に,メニューバーから File → Save Molecule と進み,以下のように選択部位 sele を選択し,OK をクリック,適切なファイル名を付けて保存する.

ato_pymol_basic_usage_04.jpg

以上でタンパク質の切り出しは完了する.確認のために保存したファイルを開くと以下のように選択部位が切り出されていることが分かる.MD等を実行する際に時間短縮のために系を小さくすることに役立つ.

ato_pymol_basic_usage_05.jpg

単位胞の表示

PyMOL で X線構造を扱う際に,単位胞を表示させたいときはコマンド show を利用する.ID が 102' であるタンパク質の単位胞を表示させるには以下のように打つ.

show cell, 102L

結果は以下のようになる.

ato_pymol_basic_usage_06.jpg

単位胞をあらわす線の太さを変えるには set cgo_line_width= コマンドを用いる.イコールの後に数値を入力する.単位胞を表示させなくするためには hide コマンドを利用する.以下のように打つ.タンパク質の ID は入力を省略しても良い.

hide cell, 102L

結晶コンタクトの生成

結晶コンタクトの様子は以下のように表示する.表示するクリスタルパッキングは対象の分子から5オングストローム以内とする.PDB ID:101M を使用する.まず,右メニューからアクションボタン (Aボタン)をクリックし,generate → symmetry mates → within 5 A と進む.

ato_pymol_basic_usage_07.jpg

以上で,下の画像のように101Mから5オングストローム以内のクリスタルパッキングの様子が表示される.

ato_pymol_basic_usage_08.jpg

表面電荷の色分け

表面電荷でタンパク質表面を色付ける.PDB ID:101M のタンパク質を用いる.まずは,PDB ファイルを読み込む.その後,下の画像で示したように,右メニューの 101M と表示されている横のアクションボタン (Aボタン) をクリックして generate → vacuum electrostatics → protein contact potential (local) と進む.

ato_pymol_basic_usage_09.jpg

これで以下のように表面電荷が色分けされる.赤がマイナス,青がプラスを示す.

ato_pymol_basic_usage_10.jpg

オブジェクトの移動

PyMOL でオブジェクト (タンパク質) の移動を行う.PDB ID:2ZNL を用いた.2ZNL はチェーンAとBからなるタンパク質であるが,チェーンBを移動させる.まず,以下のようにチェーンBの全長 (15aa) を選択する.

ato_pymol_basic_usage_11.jpg

次に,右メニューの (sele) の横のアクションボタン (Aボタン) をクリック,引き続き drag coordinates をクリックする.

ato_pymol_basic_usage_12.jpg

最後に,Shift キーおよびマウスの中ボタン (ホイール) を押しながらマウスを動かすと,下の画像のように選択したタンパク質を移動させることができる.

ato_pymol_basic_usage_13.jpg

終了するときは右メニューの下部に表示されている Done をクリックする.

RMSDの計算

タンパク質同士を構造アライメントさせ,RMSD を算出する.PDB のタンパク質 1A39 を 1A33 にアライメントさせる.以下のように重ね合わせたい2つの PDB ファイルを読み込み,重ね合わせたいほうのタンパク質の アクションボタン (Aボタン) → align → to molecule → 1A33 (重ね合わせる対象のタンパク質名) と進む.

ato_pymol_basic_usage_14.jpg

以上の操作で 1A39 の 1A33 への重ね合わせが完了し,以下のように構造アライメントされた2つのタンパク質が表示される.

ato_pymol_basic_usage_15.jpg

このタンパク質間の RMSD は PyMOL ターミナルに表示される.以下の画像のコンソール中の上から4行目の RMS = 15.361 と表示されているところである.

ato_pymol_basic_usage_16.jpg

指定残基の色付け

PyMOL で残基の色の変更をバッチ処理にて行う場合はコマンドラインを用いるのが便利である.まず,以下のように分子名 2NAD と 5RSA を PyMOL に読み込んだ場合において,片方の分子 2NAD の65番目の残基の色を red にしたい場合は以下のように打つ.

$ color red, resi 65 in '2NAD'

結果は以下のようになる.シアンであらわされる 5RSA に対し,ピンクであらわされる 2NAD の65番目の残基が赤く色付けされる.

ato_pymol_basic_usage_17.png

複数の残基の色を変えたい場合は + を用いて指定する.56-58および342と343番目の残基の色を red にしたい場合は以下のように打つ.色を変えたい残基の指定は,+ ではなく,- を用いて 56-58 のように,範囲指定をすることもできる.

$ color red, resi 56+57+58+342+343 in '2NAD'

結果は以下のようになる.

ato_pymol_basic_usage_18.png

ある特定のアミノ酸残基の色を変えたい場合は resn オプションを用いる.2NAD および 5RSA の全残基中におけるリジンとアルギニンの色を purple にしたい場合は以下のように打つ.

$ color purple, resn LYS+ARG

結果は以下のようになる.

ato_pymol_basic_usage_19.png

以上のコマンドは,二次構造別オプションを加えることでさらに便利に使える.以下のようにコマンドを打つことで,ヘリックス (h) 上のリジンおよびアルギニンを red に,シート (s) 上のリジンおよびアルギニンを yellow に,それ以外のループ (l+) 領域におけるリジンおよびアルギニンを green に色分けすることができる.

$ color red, resn LYS+ARG in ss h
$ color yellow, resn LYS+ARG in ss s
$ color green, resn LYS in+ARG ss l+

結果は以下のようになる.

ato_pymol_basic_usage_20.png

オブジェクトの色の設定

PyMOL でオブジェクト (タンパク質) の表示形式ごと (stick や surface 等) に色を設定するには,GUI の色を設定するボタンでは表示形式に関わらず色が設定されるので,コマンドラインを用いるのが便利である.オブジェクト名が 4BTM のオブジェクトの表面を cyan に,ラインを grey40 に設定するコマンドは以下のように打つ.

$ set surface_color, cyan
$ set line_color, grey40

結果は以下のようになる.タンパク質表面の透明化はコマンド set transparency, 0.2, 4BTM によって行う.タンパク質表面を透明化させることで,内側の line 表示が表面とは異なる色で透けて見える.

ato_pymol_basic_usage_21.jpg

指定したオブジェクトのみ,上の場合では,4BTM のみの色を変更したい場合は,以下のようにする.

$ set surface_color, cyan, '4BTM'

その他のコマンドには以下のようなものがある.

コマンド詳細
set line_color, [color]line表示を '[color]' で指定した色に変更する.
set stick_color, [color]stick表示の色を設定.
set ribbon_color, [color]リボン表示の色を設定.
set cartoon_color, [color]cartoon表示の色を設定.
set dot_color, [color]dot表示の色を設定.
set sphere_color, [color]sphere表示の色を設定.
set mesh_color, [color]メッシュ表示の色を設定.
set surface_color, [color]タンパク質表面の色を設定.

指定残基の周辺残基の選択

PyMOL である特定の残基の周辺に存在している残基を選択するにはコマンド sele byres(resi A, B, C, ... around Z) を用いる.ここで A, B, C および Z は変数であり,A, B, C には残基番号を,Z にはそれらの番号で指定した残基から選択したい周辺残基までの距離をオングストロームで指定する.残基番号は1つでも複数個でも指定できる.もしも,PDBからダウンロードしてきた構造 102L のアミノ酸残基 1, 22 および 50 の周辺 5Å に存在している残基を指定したい場合は以下のように打つ.

sele byres(resi 1,22,50 around 5)

このコマンドで,byres はアミノ酸残基 1, 22 および 50 の周辺 5Å に存在している (原子ではなく) 残基を指定するために加える.結果は以下のようになる.

ato_pymol_basic_usage_22.jpg

上のコマンドでは,指定した残基の周辺残基は選択されるものの指定した残基自体は選択されない.それらの残基を含めて選択するには以下のようなコマンドを打つ.

select (byres(resi 1,22,50 around 5),(resi 1,22,50))

結果は以下のようになる.

ato_pymol_basic_usage_23.jpg
Hatena Google+