バイオインフォマティクス

生命情報学に関する基本的な理論や解析ソフトウェアの使用方法について.

タンパク質の三次構造とはタンパク質の階層的構造における分類のひとつである.タンパク質は一次構造,すなわちアミノ酸配列によって規定されるアミノ酸配列固有の三次元構造 (立体構造) を形成するが,これをタンパク質の三次構造という.現在では,α-helix や β-sheet 等の二次構造の流れ,すなわちトポロジーがさらに折り畳まれることで複雑なタンパク質の立体構造が形成されているということが疑念の余地なく受け入れられているが,20世紀中頃まではタンパク質は球状のアミノ酸の集合体であり,明確な構造を形成しているとは考えられてはいなかった.現在のようなタンパク質立体構造の本質または素性が明確に受け入れられるようになったのは,1958年にイングランドの結晶学者 John Cowdery Kendrew によって世界で初めてタンパク質構造 (ミオグロビン構造) が解かれてからのことであった.当時構造が解かれたミオグロビンはマッコウクジラに由来するものであり,構造解析はX線構造解析法によって行われた.この功績により Kendrew は1962年にイングランドの化学者 Max Ferdinand Perutz と共にノーベル化学賞を受賞した.以下はマッコウクジラのミオグロビン構造.

abi_protein_tertiary_structure_01.png

タンパク質立体構造は各アミノ酸残基の側鎖間の相互作用によって形成される.すなわち,システイン残基間の共有結合であるジスルフィド結合や疎水性残基間の疎水結合である.他にもアルギニンおよびリジンのカチオン性の残基とアスパラギン酸およびグルタミン酸のアニオン性の残基の間にはたらくイオン性相互作用やCH-π結合等,多くの分子間力が立体構造の形成に寄与している.最も強い結合は当然ながら共有結合であるジスルフィド結合ではあるが,タンパク質立体構造形成という観点からは疎水結合の寄与も大きい.水溶液中におけるタンパク質は疎水結合によってタンパク質の周囲の水分子と反発することによって,残基の親水性部位を外側へ,疎水性部位を内側へ集中させた疎水性コアを形成する.疎水性コアではアミノ酸残基の側鎖が緊密にパッキングしているため,タンパク質立体構造において内部のアミノ酸は外側に位置するアミノ酸より変異率が低いことが経験的に知られている.一方で,タンパク質の機能部位は他の分子との相互作用が必要な場合が多いために,立体構造の外側に位置しやすいが,これに併せて,機能部位については立体構造の外側であっても変異率が低いことが経験的に知られている.以上の事実はタンパク質立体構造の一次構造からの予測等にも利用されている (一方で機能部位の予測にはタンパク質表面にあって保存度が高い部位が重要となる.).しかし,これらの事実は球状タンパク質についてのみ当てはまることであり,膜タンパク質については正反対となる.

タンパク質の立体構造中には,ドメインとよばれる構造の単位が定義されている.ドメインはさらに構造ドメインと機能ドメインの2つに分類されるが,構造ドメインと機能ドメインは必ずしも等しいとは限らない.構造ドメインとはタンパク質立体構造の空間的にまとまった構造のことをいう.あるひとつのタンパク質に2つ以上のドメインが存在する場合は,そのタンパク質をマルチドメインタンパク質というが,自然界における大部分のタンパク質はマルチドメインタンパク質である.

タンパク質の立体構造は実験的には,X線構造解析や核磁気共鳴 (NMR),電子顕微鏡によって解かれる.2014年開始時点で解かれているタンパク質構造は約9万個であり,その内の約8万個がX線構造解析によるものであり,約9千個がNMR,約500個が電子顕微鏡によるものである.これらの構造解析法にはそれぞれ長所および短所があり,相補的に協働していくことが理想的である.X構造解析法は分解能が非常に良好である.しかし,構造解析において,タンパク質の結晶化が必須であり,結晶化タンパク質と生体内のタンパク質の状態が完全に等しいと言い難くなるという欠点がある.NMR法は,タンパク質を水溶液中のまま構造解析できるので,試料の状態は比較的生体条件に近いと考えられる.また,分解能も良好である.X線構造解析が2Å以下の解像度で構造解析できるのに対し,NMR法でも3Å以下の解像度で解析することが可能である.しかし,NMR法では適用できる分子の分子量上限が存在する.電子顕微鏡法による解析法では,タンパク質は水溶液中で生体条件に近い条件で解析できるし,解析分子の分子量上限も高いが,解像度が圧倒的に悪いという欠点がある.PDBにも,電子顕微鏡法とNMR法のハイブリッド法等のエントリーも少しずつ蓄積され始めており,今後もこれらの解析法の相補的な使用が促進されていくことが必要である.計算科学的には,ホモロジーモデリング法や統計力学的原理に基づいた手法により予測される.これらの計算科学的な立体構造の解析法 (予測法) にもそれぞれ長所と短所が存在する.ホモロジーモデリング法は最適なテンプレートが見つかりさえすれば,かなりの高感度で構造予測が正解する.しかし,テンプレートが見つからないときは構造予測は成立しないという欠点がある.一方で,ab initio な手法においては (最適なテンプレートが見つかれば良いに越したことはないが),テンプレートが存在しなくとも構造予測は成立するものの,予測構造の正確性は現段階にて高いとは言い難く,実用には程遠い.

Hatena Google+