バイオインフォマティクス

生命情報学に関する基本的な理論や解析ソフトウェアの使用方法について.

以下のような,アライメント長が50でギャップを含む座位が4個,一致する残基の数が15個のアライメントが得られた場合,その配列一致率を 15/50 を計算することで,30% とする場合がある.これは BLAST で使われる配列一致率の計算方法となる.


 Score = 19.8 bits (41), Expect = 0.018,   Method: Composition-based stats.
 Identities = 15/50 (30%), Positives = 24/50 (48%), Gaps = 4/50 (8%)

 Query: 178 GKSLEAKVTIASNDKFNASE-FLTSFDALHQLFIVSQVKVVDKLDDQATA 226
            G++ EA+   A +D FN  E +   FD   +   V+++K  D     A A
 Sbjct: 20  GEAFEARFIEAMDDDFNTPEAYSVLFDMARE---VNRLKAEDMAAANAMA 66

一方で,以下のように,アライメント長が49でギャップを含む座位が6個,一致する残基の数が12個のアライメントが得られたとき,その一致率を計算する際の分母を (アライメント長 - ギャップを含む座位数) より,43個として計算する計算方法もある.この計算方法は配列長が大きく異なる配列間のグローバルやセミグローバルアライメントの結果の配列一致率を計算するのに適していると考えられる.

 Score = 16.5 bits (46),  Expect = 0.5
 Identities = 12/43 (27%), Positives = 26/43 (60%), Gaps = 6/43 (13%)

 Query  5    IVIPARYGSSRLP-----GKPLLDIVGKPMIQHVYERALQVAGVAEVWV 48
             I++ A  G+   P      K L+++  KP+I++  E  L+  G+ ++ +
 Sbjct  7    IILAAGLGTRLRPLTENTPKALVQVNQKPLIEYQIE-FLKEKGINDIII 54

Hatena Google+