バイオインフォマティクス

生命情報学に関する基本的な理論や解析ソフトウェアの使用方法について.

配列間距離は最も簡単には以下のp距離で計算される.ここで,$n$ は比較した座位の数,$n_d$ は文字が異なる座位数.

\begin{eqnarray*}p=n_d/n\tag{1}\end{eqnarray*}

ポアソン距離 (PC距離) は以下で計算される.ここでの $p$ は上で計算されるp距離のこと.

\begin{eqnarray*}d=-\ln(1-p)\tag{2}\end{eqnarray*}

木村の距離 (kimura距離) は以下で計算される.ここでの $p$ は上で計算されるp距離のこと.

\begin{eqnarray*}d=-\ln(1-p-0.2p^2)\tag{3}\end{eqnarray*}

TajimaとNeiの距離は以下で計算される.ここでの $p$ は上で計算されるp距離のこと.

\begin{eqnarray*}d=-0.95\ln(1-\frac{p}{0.95})\tag{4}\end{eqnarray*}

また,ガンマ距離は以下で計算される.ここでの $p$ は上で計算されるp距離のこと.また,$\alpha$ はガンマ分布の形状パラメーターのこと.

\begin{eqnarray*}d=-\alpha\left[(1-p)^{-\frac{1}{\alpha}}-1\right]\tag{5}\end{eqnarray*}

核酸においては,以下の Jukes-Cantor 距離や Kimura の2パラメーター (K2P) 距離等,これらの計算は少しずつ異なる場合がある.

\begin{eqnarray*}d=-\frac{3}{4}\ln(1-\frac{4}{3}p)\tag{6}\end{eqnarray*}
Hatena Google+