バイオインフォマティクス

生命情報学に関する基本的な理論や解析ソフトウェアの使用方法について.

SSEARCH は配列類似性検索を行うソフトウェアである.ローカルアラインメントによる配列類似性検索を行う Smith-Waterman アルゴリズムを実装している.互いに相同性を共有する配列の類似性は高い場合が多い.特に近縁種間の類似性は高く,遠縁になればなるほど類似性は下がる傾向がある.したがって,遠縁検索においては類似性検索の性能は落ちる.これは特にグローバルアライメント法 (Needleman-Wunsch) において顕著であるが,ホモロジーは局所的には強く保存されていることが多いので,ローカルアライメント検索を利用すれば遠縁のホモロジーも発見できる可能性がいくらかマシになる.

インストール

SSEARCH を $HOME/local にインストールする.ヴァージニア大学の公式ページの The latest versions of the program are in ... のリンクから最新版の FASTA パッケージを $HOME/build 等の適当なディレクトリにダウンロードし,解凍する.

$ tar zxvf fasta-36.3.5e.tar.gz

次に,解凍されて出てきたディレクトリ fasta-36.3.5e に移動し以下のコマンドを打つ.

$ cd fasta-36.3.5e
$ cd src
$ make -f ../make/Makefile.linux_sse2 all

使用方法

最も簡単には以下のように使用する.ここで,query.fa は類似性を検索したい検索を fasta形式で格納したファイルで,db.fa はデータベースファイルであり,これも同様に fasta形式である.データベースファイルには自身が検索させたいデータベースを選択する.

$ ssearch36 ./query.fa db.fa

置換行列の変更

使用するマトリックスを変更する場合は以下のようにする.VT160 はあらかじめインストールされている置換行列の名前.

$ ssearch36 -s VT160 ./query.fa db.fa

オプション一覧

いくつかのオプションがある.

オプション詳細
-Ee-valueによるカットオフ値の設定を変える.
-sアミノ酸置換行列を変更する.外部のものも読み込める.
-fオープンギャップペナルティーを変更する.
-g拡張ギャップペナルティーを変更する.
-d表示させるアラインメント数を指定する.
-T配列検索に使用するプロセッサー数を指定する.
Hatena Google+