Stand-alone BLAST を入れる
Stand-alone BLAST を入れたのでメモっておく。
(1) Stand-alone BLAST のインストール
NCBI BLAST Download (http://www.ncbi.nlm.nih.gov/BLAST/download.shtml)にいき、platform の win32-ia32 の blast をDL。
C:\blast\ に blast-2.2.20-ia32-win32.exe を保存し、コマンドプロンプトから blast-2.2.15-ia32-win32.exe を実行(インストール状況の確認のため)。これで、C:\blast\ 以下に bin, doc, data フォルダが作成される。
システム環境変数の Path の最後に C:/blast/bin; を追加する。
次に、C:/WINDOWS/ncbi.ini を作成し、中身を以下のように書く。
[NCBI]
Data=”C:/blast/data/”
コマンドプロンプトを立ち上げ、blastall と入力したときに BLAST のオプションの説明が出れば成功している。
(2) Database のダウンロードとフォーマット
ftp://ftp.ncbi.nih.gov/blast/db/FASTA/ から、動作確認用に yeast.nt.gz と yeast.aa.gz をダウンロードし、C:\db\ に保存。
保存したフォルダに行き、DLしたファイルを解凍。cygwin を入れていたので gzip で解凍した。入れてない場合は、gunzip とか解凍用ソフトを入れて解凍する。
gzip -d yeast.nt.gz
gzip -d yeast.aa.gz
次に、ファイルフォーマットを以下のコマンドで変換する。
formatdb -i yeast.nt -p F -o T
formatdb -i yeast.aa -p T -o T
-i はフォーマットするファイル名。-p は核酸データ(F)かタンパクデータ(T)かの選択。
うまく実行できると、formatdb.log に
Version 2.2.20 [Feb-08-2009]
Started database file “yeast.aa”
Formatted 6298 sequences in volume 0
SUCCESS: formatted database yeast.aa
Version 2.2.20 [Feb-08-2009]
Started database file “yeast.nt”
Formatted 17 sequences in volume 0
SUCCESS: formatted database yeast.nt
なんて結果がでる。最後は、C:\blast/database\test.txt として以下の内容のファイルを作成。
>Test
AGCTTTTCATTCTGACTGCAACGGGCAATATGTCTCTGTGTGGATTAAAAAAAGAGTGTCTGATAGCAGC
TTCTGAACTGGTTACCTGCCGTGAGTAAATTAAAATTTTATTGACTTAGGTCACTAAATACTTTAACCAA
TATAGGCATAGCGCACAGACAGATAAAAATTACAGAGTACACAACATCCATGAAACGCATTAGCACCACC
ATTACCACCACCATCACCATTACCACAGGTAACGGTGCGGGCTGACGCGTACAGGAAACACAGAAAAAAG
CCCGCACCTGACAGTGCGGGCTTTTTTTTTCGACCAAAGGTAACGAGGTAACAACCATGCGAGTGTTGAA
GTTCGGCGGTACATCAGTGGCAAATGCAGAACGTTTTCTGCGTGTTGCCGATATTCTGGAAAGCAATGCC
AGGCAGGGGCAGGTGGCCACCGTCCTCTCTGCCCCCGCCAAAATCACCAACCACCTGGTGGCGATGATTG
AAAAAACCATTAGCGGCCAGGATGCTTTACCCAATATCAGCGATGCCGAACGTATTTTTGCCGAACTTTT
blast を実行する。
blastall -p blastn -d yeast.nt -i test.txt -o test.out
p はプログラム名、-d は解析するデータ、-i は sequence of interest の入ったファイル名、-o は解析結果をはきだすファイル名。test.out ができて解析結果が入っていれば成功。
私の場合は以下のような感じになっていた。
BLASTN 2.2.20 [Feb-08-2009]
Reference: Altschul, Stephen F., Thomas L. Madden, Alejandro A. Schaffer,
Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997),
“Gapped BLAST and PSI-BLAST: a new generation of protein database search
programs”, Nucleic Acids Res. 25:3389-3402.
Query= Test
(560 letters)
Database: yeast.nt
17 sequences; 12,155,026 total letters
Searching…………………………………………..done
Score E
Sequences producing significant alignments: (bits) Value
ref|NC_001145.1| Saccharomyces cerevisiae chromosome XIII, compl… 32 1.3
ref|NC_001142.1| Saccharomyces cerevisiae chromosome X, complete… 32 1.3
ref|NC_001136.2| Saccharomyces cerevisiae chromosome IV, complet… 32 1.3
ref|NC_001148.1| Saccharomyces cerevisiae chromosome XVI, comple… 30 5.2
これで動作確認が終了。
mトラックバックがありません。