runWolfPsortSummary - 細胞内局在化予測プログラムWoLF PSORTを実行し、予測結果の要約を出力する。
runWolfPsortSummary [OPTIONS] 生物種
runWolfPsortSummary (--usage|--help|--man)
配列は標準出力から読み取る。
細胞内局在化予測プログラムWoLF PSORTを実行し、入力アミノ酸配列の予測結果の要約を出力する。
配列は標準出力から読み取る。
以下のような情報が出力される。
seq1 extr_plas: 11.5, plas: 11, extr: 10, E.R.: 4, lyso: 4, pero: 1.5, cyto_pero: 1.5, vacu: 1 seq2 extr: 25, lyso: 3, plas: 2, nucl: 1, E.R.: 1 seq3 extr: 31, lyso: 1
各行には複数の局在部位とスコアが表示される。局在部位は以下の通り:
略 局在部位 GO番号
extr 細胞外 0005576, 0005618
cysk 細胞骨格 0005856
cyto 細胞質(細胞骨格を除く) 0005829
E.R. 小胞体 0005783
golg ゴルジ体 0005794
mito ミトコンドリア 0005739
nucl 核 0005634
plas 細胞膜 0005886
pero ペルオキシソーム 0005777
vacu 液胞膜 0005774
chlo 葉緑体 0009507, 0009543
lyso リソソーム 0005764
この表ではGO cellular componentの番号が書いてあるが、現在WoLF PSORTデータセットの大部分はUniprotのsubcellular localization記載 に基づいている。下線文字 ``_'' を含む局在クラスは多局在を表して いる。例えば ``cyto_nucl''は細胞質と核の2局在を表している。条件付き 2局在と常在2局在の区別はされていない。
プログラムの出力で局在部位の後にある数値は大体その局在部位が類似蛋白質 の中でどのぐらいの数を占めているかを表している。上記の例ではWoLF PSORT データセットではseq2に最も類似している蛋白質の中で25本が細胞外に局在す る。もっと正確に書けば、2局在を考慮した数値が出力される。例えば、 ``extra_plas''の後にある数値は
#extra_plas + 0.5 * #extra + 0.5 * #plas
cat human.fasta mouse.fasta | runWolfPsortSummary
runWolfPsortSummary < orfs.fasta
Paul Horton horton-p AT aist.go.jp
このプログラム: Copyright (C) 2004-2006, Paul B. Horton, All Rights Reserved.
ここで使われるPSORT: Copyright (C) 1997, 2004-2006, Kenta Nakai & Paul B. Horton, All Rights Reserved.
Paul Horton, Keun-Joon Park, Takeshi Obayashi & Kenta Nakai, ``Protein Subcellular Localization Prediction with WoLF PSORT'', Proceedings of the 4th Annual Asia Pacific Bioinformatics Conference APBC06, Taipei, Taiwan. pp. 39-48, 2006.
runWolfPsortHtmlTables