名前

runWolfPsortSummary - 細胞内局在化予測プログラムWoLF PSORTを実行し、予測結果の要約を出力する。


書式

runWolfPsortSummary [OPTIONS] 生物種

runWolfPsortSummary (--usage|--help|--man)

配列は標準出力から読み取る。


概要

細胞内局在化予測プログラムWoLF PSORTを実行し、入力アミノ酸配列の予測結果の要約を出力する。

配列は標準出力から読み取る。

以下のような情報が出力される。

  seq1 extr_plas: 11.5, plas: 11, extr: 10, E.R.: 4, lyso: 4, pero: 1.5, cyto_pero: 1.5, vacu: 1
  seq2 extr: 25, lyso: 3, plas: 2, nucl: 1, E.R.: 1
  seq3 extr: 31, lyso: 1

各行には複数の局在部位とスコアが表示される。局在部位は以下の通り:

        略  局在部位                 GO番号
        extr 細胞外                  0005576, 0005618
        cysk 細胞骨格                0005856
        cyto 細胞質(細胞骨格を除く)  0005829
        E.R. 小胞体                  0005783
        golg ゴルジ体                0005794
        mito ミトコンドリア          0005739
        nucl 核                      0005634
        plas 細胞膜             0005886
        pero ペルオキシソーム        0005777
        vacu 液胞膜                  0005774
        chlo 葉緑体                  0009507, 0009543
        lyso リソソーム              0005764

この表ではGO cellular componentの番号が書いてあるが、現在WoLF PSORTデータセットの大部分はUniprotのsubcellular localization記載 に基づいている。下線文字 ``_'' を含む局在クラスは多局在を表して いる。例えば ``cyto_nucl''は細胞質と核の2局在を表している。条件付き 2局在と常在2局在の区別はされていない。

プログラムの出力で局在部位の後にある数値は大体その局在部位が類似蛋白質 の中でどのぐらいの数を占めているかを表している。上記の例ではWoLF PSORT データセットではseq2に最も類似している蛋白質の中で25本が細胞外に局在す る。もっと正確に書けば、2局在を考慮した数値が出力される。例えば、 ``extra_plas''の後にある数値は

  #extra_plas + 0.5 * #extra + 0.5 * #plas


オプション

-n, --just-print
コマンドを実行せずに、画面に表示する。主にバグ取り用。 覚え方:make -nと同じ。

-f, --just-compute-features
クエリ配列の局在特徴を計算するが、局在予測を行なわない。主にバグ取り用。

--print-neighbors
予測する為に使われた類似蛋白質の名前を表示する。

-d, --print-sequence-description
クエリ配列のfasta head line(``>''から始まる行)から取った記述も表示する。


引数

生物種
生物種。現在の選択肢は``animal''、``plant''、と``fungi''のみ。クエリ配列の 本当の生物種と違う生物種を指定しても警告なしに予測は行なわれるので 注意していただきたい。


cat human.fasta mouse.fasta | runWolfPsortSummary

runWolfPsortSummary < orfs.fasta


ファイル

../data/animal.psort
../data/fungi.psort
../data/plant.psort
データセットのアミノ酸配列と局在部位

../data/animal.wolff
../data/fungi.wolff
../data/plant.wolff
データセットの局在化特徴量

../data/animal.wolfw
../data/fungi.wolfw
../data/plant.wolfw
特徴量の重み

../data/animal.wolfu
../data/fungi.wolfu
../data/plant.wolfu
予測効用行列。クラスAに属するアミノ酸配列をクラスBと予測した場合の損得の大きさを指定する。


開発者

Paul Horton horton-p AT aist.go.jp


著作権

このプログラム: Copyright (C) 2004-2006, Paul B. Horton, All Rights Reserved.

ここで使われるPSORT: Copyright (C) 1997, 2004-2006, Kenta Nakai & Paul B. Horton, All Rights Reserved.


参考文献

Paul Horton, Keun-Joon Park, Takeshi Obayashi & Kenta Nakai, ``Protein Subcellular Localization Prediction with WoLF PSORT'', Proceedings of the 4th Annual Asia Pacific Bioinformatics Conference APBC06, Taipei, Taiwan. pp. 39-48, 2006.


関連情報

http://wolfpsort.org/

runWolfPsortHtmlTables