about WoLF PSORT English
Last Updated $Date: 2007/08/15 05:27:59 $

類似蛋白質(nearest neighbors)リストから期待できる予測信頼度

このページから得られる情報

このページからリンクを張っているデータは信頼度を見積もる為に役立つつもり で用意しました。しかし、実際に示している統計は

ある蛋白質が局在部位Aに局在するとしたら、予測されるutilityが ある値u以上である確率
であります。

Utility

統計的意思決定理論に「効用値」 (utility, 期待される損得)という概念があ ります。私がWoLF PSORTでこの概念を借用した理由は、蛋白質がある局在部 位に局在すると信じた場合に期待できる損得が計算できるようにしたかったか らです。utilityは各局在部位に局在する確率と、(一般的には 一様でない)各種類の誤予測のコストを反映する。例えば、分泌される蛋白質 のみに興味のある利用者から見れば、核蛋白質をミトコンドリア局在と予測しても 損はしない(非分泌蛋白質ということが分かれば十分)ような場合が考えられます。

しかし、今現在 utilityが実際に使われているのは多局在への対応であります。例えば、 細胞質・核に両局在する蛋白質を核局在と「誤予測」した場合と、ミトコンドリア局在と 予測した場合とでは誤りの程度が違う。そこで、核局在と予測した場合に、utilityの値を 完全正解と完全誤りの間に設定しています。 詳細については APBC06の論文 を参照されたい。

このページの最後の部分に各局在部位に対して、以下のようなグラフ へのリンクが表として纒めてあります。

ヒストグラム(なら)した割合関数

左図はライソゾームに局在する蛋白質(浅い色の棒)、とライソゾームに局在しない 蛋白質(黒い棒)に対して、予測されるutilityの頻度を表しています。

右図は蛋白質に対して、ライソゾームに局在するutilityの値として予測された 値から、その蛋白質が実際にライソゾームに局在する確率を、左図の出現頻度 を(なら)した曲線として示しています。 これは、蛋白質がライソゾームに局在する事前確率がWoLF PSORTデータセット におけるライソゾーム蛋白質の割合に等しいことを前提としています。

この図からいくつかの考察が得られます。


この表は、WoLF PSORTデータセットの統計に基づいて描かれた図表へのリンク からなっています。各行はひとつの局在部位に相当します。注意:蛋白質がWoLF PSORTで予測される 局在部位と違う部位に局在することもあるので、他の部位の統計も参考になる 場合があります。表中の数字はデータセットに含まれる各局在部位の蛋白数。
animal




cysk148
cysk_plas5
cyto1442


cyto_mito18
cyto_nucl246
cyto_pero10
cyto_plas4
E.R.425
E.R._golg9
E.R._mito18




extr3130
extr_plas19
golg100


lyso148
mito938
mito_nucl2
mito_pero15


nucl2682


pero217
plas3195


plant
chlo750
chlo_mito6
cysk41
cysk_plas1
cyto432
cyto_E.R.1
cyto_mito3
cyto_nucl11
cyto_pero1
cyto_plas1
E.R.69




E.R._plas1
E.R._vacu2
extr114


golg29
golg_plas2


mito210




mito_plas1
nucl456
nucl_plas2
pero52
plas165
vacu73
fungi




cysk34


cyto354


cyto_mito8
cyto_nucl91
cyto_pero2


E.R.66








extr140


golg38




mito435
mito_nucl4




nucl666


pero77
plas220
vacu23

seqTeam CBRC AIST Copyright (C) National Institute of Advanced Science and Technology (AIST), Computational Biology Research Center (CBRC). All Rights Reserved.