本工具为统一的蛋白质翻译后修饰(PTM)分析页面,支持六类任务:乙酰化(K)、甲基化(K/R)、N-糖基化、SUMO化(K)、泛素化(K)、磷酸化(S/T/Y),可进行位点概率预测与突变效应评估。
方法基于 PTMAtlas 人类蛋白组(human proteome)数据集,融合蛋白质语言模型表示与结构特征:RSA(1) + pLDDT(1) + SS(3) + angles(6) = 11 维。模型可以在残基级输出修饰概率,并提供 假阳性率(FPR) 参考;在突变模式下可比较 WT 与突变体概率差异(delta_prob),用于快速筛选潜在功能性突变。
工具局限性:1)当前模型未显式引入亚细胞定位信息,可能在特定细胞区室背景下产生生物学不合理的预测;2)训练数据仅为人类蛋白组,暂不具备跨物种泛化能力,非人源蛋白结果需谨慎解读并建议结合实验验证。
1. 任务类型
2. 分析模式
模型性能指标
| 任务 | AUPRC | AUROC | MCC | F1 | Precision | Sn | Sp | BestThreshold |
|-------------------|---------:|---------:|---------:|---------:|----------:|---------:|---------:|--------------:|
| acetylation_k | 0.936642 | 0.932756 | 0.713330 | 0.853308 | 0.871811 | 0.835575 | 0.877139 | 0.465 |
| methylation_k | 0.934669 | 0.942181 | 0.772595 | 0.857143 | 0.903285 | 0.815486 | 0.941950 | 0.400 |
| methylation_r | 0.957001 | 0.951187 | 0.777299 | 0.883369 | 0.918070 | 0.851197 | 0.924037 | 0.545 |
| glycosylation_n | 0.994188 | 0.994670 | 0.943865 | 0.972067 | 0.950243 | 0.994917 | 0.947903 | 0.255 |
| sumoylation_k | 0.898406 | 0.895389 | 0.628095 | 0.811171 | 0.823311 | 0.799383 | 0.828447 | 0.530 |
| ubiquitination_k | 0.888687 | 0.886633 | 0.599476 | 0.803348 | 0.788256 | 0.819031 | 0.779989 | 0.470 |
| phosphorylation_st| 0.947765 | 0.946868 | 0.752382 | 0.875490 | 0.880313 | 0.870720 | 0.881618 | 0.515 |
| phosphorylation_y | 0.914053 | 0.916010 | 0.676597 | 0.834328 | 0.853521 | 0.815978 | 0.859964 | 0.425 |
参考文献
Wen B, Wang C, Li K, Han P, Holt MV, Savage SR, Lei JT, Dou Y, Shi Z, Li Y, Zhang B. DeepMVP: deep learning models trained on high-quality data accurately predict PTM sites and variant-induced alterations. Nat Methods. 2025 Sep;22(9):1857-1867. doi: 10.1038/s41592-025-02797-x. Epub 2025 Aug 26. PMID: 40859022; PMCID: PMC12446062.
最后更新时间: 2026-05-11