蛋白翻译后修饰预测与突变评估(HuPTM)

本工具为统一的蛋白质翻译后修饰（PTM）分析页面，支持六类任务：乙酰化(K)、甲基化（K/R）、N-糖基化、‌SUMO化‌(K)、泛素化(K)、磷酸化（S/T/Y），可进行位点概率预测与突变效应评估。

方法基于 PTMAtlas 人类蛋白组（human proteome）数据集，融合蛋白质语言模型表示与结构特征：RSA(1) + pLDDT(1) + SS(3) + angles(6) = 11 维。模型可以在残基级输出修饰概率，并提供假阳性率（FPR）参考；在突变模式下可比较 WT 与突变体概率差异（delta_prob），用于快速筛选潜在功能性突变。

工具局限性：1）当前模型未显式引入亚细胞定位信息，可能在特定细胞区室背景下产生生物学不合理的预测；2）训练数据仅为人类蛋白组，暂不具备跨物种泛化能力，非人源蛋白结果需谨慎解读并建议结合实验验证。

1. 任务类型

2. 分析模式

预测任务突变效应评估

模型性能指标

| 任务              |    AUPRC |    AUROC |      MCC |       F1 | Precision |       Sn |       Sp | BestThreshold |
|-------------------|---------:|---------:|---------:|---------:|----------:|---------:|---------:|--------------:|
| acetylation_k     | 0.936642 | 0.932756 | 0.713330 | 0.853308 |  0.871811 | 0.835575 | 0.877139 |         0.465 |
| methylation_k     | 0.934669 | 0.942181 | 0.772595 | 0.857143 |  0.903285 | 0.815486 | 0.941950 |         0.400 |
| methylation_r     | 0.957001 | 0.951187 | 0.777299 | 0.883369 |  0.918070 | 0.851197 | 0.924037 |         0.545 |
| glycosylation_n   | 0.994188 | 0.994670 | 0.943865 | 0.972067 |  0.950243 | 0.994917 | 0.947903 |         0.255 |
| sumoylation_k     | 0.898406 | 0.895389 | 0.628095 | 0.811171 |  0.823311 | 0.799383 | 0.828447 |         0.530 |
| ubiquitination_k  | 0.888687 | 0.886633 | 0.599476 | 0.803348 |  0.788256 | 0.819031 | 0.779989 |         0.470 |
| phosphorylation_st| 0.947765 | 0.946868 | 0.752382 | 0.875490 |  0.880313 | 0.870720 | 0.881618 |         0.515 |
| phosphorylation_y | 0.914053 | 0.916010 | 0.676597 | 0.834328 |  0.853521 | 0.815978 | 0.859964 |         0.425 |

参考文献

Wen B, Wang C, Li K, Han P, Holt MV, Savage SR, Lei JT, Dou Y, Shi Z, Li Y, Zhang B. DeepMVP: deep learning models trained on high-quality data accurately predict PTM sites and variant-induced alterations. Nat Methods. 2025 Sep;22(9):1857-1867. doi: 10.1038/s41592-025-02797-x. Epub 2025 Aug 26. PMID: 40859022; PMCID: PMC12446062.

最后更新时间: 2026-05-11