蛋白翻译后修饰预测与突变评估(HuPTM)

本工具为统一的蛋白质翻译后修饰(PTM)分析页面,支持六类任务:乙酰化(K)甲基化(K/R)N-糖基化‌SUMO化‌(K)泛素化(K)磷酸化(S/T/Y),可进行位点概率预测与突变效应评估。

方法基于 PTMAtlas 人类蛋白组(human proteome)数据集,融合蛋白质语言模型表示与结构特征:RSA(1) + pLDDT(1) + SS(3) + angles(6) = 11 维。模型可以在残基级输出修饰概率,并提供 假阳性率(FPR) 参考;在突变模式下可比较 WT 与突变体概率差异(delta_prob),用于快速筛选潜在功能性突变。

工具局限性:1)当前模型未显式引入亚细胞定位信息,可能在特定细胞区室背景下产生生物学不合理的预测;2)训练数据仅为人类蛋白组,暂不具备跨物种泛化能力,非人源蛋白结果需谨慎解读并建议结合实验验证。

1. 任务类型

2. 分析模式

3. 蛋白质序列输入(支持最多10条 FASTA)

已解析序列数: 0,总残基数: 0

模型性能指标

| 任务              |    AUPRC |    AUROC |      MCC |       F1 | Precision |       Sn |       Sp | BestThreshold |
|-------------------|---------:|---------:|---------:|---------:|----------:|---------:|---------:|--------------:|
| acetylation_k     | 0.936642 | 0.932756 | 0.713330 | 0.853308 |  0.871811 | 0.835575 | 0.877139 |         0.465 |
| methylation_k     | 0.934669 | 0.942181 | 0.772595 | 0.857143 |  0.903285 | 0.815486 | 0.941950 |         0.400 |
| methylation_r     | 0.957001 | 0.951187 | 0.777299 | 0.883369 |  0.918070 | 0.851197 | 0.924037 |         0.545 |
| glycosylation_n   | 0.994188 | 0.994670 | 0.943865 | 0.972067 |  0.950243 | 0.994917 | 0.947903 |         0.255 |
| sumoylation_k     | 0.898406 | 0.895389 | 0.628095 | 0.811171 |  0.823311 | 0.799383 | 0.828447 |         0.530 |
| ubiquitination_k  | 0.888687 | 0.886633 | 0.599476 | 0.803348 |  0.788256 | 0.819031 | 0.779989 |         0.470 |
| phosphorylation_st| 0.947765 | 0.946868 | 0.752382 | 0.875490 |  0.880313 | 0.870720 | 0.881618 |         0.515 |
| phosphorylation_y | 0.914053 | 0.916010 | 0.676597 | 0.834328 |  0.853521 | 0.815978 | 0.859964 |         0.425 |
        

参考文献

Wen B, Wang C, Li K, Han P, Holt MV, Savage SR, Lei JT, Dou Y, Shi Z, Li Y, Zhang B. DeepMVP: deep learning models trained on high-quality data accurately predict PTM sites and variant-induced alterations. Nat Methods. 2025 Sep;22(9):1857-1867. doi: 10.1038/s41592-025-02797-x. Epub 2025 Aug 26. PMID: 40859022; PMCID: PMC12446062.

最后更新时间: 2026-05-11