纽普生物

ZDOCK抗原蛋白与抗体刚性对接案例研究

在蛋白与蛋白对接软件中,有两款基于快速傅里叶转换(FFT)的刚性对接软件:ZDOCK和PIPER。由于在线版的ZDOCK不会用到ZRANK重排序和聚类分析,我们就以ZDOCK为基础,结合ZRANK和聚类分析看看对挑选模型有没有帮助。

目标模型:6JBT,是PD-1与Fab的复合物结构,分辨率:2.47Å

计算过程:

从6JBT模型中分离Fab与PD1,分别保存为lig.pdb和rec.pdb。对抗原和抗体分子进行处理(去HETATM分子,补齐缺失的氨基酸,加氢等)。

用ZDOCK软件进行对接,生成2000个模型。

用ZRANK软件对对接结果进行重打分和重排序。

计算6JBT与2000个模型的Cα RMSD值、对ZDOCK和ZRANK排序结果计算Cα RMSD值并进行聚类,聚类cutoff为7.5 Å。

计算结果:

一、ZDOCK对接结果

1.png

ZDOCK的输出文件已经对结果进行了排序,1为得分最高的模型,降序排列。在线版的ZDOCK一般会提供前10个对接模型。

二、ZRANK排序结果

2.png

ZRANK得分越低越好,上表为升序排列。至此,ZDOCK最优的1号模型,经过ZRANK重新打分之后排在了第三位。

三、汇总分析

由于ZDOCK是一款刚性对接软件,对接结果未经过优化处理,因此我们以Cα RMSD来考察模型之间的差异。为了评价计算方法的优劣,我们采用两个参数:1. 接近天然模型的模型数量(N#)和近天然模型富集倍数(EN%)【参考文献:e8 Structure 27, 1041–1051.e1–e8, June 4, 2019】。例如,N5,N50和N500分别表示得分最高的5、50、500个模型中近天然模型的数量。

EN%=[N#/N]/[近天然模型数/总模型数]

对于刚性对接的结果,我们定义Cα RMSD在5 Å及以下的模型为近天然模型。

在2000个模型中,本次实验有79个模型与原始模型的Cα RMSD在5Å以下。

如果以ZDOCK 结果1-10号模型交付,其中近天然模型数为10个,EN%=25.31,平均RMSD为1.242Å;如果选取20个模型,那么EN%=20.25,平均RMSD=5.05 Å

如果以ZRANK结果交付前10个模型,其中近天然模型数为10个,EN%=25.31,平均RMSD为0.935Å;如果选取20个模型,那么EN%=25.31,平均RMSD=1.32 Å

3.png

聚类结果

在选取模型的时候,有时候我们不光要考虑程序的打分情况,还要看看根据RMSD聚类的结果。最理想的情况,应该是绝大部分对接结果都集中在打分最高的模型周围。

4.png

上图中,展示了前30个聚类结果。对于ZDOCK结果,第二簇的结果是否也是可以接受的,对于这一点是有疑问的(具体要看打分及结合的是否合理)。而ZRANK结果就明显更符合预期一些。

结论:在本案例中ZRANK能提高对接结果的准确性。

Souce: 纽普生物    2020-01-11