文章预览
准确预测蛋白质突变效应在蛋白质工程和设计中至关重要。 近日,清华大学龚海鹏团队提出了一套 基于几何学习的模型套件--GeoStab-suite,其中包含GeoFitness、GeoDDG和GeoDTm三个模型,分别用于预测蛋白质突变后的适应度得分、ΔΔG和ΔTm。 相关研究以Improving the prediction of protein stability changes upon mutations by geometric learning and a pre-training strategy为题,于2024年10月25日发表在《Nature Computational Science》上。 GeoFitness采用专门的损失函数,允许使用深度突变扫描数据库中的大量多标记适应度数据对统一模型进行监督训练。 为了进一步改进ΔΔG和ΔTm预测的下游任务,GeoFitness的编码器被重新用作GeoDDG和GeoDTm中的预训练模块,来克服缺乏足够标记数据的挑战。 这种预训练策略与数据扩展相结合,显著提高了模型性能和通用性。 在基准测试中,就Spearman相关系数而言,Geo
………………………………