今天看啥  ›  专栏  ›  智药邦

慕尼黑工业大学提出TwinBooster模型,结合自监督学习和大语言模型预测分子性质

智药邦  · 公众号  ·  · 2024-07-15 09:00
    

文章预览

定量构效关系(QSAR)建模是加速药物发现和开发过程的关键因素。然而,药物发现中的数据集规模往往不足以开发准确可靠的QSAR预测因子。这是因为许多关键的分析既耗时又昂贵,使得收集足够的标记样本进行QSAR建模变得困难。此外,这些数据集可能缺乏化学多样性,降低了最终数据驱动模型的泛化能力,或者可能没有报告“负面”(例如,非活性)化合物,限制了可用于训练QSAR模型的信息量。 2024年6月5日,德国慕尼黑工业大学Maximilian G. Schuh等人在Journal of Chemical Information and Modeling上发表文章Synergizing Chemical Structures and Bioassay Descriptions for Enhanced Molecular Property Prediction in Drug Discovery。 作者提出了一种结合自监督学习(SSL)、大语言模型(LLM)和梯度增强机(GBM)的分子性质预测方法TwinBooster。 TwinBooster基于自监督学习架构Barlow Twins,可以将文本和分子信息结合 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览