文章预览
大数据文摘受权转载自学术头条 作者: 木木 蛋白质是生物体中非常重要的功能性分子,它们的形成过程经过了数十亿年的自然选择和进化。在这一过程中,蛋白质的序列和结构经过无数次随机突变,并通过生物系统的选择机制进行筛选,最终形成那些具有特定生物学功能的蛋白质。 近年来,随着深度学习和语言模型(LM)的发展,科学家们开始尝试将这些工具应用于理解生物系统,尤其是蛋白质。 今天,Science 杂志发表了一项重要研究成果,展示了如何利用语言模型来生成和推理蛋白质序列、结构和功能,并提出了一个名为 ESM3 的多模态生成式模型。该模型不仅能够生成功能性蛋白质,还能够模拟超过 5 亿年的进化过程,生成与自然界已知蛋白序列不同的全新蛋白质。 ESM3 模型由人工智能初创公司 Evolutionary Scale 研发,旨在帮助科学家理解、构
………………………………