看啥推荐读物
专栏名称: 生信宝典
生物信息分析入门、晋级和经验分享。Linux、R、Python学习教程;高通量测序数据分析学习教程;生信软件安装教程。所有内容均为原创分享,致力于从基础学习到提高整个过程。
目录
今天看啥  ›  专栏  ›  生信宝典

Nat. Biotechnol. | 利用语言模型设计蛋白质

生信宝典  · 公众号  · 生物  · 2024-03-25 21:00
关联阅读:新物种、新 CRISPR 系统!Evo 大模型突破全基因组生成,创造生物大模型新标杆今天为大家介绍的是来自Ali Madani团队的一篇论文。蛋白质语言模型从进化的多样序列中学习,已被证明是序列设计、变异效应预测和结构预测的强大工具。蛋白质语言模型的基础是什么,它们如何在蛋白质工程中应用呢?蛋白质由一条线性的残基链组成,20种标准氨基酸构成了大多数天然蛋白质的词汇。这些氨基酸的排列顺序决定了蛋白质在其环境中的三级结构,进而赋予了它们特定的功能。理解蛋白质序列、结构和功能之间的关系是生物学研究的一个主要焦点。在这篇入门文章中,作者专注于一类仅基于序列却能捕捉到蛋白质结构和功能属性的机器学习模型。蛋白质语言模型(PLMs)是在覆盖生命进化树的大量蛋白质序列数据集上训练的。通过这些序列,PLMs ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照