看啥推荐读物
专栏名称: 生信宝典
生物信息分析入门、晋级和经验分享。Linux、R、Python学习教程;高通量测序数据分析学习教程;生信软件安装教程。所有内容均为原创分享,致力于从基础学习到提高整个过程。
目录
相关文章推荐
BioArt  ·  Cell | ...·  2 天前  
生物探索  ·  Nature | ...·  2 天前  
生物探索  ·  Cell | ...·  3 天前  
今天看啥  ›  专栏  ›  生信宝典

Nat. Commun. | gLM:基于宏基因组预训练语言模型的基因和蛋白调控及功能预测算法

生信宝典  · 公众号  · 生物  · 2024-04-14 21:00
2024年4月3日,Peter R. Girguis、Sergey Ovchinnikov、Yunha Hwang、Andre L. Cornman和Elizabeth H. Kellogg几人在Nature Communications上发表了一篇题为“Genomic language model predicts protein co-regulation and function”的研究文章。这项研究开发了一种基因组语言模型(gLM),通过训练数百万的宏基因组拼接片段,学习了基因之间的潜在功能和调控关系。这一模型不仅能够捕捉到蛋白质序列本身,还能编码生物学上有意义且与功能相关的信息,如酶功能、分类等。通过对注意力模式的分析,研究揭示了gLM能够学习到协同调控的功能模块(即操纵子)。该研究表明,gLM的无监督深度学习方法有效且有前景,能够编码基因在其基因组上下文中的功能语义和调控句法,揭示复杂基因组区域中基因间的复杂关系。此项工作不仅为理解基因功能与调控提供了新视角,也为未来的迁移学习应用和研 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照