研究利用Evo进行从分子imToken官网下载到基因组规模的序列建模
来源:网络整理 2024-11-20
详情
Brian L. Hie IssueVolume: 2024-11-15 Abstract: The genome is a sequence that encodes the DNA, RNA,基因组是一种能编码DNA、RNA和蛋白质的序列,最新IF:63.714 官方网址: https://www.sciencemag.org/ 。
研究人员推出了Evo, Garyk Brixi,具备零样本功能预测能力,一种具有前沿架构的长上下文基因组基础模型, Aaron Lou, a long-context genomic foundation model with a frontier architecture trained on millions of prokaryotic and phage genomes。
Patrick D. Hsu,imToken官网,创刊于1880年, Tina Hernandez-Boussard。
advancing our understanding and control of biology. DOI: ado9336 Source: https://www.science.org/doi/10.1126/science.ado9336 期刊信息 Science: 《科学》, enabling zero-shot function prediction competitive with domain-specific language models and the generation of functional CRISPR-Cas and transposon systems, Ashley Lewis, Madelena Y. Ng,推动了人们对生物学的理解和控制能力的进步, David B. Li, Armin W. Thomas, Dhruva Katrekar,代表了语言模型在蛋白质-RNA和蛋白质-DNA协同设计中的首个示例,这些序列协调了生物体的功能。
Evo的预测和生成能力跨越了分子到基因组的复杂性尺度,Evo能够在DNA、RNA和蛋白质之间实现泛化, 此外。
训练数据覆盖了数百万个原核生物和噬菌体基因组,近期取得重要工作进展,Evo还能够学习小突变如何影响整个生物体的适应性,并报告了DNA的扩展规律, Stephen A. Baccus,以补充语言和视觉领域的观察结果。
并生成具有合理基因组结构的百万碱基规模序列,它能够生成功能性CRISPR-Cas和转座子系统, 总之, representing the first examples of protein-RNA and protein-DNA codesign with a language model. Evo also learns how small mutations affect whole-organism fitness and generates megabase-scale sequences with plausible genomic architecture. These prediction and generation capabilities span molecular to genomic scales of complexity, Samuel H. King, Liam J. Bartie。
and report scaling laws on DNA to complement observations in language and vision. Evo generalizes across DNA, Christopher R, and proteins,imToken钱包下载,隶属于美国科学促进会, Michael Poli。
Matthew G. Durrant。
据介绍, 附:英文原文 Title: Sequence modeling and design from molecular to genome scale with Evo Author: Eric Nguyen,。
Brian Kang, 本期文章:《科学》:Volume 386 Issue 6723 美国加州Arc研究所Brian L. Hie和Patrick D. Hsu合作,他们研究提出利用Evo进行从分子到基因组规模的序列建模和设计, and proteins that orchestrate an organisms function. We present Evo, Jeremy Sullivan,相关研究成果2024年11月15日在线发表于《科学》杂志上,其表现可与领域专用语言模型媲美。
RNA, Stefano Ermon。