文章主题:Meta, ESMFold, AlphaFold, 蛋白质结构预测

666AI工具大全,助力做AI时代先行者!

智东西

编译 | 周炎

编辑 | 云鹏

🌟【科技巨头对决】Meta与DeepMind的AI神力:ESMFold与AlphaFold蛋白结构揭秘🔍🔥《华尔街日报》深度解析!Meta与谷歌旗下的DeepMind两大科技巨头,最近在蛋白质结构预测领域展开了一场备受瞩目的较量——ESMFold对阵AlphaFold。这两款革命性的模型,凭借其超凡的智能,引领了生物信息学的新篇章。\极坐标系中,点P(3,$\frac{2\pi}{3}$)与点Q(-4,θ)之间的距离是多少?

🌟DeepMind’s Game-Changing Breakthrough: Revolutionizing Protein Structure Analysis 🚀After years of relentless pursuit, the scientific community has been thrilled by a remarkable achievement from AI trailblazers at DeepMind. This groundbreaking discovery marks a significant leap forward in replacing time-consuming and costly laboratory methods with cutting-edge AI technology. The result? Unprecedented 3D structures of proteins, which hold the key to unlocking breakthroughs in drug development, vaccine creation, and climate change research 🛠️🔬.These intricate structures, long elusive to researchers, now promise a more efficient and accurate way to understand protein function, paving the way for groundbreaking discoveries that could transform global health and our understanding of the environment. DeepMind’s AI prowess has not only streamlined the process but also opened doors to a future where scientific inquiries are powered by advanced computational intelligence 🤖🔬.Remember, every step towards unraveling nature’s secrets is a testament to the power of innovation and collaboration. So, let’s celebrate this incredible leap forward in science, driven by the relentless pursuit of knowledge and the boundless potential of AI! 🎉🌍

🌟【科技巨头竞相破译生命密码】🚀在2021年7月的科技盛宴中,DeepMind的AlphaFold2震撼登场,一鸣惊人地揭示了几乎所有已知蛋白质的秘密结构。仅仅三个月后的跟进,Meta的研究团队也不甘示弱,在《自然》杂志上发表了他们的最新成果——ESMFold蛋白质结构预测模型。这款创新工具不仅覆盖了细菌、病毒等微生物的约6亿种未知蛋白质,更在氨基酸序列的处理上展现了超凡速度,相较于AlphaFold2,其效率提升了惊人的60%!科技的力量正在加速解开生命之谜,让我们期待未来更多突破性的科学发现!🔍

一、ESMFold加入战局,14天内预测超6亿种蛋白质结构

🌟氨基酸序列解锁蛋白质秘密:科学难题中的AI革命 🧬预测复杂生物分子——蛋白质的三维结构,一直是科研领域的棘手问题。从一级到四级,每个层次的结构变化都揭示着生命活动的秘密。蛋白结构预测,就是解开这些折叠和旋转的密码。氨基酸的多样性,犹如宇宙中星辰,决定了可能的构型数量庞大无比。🚀幸运的是,人工智能(AI)正引领我们步入蛋白质解析的新纪元。它以高效的方式,帮助科学家们在浩瀚的构象海洋中找到关键线索。通过AI的力量,我们能以前所未有的速度揭示蛋白质的真实面貌。🔍SEO优化提示:使用关键词如”氨基酸序列”, “蛋白质结构预测”, “AI解析”, “四级结构”, “生物分子解锁”等。同时,适当运用emoji符号如折叠的手势(🧬)、分子结构图(🔬)和加速的箭头(🚀),以提升内容可读性和搜索引擎友好性。

🌟AlphaFold2的卓越预测能力源于它那先进的端到端神经网络训练,能够在多序列输入、同源物对齐和模板选择的背景下展现出强大的蛋白质结构预测实力。相比之下,ESMFold则倚赖ESM-2的深度学习理解和表达,实现了端到端的3D结构预测,独树一帜。🌟

🌟🚀ESMFold, the advanced language model 🧬🔍, operates on a similar principle to ChatGPT but with a unique twist. Unlike its predecessor that relies on natural language, ESMFold is trained on the intricate language of biology – gene sequences. Its architecture differs from AlphaFold2’s structural matching, streamlining the process without needing explicit homologous sequences. This means protein models can be decoded effortlessly with just one sequence input.ESMFold stands out as a groundbreaking, end-to-end predictor 🤝💻, capable of running entirely on GPU. It breaks free from database dependencies, making it a game-changer in protein structure prediction. Its efficiency and adaptability make it a top choice for researchers seeking speed and accuracy without the hassle. #ESMFold #ProteinPrediction #GeneticLanguage

研究人员曾经做过试验,在单个NVDIA V100 GPU上,使用较少参数的ESMFold在14.2秒被对具有384个残基进行预测,可比单个AlphaFold模型能够实现的预测速度快6倍,而在较短的序列上,研究人员甚至看到约60倍的提速。

据悉,ESMFold蛋白质模型背后的团队由Meta AI资深研究科学家Alexander Rives主导,该团队专注于大规模蛋白质序列和结构数据的无监督表示学习模型研究。

2017年,欧洲生物信息研究所发布的显示了AlphaFold模拟人类的蛋白质结构,来源:法国新闻社

Meta AI研究科学家Alexander Rives说:“这些蛋白质极其多样,人类对它们知之甚少,为了数量规模庞大的蛋白质,研究人员需要在预测速度上取得突破。”他还称,使用大型语言模型,ESMFold能够在两周内预测超过6亿种蛋白质。

作为测试案例,Meta AI将ESMFold用于来自环境来源(包括土壤、海水、人类肠道、皮肤和其他微生物栖息地)的批量测序“宏基因组”DNA数据库。绝大多数编码潜在蛋白质的DNA条目来自从未培养过且科学未知的生物体。

自从DeepMind取得突破以来,人们对AI在生物学中的应用产生了巨大的兴趣。AlphaFold是蛋白质结构预测方面取得的一大进步,这也进一步激发了深度学习的浪潮。

二、曾取得CASP最好成绩,AlphaFold将被用于治疗疾病

目前,DeepMind开源了AlphaFold2的代码,让社区可以免费使用,目前约2.4亿的几乎所有已知的蛋白质都可以查到。此前,研究人员花费几个月或几年时间才能预测蛋白质的结构。投资生命科学技术的成长型股票公司Biospring Partners联合创始人詹妮弗卢姆(Jennifer Lum)称,AlphaFold缩短了这个过程,使这些团队能够将他们的时间转移到下游的研究和产品开发上,进入其他增值领域。

2018年,AlphaFold1在两年一度的CASP实验中取得了最好的成绩。团队又花了大量时间跟踪CASP,尝试不同的方法来改进AlphaFold,测试它们是否可以匹配实验蛋白质结构的准确性。

Jumper称,这个团队一直工作到2019年,他才真正相信这个团队能够完成它的使命。传统而言,生物学家使用基于X射线和其他技术的实验室技术来理解单一蛋白质结构,但据Jumper称,这一过程不仅要花费数年时间,还活花费10万美元。

John Jumper领导了机器学习应用蛋白质生物学的新方法开发,来源:DeepMind官网

虽然计算方法在理解蛋白质结构方面取得进展,但是目前这项技术还不够完善。无法取代实验室方法。最初的AlphaFold模型试验AI预测氨基酸对之间的距离,第二步利用这些距离分布来得到蛋白质的预测结构。其中第二步涉及到AlphaFold,它利用这些信息,提出了一个关注蛋白质是什么样子的共识模型,而无需AI。

Jumper称,研究小组正在把注意力转向蛋白质创新的新挑战。研究小组正在寻求了解突变与蛋白质功能变化之间的联系,这可以帮助治疗疾病。

结语:AI赋能药物研发具有巨大潜力

作为蛋白质结构预测大模型,ESMFold在速度上快于AlphaFold2约60倍。如果在实际计算中,这一速度优势表现得更加明显。同时推断速度优势使得基于计算有效映射大型宏基因组序列数据库的结构空间成为可能。

ESMFold还可以被用于进行快速准确的结构预测,进一步帮助发现新的蛋白质结构和功能。未来,ESMFold或将超越预测蛋白质的静态结构,进一步研究蛋白质的动态结构。当这两个领域的研究都完成后,通过AI赋能新药设计就具备了基础,而从长远看,这具有巨大的潜力。

来源:《华尔街日报》

AI时代,掌握AI大模型第一手资讯!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

扫码右边公众号,驾驭AI生产力!

Leave a Reply

Your email address will not be published. Required fields are marked *