文章主题:AI, 蛋白质, 自动化
《科创板日报》3月7日讯(记者 金小莫) 在需求栏中输入对目标蛋白质的描述参数,比如序列长度、结构对称性、目标功能、结合配体结构、化学计量等;点击“运行任务”键;很快,电脑屏幕上就显示出了符合参数要求的蛋白质三维结构。
这是记者在天壤XLab看到的相关应用。
🎉🚀 2022年10月,天壤XLab的蛋白质自由设计平台xCREATOR震撼上线!🎉🚀作为一款面向高校师生免费开放的创新工具,xCREATOR在短短半年内就吸引了五六百名用户。这不仅证明了其强大的功能和实用性,也展示了团队的专业能力和对科研的热情。近日,《科创板日报》记者有幸采访到了天壤XLab的负责人,他们透露了一个令人振奋的消息:今年2月下旬,我们的自主研发团队成功研发出了一款蛋白质扩散模型,并已正式上线!这个模型的出现,无疑为xCREATOR的用户们提供了更多的可能性。通过这款模型,研究人员可以更准确地预测和设计蛋白质的结构,从而推动科研的进步。天壤XLab一直致力于提供最前沿的科研工具和服务,我们相信,随着更多的人加入到我们的行列,我们将共同创造出更多的科学奇迹!🚀🎉#天壤XLab #蛋白质自由设计平台xCREATOR #自主研发团队 #蛋白质扩散模型
支撑这些平台的技术就是蛋白质结构的自动生成技术,后者也是ChatGPT的核心技术之一。另有迹象表明,自动生成技术在生命科学领域的应用正在逐渐增多:
今年2月,凯赛生物宣布领投分子之心的新一轮战略投资,而赛得康则完成了数千万元的种子轮融资,AI设计蛋白质模块是企业的关键词。
“其实,ChatGPT所依托的AI生成技术并非新技术,很多公司都已经有所积累并陆续开始应用了。之前有个语言模型BERT就被用于蛋白质生成了,取得了不错的成果。”一家行业企业对记者表示,只不过,当ChatGPT走热之后,AI生成技术在生命科学领域的应用也逐渐走进了公众的视野。
🎉🚀随着人工智能技术的飞速发展,AI药物研发已经成为了全球科技领域的热门话题。在过去的几年里,AI药物的研发取得了显著的进步,尤其是在肿瘤、罕见病等领域。然而,AI药物的研发并非一蹴而就,它需要大量的数据和计算资源,以及专业的团队进行研究和开发。🚀🚀在当前的科技环境下,ChatGPT等人工智能技术的发展为AI药物研发带来了新的机遇。通过深度学习和自然语言处理技术,ChatGPT可以快速理解和分析大量的医学文献和临床试验数据,从而帮助研究人员更准确地预测新药的效果和副作用。🚀🚀然而,尽管ChatGPT在AI药物研发方面具有巨大的潜力,但它仍然面临着许多挑战。首先,AI药物的研发需要大量的医疗专业知识和经验,而这些知识和经验往往难以通过编程来获取。其次,AI药物的研发还需要考虑到伦理和法律问题,因为新药的开发可能会对人类健康产生重大影响。🚀🚀总的来说,ChatGPT在AI药物研发方面的潜力是巨大的,但我们也应该看到它面临的挑战。只有通过不断的研究和创新,我们才能更好地利用人工智能技术来推动AI药物的研发,为人类的健康做出更大的贡献。
▌氨基酸恰类似于大数据
记者了解到,自动生成技术之所以可应用到蛋白质的发现上,有这样的科学逻辑支撑:
🎉蛋白是由氨基酸通过不同的排列组合聚合而成,每个蛋白质的三维结构又决定了它的功能作用。在算法人的眼中,氨基酸就类似于数据、蛋白质的三维结构类似于图像,通过数据及图像的不同排列组合训练,AI就能实现自动生成。
在业内,这一逻辑也被称为AIGP,即AI Generated Protein(AI生成蛋白质)。
在天壤XLab,记者看到了相关应用:
🎉 Protein structure prediction is now as easy as clicking a button! 🚀Are you tired of spending hours trying to predict the 3D structure of your target protein? Look no further! With our advanced algorithm, you can quickly and easily generate a high-quality model that meets all your requirements.💡 Just input the parameters you need, such as sequence length, structural symmetry, target function, ligand binding site structure, and chemical stoichiometry. Our intuitive interface makes it easy to navigate through the process.🚀 Once you’ve entered your data, hit the “Run Task” button, and our powerful software will do the rest. In no time, you’ll see a stunning visualization of your protein’s structure on the screen.🎉 Don’t waste any more time trying to figure out the 3D structure of your protein. Let us take care of it for you! 🚀# Protein Structure Prediction #3D Structure Generation #Intuitive Interface #Advanced Algorithm #Time-Saving Solution #Stunning Visualization #Target Function #Ligand Binding Site Structure #Chemical Stoichiometry #Efficient Software #Protein Science #Scientific Research
🎉🚀去年10月,我们团队研发出了一款名为”xCREATOR”的工作台,它为高校师生提供了一个全新的创作平台。这款工具不仅功能强大,而且完全免费,受到了广大师生的一致好评!今年2月下旬,我们的团队又研发出了一个名为“蛋白质扩散模型”的新工具。这个模型可以帮助科学家们更好地理解蛋白质的运动规律,对于生物医学研究有着重要的意义!
“我们还附加了一系列设计蛋白质的分析功能,可以对各类由算法自动生成的蛋白质结构进行打分,分数越高表示该自动生成的蛋白质结构的可实现性越高。”天壤XLab实验室负责人苗洪江博士介绍称。
在ChatGPT中,需要人工对数据进行标注、打分,以此来训练算法更会聊天;AIGP也是类似的逻辑,但不同的是,如果科研人员要想知道某一由算法自动生成的蛋白质,其可实现性到底高不高,还需要通过进一步的湿实验来验证,因此,AIGP的技术壁垒也就更高。
为了降低这一技术门槛,引入打分模型算法是很多企业的选择。
前述行业企业对《科创板日报》记者进一步解释了生成算法与打分算法的工作逻辑:首先,由生成模型算法生成蛋白质;其次,由人工对经打分模型筛选出的、得分较高的蛋白质,再进行实验验证,并反馈给打分模型算法。“二者就像老顽童的左右两手互搏,通过不断增强学习,来提高算法的质量。”
▌探索大分子宇宙
有了AIGP,对于科研人员来说,最大的获益无疑是加速了研发的进展。
“以100个氨基酸长度的蛋白质为例,其序列的排列组合有高达20^100=1.3×10^130种可能!相比之下,人类可观测宇宙总原子数量仅有10^82,以人力来测试、构想这样庞大的蛋白质空间可以说是不可能完成的任务。”苗洪江称,如今AI模型能够精准定位到符合要求的蛋白质再由研发人员进行实验检验,蛋白质设计效率前所未有的提升使其终于可以走进产业应用中去。
更重要的是,过去基于偶然性的开发工作也极大限制了人类对于蛋白质的开发,人类已知的天然蛋白质数量为10^15,而潜在的从头设计蛋白质数量远超于已知天然蛋白质。
以人体内的蛋白质来说,“目前大多数人类蛋白质功能研究都聚焦于约5000种研究较多的人类蛋白质,而人体内还存在着一个巨大的蛋白质世界。事实上,这些功能未知的蛋白质可能掌握着打开解决人类重大疾病的钥匙,如癌症、阿尔兹海默症以及多种罕见病。”苗博士解释称。
除生命科学外,新材料、新能源和食品等领域对功能蛋白质也存有巨大的需求。“整个蛋白质世界还拥有巨大的潜在探索空间,蕴藏着无穷无尽的资源,具有极大应用价值!”天壤CEO薛贵荣博士表示,蛋白质领域的ChatGPT会成为像水、电、煤一样成为工业发展支撑,开辟出全新的科学时代。
《科创板日报》记者进一步了解到,如何获取行业数据、如何通过实验验证来对数据进行标注进而得到高质量的反馈数据仍然是限制AIGP大爆发的主要拦路虎。基于此,开源共享仍是目前行业企业们的主要选择。
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!