文章主题:天壤XLab, 蛋白质自由设计, AI药物发现
《科创板日报》3月7日讯(记者 金小莫)在需求栏中输入对目标蛋白质的描述参数,比如序列长度、结构对称性、目标功能、结合配体结构、化学计量等;点击“运行任务”键;很快,电脑屏幕上就显示出了符合参数要求的蛋白质三维结构。
这是记者在天壤XLab看到的相关应用。
🌟【科技新星】天壤XLab引领生物设计革命!🚀🔥2022年10月,创新力量爆发!天壤XLab凭借其卓越的蛋白质自由设计平台——xCREATOR,以无价的知识宝藏向全球教育者敞开怀抱,仅半年时间,已赢得超过500名学者和学生的热烈追捧。📚✨🔍近期独家消息,团队在2月下旬又一力作——自主研发的蛋白质扩散模型正式亮相,标志着其科研实力的飞跃与技术革新的加速。🚀🔥这款平台不仅为学术研究提供了强大工具,也展示了天壤XLab对生物科学深度探索的决心和承诺。它正以惊人的速度改变着生物学界的格局,引领一场生物科技的革命风暴!🌪️🌟欲了解更多详情,敬请关注我们的官方动态,一起见证这场科技盛宴的精彩瞬间!🌐🎉
支撑这些平台的技术就是蛋白质结构的自动生成技术,后者也是ChatGPT的核心技术之一。另有迹象表明,自动生成技术在生命科学领域的应用正在逐渐增多:
🌟凯赛生物引领创新,科创板再谱生科新篇章!💡分子之心获凯赛青睐,AI蛋白质设计平台战略升级,生物科技领域迎来新变革!🚀赛得康初创之路上,AI蛋白模块闪耀,种子轮融资数千万元,科技力量驱动未来发展!🌐这两起事件无疑展示了生物科技与AI的深度融合,标志着生物科技行业的未来将更加智能化和高效。🌟#科创板动态 #分子之心投资 #AI蛋白质设计 #生物科技进步
“其实,ChatGPT所依托的AI生成技术并非新技术,很多公司都已经有所积累并陆续开始应用了。之前有个语言模型BERT就被用于蛋白质生成了,取得了不错的成果。”一家行业企业对记者表示,只不过,当ChatGPT走热之后,AI生成技术在生命科学领域的应用也逐渐走进了公众的视野。
🎉🚀随着科技的不断演进,AI已经不再是TMT领域的专属,它正以惊人的速度渗透到医药生物行业,引领着药物研发的新潮流——AI药物发现。投资者们对此的热情犹如一股热浪,席卷一级市场。那么,ChatGPT是否会成为这个领域的新焦点呢?🔥🔍我们不妨拭目以待,因为它的潜力和创新性无疑将为药品开发开启全新的篇章。👩🔬👨💻
▌氨基酸恰类似于大数据
记者了解到,自动生成技术之所以可应用到蛋白质的发现上,有这样的科学逻辑支撑:
🌟了解啦!让我们用专业且生动的语言来阐述这个过程吧!🔍蛋白质,是由多种氨基酸以独特的方式链接构建的复杂分子,每个独特的三维构型赋予它特定的功能。就像数据是信息的基石,氨基酸则是AI生成蛋白质的基石。而对于AI来说,氨基酸就如同像素,而蛋白质的三维结构则像一幅幅生动的图像。通过深度学习,AI能学会如何巧妙地组合这些像素和图像,从而创造出独一无二的蛋白质序列。🚀这样,科学与技术的完美融合,就在氨基酸的排列艺术中实现了自动生成的奇迹!记得关注我们,获取更多生命科学的精彩解析哦!😊
在业内,这一逻辑也被称为AIGP,即AI Generated Protein(AI生成蛋白质)。
在天壤XLab,记者看到了相关应用:
🌟需求明确,蛋白搜索轻松开始!只需在简洁的栏中填写关键数据,比如序列长度的精确标签(🔍)、结构对称性的专业设定(egrity),以及你期望的功能特性(💪)。别忘了,结合配体信息这块儿也不能遗漏哦(ligands)——它们是找到理想伴侣的关键。点击🚀,任务立即启动!眨眼间,满足所有条件的三维结构模型就会跃然眼前,助你解开蛋白质之谜。记得优化你的搜索词,让搜索引擎找到你的专业知识✨。
🌟【创新力爆棚】🚀去年10月,教育科技领域的里程碑——xCREATOR工作台以公益姿态闪耀登场,专为全球高等教育者和学生量身打造!🎉它在那时就迈出了面向全社会免费开放的步伐,引领了一场知识传播的革命。今年2月下旬,团队更是锦上添花,自主研发的蛋白质扩散模型震撼发布,进一步提升了教育科技的精准度与深度。🔍这不仅展示了他们对科研前沿的敏锐洞察,也是教育技术的一大突破,为学习者提供了更深入的理解工具。记得关注我们,获取更多关于这个改变教育生态的创新平台的最新动态哦!📚💻#xCREATOR# #教育科技革新# #蛋白质扩散模型
“我们还附加了一系列设计蛋白质的分析功能,可以对各类由算法自动生成的蛋白质结构进行打分,分数越高表示该自动生成的蛋白质结构的可实现性越高。”天壤XLab实验室负责人苗洪江博士介绍称。
在ChatGPT中,需要人工对数据进行标注、打分,以此来训练算法更会聊天;AIGP也是类似的逻辑,但不同的是,如果科研人员要想知道某一由算法自动生成的蛋白质,其可实现性到底高不高,还需要通过进一步的湿实验来验证,因此,AIGP的技术壁垒也就更高。
为了降低这一技术门槛,引入打分模型算法是很多企业的选择。
前述行业企业对《科创板日报》记者进一步解释了生成算法与打分算法的工作逻辑:首先,由生成模型算法生成蛋白质;其次,由人工对经打分模型筛选出的、得分较高的蛋白质,再进行实验验证,并反馈给打分模型算法。“二者就像老顽童的左右两手互搏,通过不断增强学习,来提高算法的质量。”
▌探索大分子宇宙
有了AIGP,对于科研人员来说,最大的获益无疑是加速了研发的进展。
“以100个氨基酸长度的蛋白质为例,其序列的排列组合有高达20^100=1.3×10^130种可能!相比之下,人类可观测宇宙总原子数量仅有10^82,以人力来测试、构想这样庞大的蛋白质空间可以说是不可能完成的任务。”苗洪江称,如今AI模型能够精准定位到符合要求的蛋白质再由研发人员进行实验检验,蛋白质设计效率前所未有的提升使其终于可以走进产业应用中去。
更重要的是,过去基于偶然性的开发工作也极大限制了人类对于蛋白质的开发,人类已知的天然蛋白质数量为10^15,而潜在的从头设计蛋白质数量远超于已知天然蛋白质。
以人体内的蛋白质来说,“目前大多数人类蛋白质功能研究都聚焦于约5000种研究较多的人类蛋白质,而人体内还存在着一个巨大的蛋白质世界。事实上,这些功能未知的蛋白质可能掌握着打开解决人类重大疾病的钥匙,如癌症、阿尔兹海默症以及多种罕见病。”苗博士解释称。
除生命科学外,新材料、新能源和食品等领域对功能蛋白质也存有巨大的需求。“整个蛋白质世界还拥有巨大的潜在探索空间,蕴藏着无穷无尽的资源,具有极大应用价值!”天壤CEO薛贵荣博士表示,蛋白质领域的ChatGPT会成为像水、电、煤一样成为工业发展支撑,开辟出全新的科学时代。
《科创板日报》记者进一步了解到,如何获取行业数据、如何通过实验验证来对数据进行标注进而得到高质量的反馈数据仍然是限制AIGP大爆发的主要拦路虎。基于此,开源共享仍是目前行业企业们的主要选择。
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!