电商狂欢!ChatGPT引领潮涌,各厂商纷纷接入,行业变革在即?
AI与化学

电商狂欢!ChatGPT引领潮涌,各厂商纷纷接入,行业变革在即?

近期,电商平台成为ChatGPT的重要应用场景,众多电商企业开始接入这一AI技术以提升运营效率。其中,吉宏股份已成功利用ChatGPT优化跨境电商业务,节省人力成本,返利科技的如意APP也基于该技术提供AI导购服务。然而,随着竞争加剧和监管关注,企业还需谨慎评估与ChatGPT的关系并确保合规经营。ChatGPT对跨境电商行业的潜力显而易见,但也面临文本生成自然度和数据安全挑战。
没想到,ChatGPT原来是刷题高手,那咱孩子就少刷点了
AI与化学

没想到,ChatGPT原来是刷题高手,那咱孩子就少刷点了

ChatGPT+小半爸 东西儿童教育 2023-04-19 大家好,我是小半爸。 ChatGPT火了好几个月,2023年也成了人工智能(AI)元年! 在去年11月30日发布后的5天时间里,ChatGPT收获了100万用户。 推出仅两个月,ChatGPT在2023年1月末的月活用户已突破1亿。 2023年3月15日——OpenAI宣布推出ChatGPT 4.0,不仅可以处理文字,还可以处理图片等多种形式的信息,在国内引发了一连串同类AI产品的发布,百度、华为、阿里都有官宣。 我从去年12月,就开始关注ChatGPT,写了一篇科普文章,介绍了史上最强AI(人工智能)机器人,ChatGPT横空出世。 今天我们聊一个,和技术无关,和家庭教育相关,值得每位家长来关注的话题:AI如此强大,我们的教育如何让孩子不输在未来? 我将从以下三个方面来分享我的看法。 未来已来,AI让教育重塑给孩子的教育,要反AI之道而行之解铃还须系铃人,AI建议孩子这么学 文章不长,希望这几分钟能对大家有所启发! 01 未来已来, AI让教育重塑 人工智能将正在改变世界,而无论是ChatGPT的创始人Sam Altman、OpenAI的早期投资人Elon Musk,还是各路专家、学者,都认为:AI对人类社会最为根本的影响,将发生在教育领域! 而且,这些影响已经在机构、学生、家长三个方面都显现了。 机构在创新 一些教育机构,看中了人工智能能够为学生个性定制课程的能力。可汗学院就宣布将使用GPT-4为其人工智能助手“Khanmigo”提供技术支撑,Khanmigo既可以作为学生的虚拟导师,也可以作为教师的课堂助手。 B站上也出现了不少用GPT技术来辅导孩子写作文,学英语听说读写的视频课程。甚至有机构把李白讲唐诗,苏轼讲宋词,华罗庚教数学,杨振宁教物理,周杰伦上音乐课,谷爱凌教滑雪作为未来AI私人定制教学的愿景。 学生在拥抱 学生是ChatGPT绝对的拥护者。ChatGPT公布之后,迅速成为了美国孩子们的心头爱,不断有新闻报道,中小学生利用ChatGPT帮助完成作业,大学生用ChatGPT撰写论文…… 到1月初,因为“担心GPT对学生学习的负面影响”,纽约教育局宣布:限制在纽约市公立学校的网络上使用ChatGPT。 随着中文“类GPT”应用的推出,估计中国的孩子们也难抵诱惑,在他们的日常学习中,使用AI完成作业,帮助刷题。 家长在揪心 让家长们揪心的问题是:AI如此强大的学习能力,会让我们的孩子未来找不到工作吗? 这还真不是杞人忧天,前几次大的技术革新包括之前大热的自动驾驶,淘汰的大部分是“蓝领”工作岗位,但ChatGPT们所具备的文案拟稿、图片设计、医生、律师、编程等技能,都是“白领”的范畴,都是大部分孩子们接受教育后的目标职业。 AI带来的威胁,再加上清华钱颖一教授多年前的一句警言:未来的人工智能会让我们的教育制度下培养学生的优势荡然无存。 让家长和很多教育工作者对孩子的教育产生了困惑:当下的教育模式一定需要改变,但怎么去重塑,并不清楚。 02 给孩子的教育 要反AI之道而行之 师夷长技以制夷,AI如此强大,我们不妨先来科普学习一下ChatGPT的训练原理。 ChatGPT的技术核心——GPT的全称是Generative Pre-trained Transformer,其中Pre-trained预训练,主要包含三个步骤。 第一步:“收集示例数据,训练一个有监督的模型”,从成千上万的问题中,由人工标记出一些问题,并写出参考答案给AI,然后AI理解人类是怎么表达和学习的。第二步:“收集比较数据,训练一个奖励模型”,人们从AI对同一个问题给出的不同回答进行打分排序,通过这种结果的比较,告诉AI什么是好的,什么是不好的。第三步:“根据奖励模型,对有监督模型进行持续的优化”,就是迭代重复前两步,让AI输出的文本越来越符合人的认知。 很眼熟吧,ChatGPT的学习过程是不是很像“刷题”,先做例题,然后对照和熟悉答案,最后就是大量重复,提高速度和准确率。 从中我们可以品出两点:首先刷题确实还是有用的,AI也需要刷题才能让自己更加“聪明”,刷题并不是反智的;另外,通过刷题训练提高智能这条路,AI已经做得“让人无路可走了”。 所以,随着AI时代的强势到来,我们的教育策略,要体现差异化,要反其道而行之。既然AI已经是刷题高手了,那给孩子的教育,就要反着来,轻刷题训练,重思维培养。 看到这,估计大家会嘟囔一句:说的有道理,但具体该怎么做呢? 03...
掌握分子对接艺术,从PDB到药物ADME——新冠病毒主蛋白酶抑制剂的全链路虚拟筛选之旅
AI与化学

掌握分子对接艺术,从PDB到药物ADME——新冠病毒主蛋白酶抑制剂的全链路虚拟筛选之旅

这是一份关于蛋白质-配体分子对接的系统学习教程,涵盖了从数据库使用、软件操作到虚拟筛选和动力学模拟的全过程。课程共七天,第一天介绍工具安装,第二天详细讲解PDB数据库查询与pymol应用,第三天至第四天教授虚拟筛选技术,并提供案例分析;第五天引入Linux和gromacs进行分子动力学模拟;第六天演示溶剂化模拟;第七天实战操作蛋白-配体模拟。每个阶段都有特定的目标和流程,通过这个课程,学员将能熟练掌握蛋白质对接的理论与实践技巧。
ChatGPT能否理解化学家的问题
AI与化学

ChatGPT能否理解化学家的问题

大型语言模型(LLMs)通过ChatGPT等工具向人们展示了其处理复杂问题的潜力。那么,这种AI技术在化学领域的应用表现又如何呢,不妨通过与ChatGPT进行对话,来考察它是否真的可以理解化学家们的所思所想吧。 大型语言模型是利用机器学习算法生成文本的AI工具。它们能够猜测或预测单词,并创建反映人类写作和口语表达方式的短语、段落和完整文章。LLMs最近因使用包括数十亿个单词数据集的数据集开发了强大的训练模型,而重塑了自然语言处理。这些模型还使用复杂的算法进行训练,使其能够学习其上下文和自然语言。LLMs是输入具有部分屏蔽或模糊的文本摘录,神经网络尝试预测缺失的元素,然后将预测与原始文本进行比较。神经网络通过迭代执行此任务,根据输出调整参数。最后,这个神经网络建立了一个模型,说明了单词在句子中相互关联的方式。LLMs是许多不同应用的强大和灵活的工具,并可能包括对化学的理解。 一些有趣的LLMs工具最近相继问世。 图灵NLGm,是由微软在2020年初发布和开发的。它使用了迄今为止最大的数据集,拥有170亿个参数! Gopher,是由DeepMind开发的拥有2800亿参数的模型。它在STEM学科方面表现出色,这是LLM能够理解化学的第一个线索。 GPT-3,由OpenAI公司开发,它是通过公开可用的约570GB文本信息数据集进行训练得到,GPT-3发布了一个能够重建包括计算机代码在内的几乎任何语言结构的最大神经网络之一。 Galactica,是由Meta公司发布的开源LLM模型,他们希望通过它来改善公司形象以应对批评。然而,不久后Meta决定不向公众展示其模型,理由是它可能无法像用户希望的那样有效工作,或者不符合必要的道德准则而进一步受到批评。 LLMs的运用的确存在盲点,特别是在构建一些模型所使用的数据没有经过矫正的时候,因此才有人戏称目前大火的ChatGPT在某些情况下是在一本正经的胡说八道。 LLM对其分析或生成的文本的理解是有限的。如果LLM在训练中捕获了错误值,它可能在被问及时回答这个值。生成的答案可能是表面上有效的,但LLM没有推理或表达有关主题的理解能力。从这个角度来看,如果被问及一个物理或化学性质,LLM可以回答有关化合物的相关性质,然而这些回答也行来源于并未矫正过的数据,或者一些不是那么可靠的文献。 本文将使用OpenAI的 ChatGPT来进行一些基础的测试,ChatGPT的训练模型使用了具有化学方程式和常见计算知识的InstructGPT模型。这个测试可能不适用于其他的语言生成模型,因为ChatGpt设定了一些特定的控制参数,比如温度是控制GPT-3引擎输出的最重要设置之一。它控制生成文本的随机性。 测试1:将化合物名称和SMILES的转换 对于ChatGPT,即使是对于简单的烷烃和烯烃,将化合物名称转换为SMILES化学表示法也是一个困难任务。在这个测试中,ChatGPT的正确率约为27%。对于4到10个碳原子的较大的直链、支链、环状或芳香族烃化合物,ChatGPT模型的混淆情况很多。它不理解烷烃和烯烃,苯和环己烯,也不理解顺式异构体和反式异构体之间的区别。有趣的是,它会添加不存在于该分子中的卤素或氧原子。几次尝试表明,ChatGPT模型也行并不具备化学天赋! 表1. ChaGPT在名称和SMILES号转换测试中的表现(绿色正确) 测试2:查询化合物的脂水分配系数 比较实验测试的辛醇-水分配系数(log Pexp)与ChatGPT在文献中找到的值(log PChatGPT)进行比较(表2),ChatGPT模型找到了化合物属性的合理值,有时比使用生物信息学工具找到的值要好得多。其平均相对误差约为31%,在这轮测试中ChatGPT表现亮眼! 表2.ChatGPT给出的化合物Log P值和实验值比较 测试3:查询化合物结构信息 在表3为ChatGPT描述化合物几何构型的正确率,12个化合物中,ChatGPT模型对其中5个配位化合物作出了正确的预测。如果化合物K3 [NbOF6]和(NH4)2Ce(NO3)6的确是都是不同类型的八面体,则ChatGPT模型的命中率为58%,对于这些不常见的化合物结构的准确预测,表明ChatGPT在给出化合物结构信息上的表现良好。 表三.ChatGPT在分析化合物结构信息上的表现,绿色为正确 测试4:聚合物的水溶性预测 ChatGPT模型正确预测了11种聚合物的溶解度(表4),这些聚合物在工业和学术界具有重要应用。虽然这些化合物仅从结构上就能很快判断其水溶性,但是ChatGPT给出的关于某个情境的预测显得较为可靠。 表4. ChatGPT预测化合物水溶性表现 测试5:化合物点群预测 化合物的点群(point group)指的是化合物所具有的对称性群,即该化合物的所有对称操作组成的群。它是定义分子的几何构型和光谱性质的基础。ChatGPT模型在简单分子化合物的10个分子点群中有6个正确的预测(表5)。如使用复杂分子问这些问题,命中率可能小于60%。 表5. ChatGPT预测分子点群的测试表现 总结 上述测试表明,ChatGPT回答化学问题的准确率在25%至100%之间,准确率高低取决于几个重要因素:合理的提示容易获得正确的答案,热门的研究领域问题很容易回答,对于数据库中未包括或模型训练不足的非常特定的问题,准确率较低。 令人失望的是,从SMILES表示法到化合物名称的转换,以及相反方向的转换,准确率如此之低。存在的问题有答案有时会漏掉或添加甲基基团,添加不存在的原子,混淆常规环和芳香环,或者不理解同分异构体。当然在其他几个测试中ChatGPT的表现可圈可点。 总的来说,ChatGPT等LLM工具给人们展示了在特定领域的巨大发展潜力。实验化学家和计算化学家都不应该害怕LLMs的发展。任务的自动化并不应该降低实验或计算化学家手和创造力的需求。相反,应该将许多激动人心和更好的人工智能工具集成到研究中,以扩展和解决长期挑战研究者的复杂问题。 参考文献:Castro Nascimento C M, Pimentel A S. Do...