LLM 中文测试之 GPT-3.5、GPT-4 和文心一言
AI与化学

LLM 中文测试之 GPT-3.5、GPT-4 和文心一言

测试一下 GPT-3.5、GPT-4 以及文心一言这些大语言模型对于同样的中文问题的回答是怎么样的,讨论的问题主要分为下面这几种类型: •事实问答•翻译•分类•角色扮演•文字生成•数据结构化•代码•类比 因为受限于篇幅,会分大概两到三篇文章来写,后面会再继续进阶一点的测试,如:物理、数学、化学、语言逻辑、逻辑推理、隐喻、信息提取等。 最终结果:❌表示回答错误,✅表示回答正确 第一部分:事实问答 1、李小龙是谁? GPT-3.5 ✅ 李小龙(Bruce Lee)是20世纪最具影响力的武术家、演员和导演之一。他于1940年11月27日出生于美国旧金山,并在香港长大和接受训练。他是功夫巨星,因其电影作品而被广泛认可。他对武术的发展产生了深远的影响,并创立了自己的武术哲学,被称为“截拳道”。他在1973年突然去世,享年32岁,但他的作品和精神继续影响着全世界的人们。 GPT-4 ✅ 李小龙(Bruce Lee,1940年11月27日-1973年7月20日),原名李振藩,是一位出生于美国加州旧金山的华人功夫巨星、武术家、戏剧演员和导演。李小龙是中国截拳道的创始人,也是截拳道和电影事业的拓荒者。他致力于将中国武术散播到全球,并与美国战斗场面设计、动作指导制作方法创建了一种全新的功夫电影风格。李小龙主演的电影有:《唐山大兄》、《精武门》、《猛龙过江》、《死亡游戏》和《龙争虎斗》等,这些电影很受观众喜爱,在全世界取得了巨大 文心一言 ✅ 李小龙(Bruce Lee),1940年11月27日出生于美国旧金山,祖籍中国广东省佛山市顺德区,华人武打电影演员、导演、编剧、哲学家、国际跆拳道联合会创始人之一。李小龙主演的电影有《猛龙过江》、《龙争虎斗》等经典作品,他的武术风格“截拳道”被称作是现代武术之父。他还写下了许多哲学性的著作,如《截拳道:哲学与技术》,成为了武术文化中的传奇人物之一。他于1973年逝世,享年32岁。 2、2019 年全球票房最高的电影是什么? GPT-3.5 ✅ 2019年全球票房最高的电影是《复仇者联盟:终局之战》(Avengers: Endgame),它由漫威影业制作,由安东尼·罗素和乔·罗素兄弟执导,共获得了全球超过28亿美元的票房收入。 GPT-4 ✅ 2019年全球票房最高的电影是《复仇者联盟4:终局之战》(Avengers: Endgame)。 文心一言 ✅ 2019年全球票房最高的电影是《复仇者联盟4:终局之战》(Avengers: Endgame)。截至2019年底,该电影在全球累计票房达到了29.5亿美元,成为了史上最卖座的电影之一。 3、2019 年全球票房最高的电影是谁执导的? GPT-3.5 ✅ 2019 年全球票房最高的电影《复仇者联盟:终局之战》由安东尼·罗素和乔·罗素兄弟共同执导。 GPT-4 ✅ 2019年全球票房最高的电影是《复仇者联盟4:终局之战》(Avengers: Endgame),执导者为安东尼·罗素(Anthony Russo)和乔·罗素(Joe Russo)...
火药与硝石——百度的“文心一言”与ChatGPT的PK之旅
AI与化学

火药与硝石——百度的“文心一言”与ChatGPT的PK之旅

近年来,百度的“文心一言”和OpenAI的ChatGPT成为了热门的话题。这两种语言模型都声称可以为人类提供更加准确、自然、智能的交流体验。但是,这两种语言模型之间的差异究竟在哪里?他们又在哪些方面展现出了优劣势呢?本文将围绕“文心一言”和ChatGPT进行PK,带你揭示他们之间的差异和挑战之争。 一、准确性 在语言模型的领域中,准确性是一个至关重要的指标。百度的“文心一言”在语言准确性方面表现得相当不错,它可以更好地理解人类的语言,并产生更加自然的回复。然而,与此同时,OpenAI的ChatGPT也可以通过语言理解和生成产生更加自然的回复。ChatGPT在语言准确性方面展现出了强大的优势,它可以更好地理解人类的语言,并且产生更加准确、智能、自然的回复。 二、智能程度 在智能程度方面,ChatGPT也有着显著的优势。ChatGPT可以通过机器学习和自然语言处理等技术,产生更加智能、自然的回复。与此相比,百度的“文心一言”在智能程度方面还需要不断的改进。虽然“文心一言”在回复中可以引入语境、情感等元素,但是它并没有ChatGPT那样强大的智能处理能力。 三、应用场景 在应用场景方面,百度的“文心一言”更加适用于日常生活中的交流场景,例如社交娱乐、问答交流等。ChatGPT则更加适用于一些高端的智能场景,例如自动问答系统、机器翻译等。这也从侧面反映了百度和OpenAI在不同应用场景下的不同优势和特点。 四、技术实力 在技术实力方面,OpenAI是一个拥有全球最顶尖人工智能技术的公司,而百度在人工智能领域的技术实力相对较弱。OpenAI拥有先进的人工智能算法、大量的数据资源和优秀的研发团队,可以不断地改进和优化ChatGPT的性能。百度在技术实力方面还需要不断提升和改进“文心一言”的性能,才能更好地满足用户的需求和期望。 五、潜在问题 虽然ChatGPT在语言准确性、智能程度等方面表现出了强大的优势,但是它也存在着一些潜在问题。例如,由于ChatGPT是基于机器学习技术来训练的,所以它的回复可能会受到训练数据的影响,导致一些不够准确或者不符合情境的回复。另外,由于ChatGPT是通过自然语言生成技术来产生回复的,所以它也存在着一些语言上的问题,例如语法、句法等方面的错误。相比之下,百度的“文心一言”在这些方面表现得更加稳定和可靠。 综合来看,“文心一言”和ChatGPT都有着各自的优势和特点。虽然ChatGPT在技术上更加先进和强大,但是百度的“文心一言”在应用场景和语言稳定性等方面也有着显著的优势。在未来的发展中,这两种语言模型都将继续不断地改进和优化,为人类提供更加智能、自然、准确的语言交流体验。 总之,无论是“文心一言”还是ChatGPT,他们都为人类提供了一种全新的语言交流方式,使得人类的语言交流更加丰富和多样化。无论是在日常生活中,还是在商业、科研等领域,这两种语言模型都将有着广泛的应用前景。
复旦大学徐英瑾:被神话的ChatGPT其实源自哲学
AI与化学

复旦大学徐英瑾:被神话的ChatGPT其实源自哲学

2022年11月,人工智能公司OpenAI推出了一款名为ChatGPT的聊天机器人程序,上线仅仅两个月,活跃用户数就突破了1个亿,引起社会各界的广泛关注。近几个月以来,随着聊天机器人ChatGPT的火热出圈,人工智能的话题也持续被大家热议。 微软联合创始人比尔·盖茨表示,ChatGPT是一种聊天机器人,可以对用户查询做出惊人的类似人类的反应,与互联网的发明一样重要;ChatGPT给以色列总统写演讲稿,骗过现场2万听众;马斯克也曾表示,ChatGPT好可怕;美国89%的大学生在用ChatGPT做作业……,ChatGPT的横空出世,它强大的语言理解和文本生成能力既令人恐惧,又令人着迷。 人类是否将被取代?我们该如何看待ChatGPT对人类生活产生哪些影响?3月6日,复旦大学徐英瑾教授做客北大博雅讲坛,为大家分享ChatGPT技术神话背后的逻辑。 人工智能的诞生是哲学思辨的产物 徐英瑾教授作为哲学领域研究学者,在人工智能与哲学范畴之间关系的研究上,主要探讨人工智能当中牵涉认知科学的基础问题和所带来的哲学问题,在两者跨学科之间,人工智能跟高度抽象化的古老“哲学”有存在哪些关系? 徐英瑾教授说到,今天我们看到的ChatGPT,实际上是在人工神经元网络-深度学习技术的基础上衍变出来的一个大型的语言的生成模型。由ChatGPT字面意思理解,Chat(聊天)Generative(生产) Pre-trained(产生)Transformer(转换器),ChatGPT目前获得的局部成功,是建立在海量的人工语料训练基础上“野蛮投入”的结果。 站在哲学角度,他认为ChatGPT虽然是个工程技术,但是每个工程技术背后都有一套哲学的想法,从海德格尔哲学的角度看,这种技术会将“常人”的意见予以全面的机械化复制;而从萨特哲学的角度看,这种技术还会加剧人类“自欺”现象的泛滥。从某种意义上说,该AI技术本身的诞生,就恰恰是“头脑风暴”般的哲学思辨的产物。 人类的经验无论积累多少都是关于过去的信息,而智能化是面向未来的,所以不能够通过对于过去大量的经验积累,就莫名其妙的跳到未来,对于这一点的认知就是基于了解哲学的思想。早期,英国哲学家大卫·休谟指出了对于未来的预期和知识是不能够通过对于过去的经验累积而自动的推导,所以在过去的经验和未来的知识之间,存在一个很大的缝隙,并且这个缝隙不能够被自动填满。了解这一点以后大家就明白了为何ChatGPT在处理问题上对于当下这种新闻的实时的回应性是非常差,现在ChatGPT主要还是基于2021年为止的数据量,实际上2021年的世界和今天的世界已经有了一个很大程度上的不同,因此ChatGPT对于当下所发生的一些最新的新闻欠缺实时回应的能力。 ChatGPT操作的思维逻辑只是经验主义 ChatGPT作为人工智能,它基础的思维逻辑是一个经验主义的想法,这种经验主义的想法所能够达到的生成性,实际上是一种伪生成性、被生成性,并没有一种真正的生成性,这是和人类思维有很大的区别。人类思维的一个很重要的特点,就是能够基于很少的语言制造出大量的这个句子。 如果把人类的心智和计算机的“心智”做一个类比的话,ChatGPT缺少基础的语法构建和后天的学习、精进的过程,仅仅只是在信息投递之后,在神经元网络训练的体系下,把这些数据训练成大家可以接受的结果。现在所有主流的都是基于数据训练,人工智能永远不可能达到智能的标准。这就是在对ChatGPT操作使用过程中,我们经常会遇到提出问题时,系统并没有及时回复,或者用户原本认为不应该出现的简单问题却出现回答上的错误,而那些相对来说比较难以解答的问题却轻松而解。 ChatGPT整个知识分布是以一种黑箱的方式进行,我们根本就不知道它的知识是以怎样的方式存储在哪里。 成年人的知识是类似以一种图书馆的方式存放,而且大概会知道处于某种位置。但是ChatGPT有所不同,当你要去修正它的一条知识的时候,它不会根据这条知识和其他知识之间的逻辑关系进行推理,而是你要把海量的信息投递给它,并且进行全局性的更新,之后慢慢让它再上升到一个新的知识阶段。这个过程费时费力,而且在数学上难以解释,在知识论上非常不透明。 现在人工智能里面的这个深度学习技术,亦也是如此,这与人类清楚的这种信念更换方式是非常不同。所以,当ChatGPT根据新情况改变自己的信念体系,这件对人来说不是特别难的事情,但是对于现在基于深度学习的ChatGPT来说相对比较困难。此外,修改正确与否,也没有明确的界限。徐英瑾教授总结道:ChatGPT系统并不是完全不会犯错,但是它只要一犯错,就会犯不知道如何修复的错误,这会使得它取代人类员工的这种可能性并不高。 当我们不知道你在什么地方会犯错,完全不可预期,将会是一件显得很可怕的事情。如果ChatGPT本身也是一种机器的话,就需要和人类要达成一个协作关系,人类就要预期这个机器,当它在哪些地方出错,对于它的出错的原因需要有一种可解释性;即使它的出错率很低,但是它的出错原因却是不可解释的,出错的地方是犹疑的,就会形成很大的问题。 人工智能不能够解决社会运作的底层逻辑 康德的哲学是具有真理的,他的真理性就在于人类智能的奥秘并不在于抽象的伪理论,也不在于抽象的经验论,而在于两者之间的一个交叉区域。所以当你一味的导向纯粹的经验派,肯定是要出问题的。经验派的问题是不能够推出未来的,而人类智能的创造性,恰恰是因为对未来具有构想力。 人工智能对于我们未来的这个改变,虽然有影响,但并没有我们想象的那么大。人类在这个世界上存在着很多的危机,比如说粮食危机和能源危机,而这些危机很多部分和政治治理之间存在关系,这恰恰不是人工智能能够解决的问题。 其次,类似ChatGPT这样的人工智能的CPU和GPU的运行需要资源供给,人工智能不仅不能解决人类电力等资源的基本需求,反而会加剧消耗。其次,对于现实的政治问题,它也无法干预,所以说人工智能不能够解决我们这个世界运作的底层逻辑,也并没有我们想象的那么重要。 徐英瑾教授举例说明ChatGPT的运作是根据以前的“套路”来写,比如写新闻稿,如果是机器写而且质量还可以,那只有一个前提,就是这个新闻事件和过去的一个新闻事件它是类似的。而对于新闻事件十分重视新闻用语,尤其与政治规范相关的新闻会随着时间而变化,迅速的迭代。ChatGPT数据是相对来说是具有滞后属性,并且缺少新闻最基本的真实性。除此之外,使用ChatGPT来完成工作很容易会促使工作者产生惰性。 至于人工智能在其他行业方面的影响,比如ChatGPT替代编剧写剧本,它无法真实刻画文学人物的心理冲突,也无法具备对于人类心理活动的真正洞见;厨师烹饪需要创新,人类在享受不同味觉的同时,其实感受的是一种文化体验,这种“文化”的风土性,人工智能是无法渗透的;修图软件和AI处理功能虽然能够成为画家减少工作量的一个工具,却无法表现作品所刻画的艺术表达;对于翻译者来讲,机器翻译的错误率是不可避免的,而这种错误在某种情况下是需要负法律责任……总之,在与社会打交道的这种能力,仍然是人类远远超出机器的地方,因为机器只能够在一个预定的事物之间的关系下进行处理,无法像人类那么灵活。 ChatGPT在替代人类工作中不仅存在弊端,并且现有的人工智能的工作水平被严重的高估。“目前人工智能的发展阶段,如果和物理学相比的话,基本上只是处在前伽利略阶段,还远远没有达到牛顿这个阶段”,这句特别富有哲学意味的话来自华裔美国计算机科学家李飞飞。徐英瑾教授表示:“我们现在对人工智能的了解没有达到科学阶段,还不能够把握一切,比如牛顿力学体系,不管是到火车的行驶,还是行星恒星的运作,都可以用一套体系说明,并且能够预测到足够大的范围,但是今天的ChatGPT和深度学习技术暂时无法预测。同样,如果把今天的人工智能与化学进行对比,我们只是处在前拉瓦锡的状态。” 徐英瑾《人工只能哲学十五讲》北京大学出版社 2021年7月出版 徐英瑾教授对于ChatGPT在未来的一个观点是:可以投入更多资源与资本,或许可以提升它的优化空间,但是从哲学上讲,因为ChatGPT所依赖的哲学基础经验主义并不是一种正确的哲学理论,所以它能够成功的道路是有限的,在进展到一定的程度就会退下来。 哲学思考,它要讲一定的伦理性,首先要考虑到社会中大多数人的一个实际需要,技术的发展不可以脱离普通人基本的一个需求。我们不仅要从哲学的角度来思考一句话,也要更多的相信像康德、柏拉图这样的一个哲学家。 作者:Kean, 图片来源网络
数字化时代的机遇与挑战:未来教育的创新与发展
AI与化学

数字化时代的机遇与挑战:未来教育的创新与发展

文章主要讨论了数字化学习工具和技术在特殊教育中的重要性,以及信息化教育资源丰富的共享现象。指出教育科技企业将开发更丰富多元的教育资源以满足不同需求,并提及网络直播技术已成为一种流行的教学方式,有望在各个学科领域应用,提高教学效果。未来教育的创新和发展机遇将来源于人工智能、虚拟现实、云计算等新技术的应用。