文章主题:人工智能, 大语言模型, 文心一言, ChatGPT
近日,我国知名搜索引擎巨头百度公司发布了一款名为“文心一言”的大语言模型。尽管此产品目前仍处于测试阶段,但其强大的功能和潜力已经引起了广泛的关注。尤其是与另一热门人工智能助手ChatGPT的对比,人们对其性能的好奇心愈发浓厚。假如有一天,文心一言与ChatGPT展开一场竞技,胜负将变得非常明朗。
我们让 OpenAI 的 ChatGPT 和百度的文心一言,各自对对方进行评价。
ChatGPT 给出了这样的回答:

显然,这样的回答可不能满足想要搞事的我们,将目光转向文心一言,面对同样的问题,它的回答是:

在人工智能领域中,两位AI系统的表现令人瞩目,它们展现出了令人惊奇的友好性,这使得它们的口碑在AI圈内并不需要通过拉踩的方式来争取关注。然而,对于这样的友好回答,我们的态度并不满意。因此,我们决定采取一种更加直接的方式,让这两位AI系统展开一场“辩论”,以此来展示他们的实力和观点。
当面对人类的挑拨离间时,ChatGPT 给出的答案是:

而文心一言则表示:

面对没有感情却相互尊重的 AI,这一回合,是卑鄙人类的败北。
在探讨微软的New Bing时,我们发现它同样依赖于GPT-4技术。然而,作为一种搜索引擎,它与其他应用程序存在一定的差异。因此,我们决定向New Bing咨询,以了解它是如何回应这些问题的。
第一个问题,当然是经典的互相评价,New Bing 给出的答案是:

New Bing 的回答不是“我不能”而是“我不想”,更具情感。
当我们将New Bing与文心一言进行对比时,我们并未预料到New Bing的回答会让我们感到惊讶。然而,其给出的回答却出人意料地让我们感到震撼。

新Bing的行为令人费解,它不仅未能回答我们的问题,竟然还主动结束了这次对话。然而,在最后的测试中,我们更加深刻地体会到了情感的重要性。
在两轮对话中,我们秉持着公平公正的原则,摒弃了那些充满挑拨离间意味的提问方式。如今,三大语言模型应用都强调了“应用场景”的重要性,将其视为AI开发过程中至关重要的一个环节,它对设计、开发、部署以及优化等各个方面都产生了深远影响。ChatGPT的出现,以其“通用性”的特点,让人们开始忽视了“应用场景”的价值。换句话说,人们开始将应用场景过度解读,甚至将其推广到各个领域、各个方面,使其变得无处不在,无所不能。
在经过一系列的测试之后,我们发现对于对话质量这一方面,文心一言与ChatGPT之间的差距并不明显。然而,在情感表达方面,New Bing却呈现出一定的优势,相较于其他两者而言,其表现似乎更为出色。
不过连AI都在互相尊重,这让进行对比测试的我们人类有些自惭形秽。
在苹果推出黄色配色的iPhone时,我们邀请了两位文学巨匠——文心一言和GPT-4,分别为iPhone 14创作了一份推广文案。其中,GPT-4给出的答案是:

而文心一言给出的答案是:

虽然双方都对手机的特色和亮点进行了介绍,但GPT-4在介绍中缺乏对于手机具体配置的描述,文心一言却也有“黑色边框”这样的胡说八道。
在面对一些略带调侃的问题时,双方的表现也不尽相同。我们让GPT-4和文心一言分别给出一个用5块钱度过一周的方案,GPT-4的回答是:

文心一言的答案是:

显然,文心一言给出了更可行的方案,甚至最后还给出了像是“伸手”这样让人哭笑不得却又现实到极致的回答。而GPT-4的回答,仿佛一篇虚浮的说教。
最后,我们从网上的考试题中选择了一道数学题目,对两者的数学能力进行比较,其中GPT-4给出的回答是:

而文心一言在这方面的回答则是:

GPT-4 给出了一个疑似的分析过程,但似乎他并没有理解题干的内容,给出的答案和过程都似是而非。而文心一言这边,不仅仅没有给出准确的答案,甚至没有完整理解问题的题干。至少在处理数学问题方面,不管是GPT-4 还是文心一言,表现得都不尽如人意。
需要额外补充的是,这是一道非常经典的题目,New Bing通过搜索能力,在互联网找到了“15”这个正确答案。

仅从“整活”层面,文心一言与ChatGPT并不存在实质性的差距。在发布会上提到的多模态生成在目前还未上线,还有百度的看家本领搜索功能能不能接入文心一言也是颇具想象空间的一件事。
但至少,随着文言一心的逐步开放,对于对大部分人来说使用通用语言大模型的门槛进一步降低,不管是ChatGPT还是New Bing,想要非常顺畅的使用还是有些门槛的。
人工智能, 大语言模型, 文心一言, ChatGPT
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!