文章主题:百度, 大语言模型, 文心一言, 人工智能
近日,我国知名搜索引擎巨头百度公司发布了一款名为“文心一言”的大语言模型。尽管此产品目前仍处于测试阶段,但其强大的功能和潜力已经引起了广泛的关注。尤其是与另一热门人工智能助手ChatGPT的对比,人们对其性能的好奇心愈发浓厚。假如有一天,文心一言与ChatGPT展开一场竞技,胜负将变得非常明朗。
我们让 OpenAI 的 ChatGPT 和百度的文心一言,各自对对方进行评价。
ChatGPT 给出了这样的回答:
显然,这样的回答可不能满足想要搞事的我们,将目光转向文心一言,面对同样的问题,它的回答是:
在人工智能领域中,两位AI系统的表现令人瞩目,它们展现出了令人惊讶的友好性,这使得它们的口碑在AI圈内并不好。然而,对于这些过于友好的回答,我们并不感到满意。因此,我们决定采取一种更加直接的方式,让这两位AI系统进行一场“辩论”,以此来展示他们的实力和能力。
当面对人类的挑拨离间时,ChatGPT 给出的答案是:
而文心一言则表示:
面对没有感情却相互尊重的 AI,这一回合,是卑鄙人类的败北。
在探讨微软的New Bing时,我们发现它同样依赖于GPT-4技术。然而,作为一种搜索引擎,它与其他应用程序存在一定的差异。因此,我们决定向New Bing咨询,以了解它是如何回应这些问题的。
第一个问题,当然是经典的互相评价,New Bing 给出的答案是:
New Bing 的回答不是 ” 我不能 ” 而是 ” 我不想 “,更具情感。
当我们将New Bing与文心一言进行对比时,我们并未预料到New Bing的回答会让我们感到惊讶。然而,其给出的回答却出人意料地让我们感到震撼。
新Bing的行为令人费解,它不仅未能回答我们的疑问,竟然还主动结束了此次对话。然而,在最后的测试中,我们更加深刻地体会到了情感的重要性。
在两轮对话之后,我们已经摒弃了挑起争端的不友善方式。所有三个大型语言模型的应用都强调了”应用场景”,这是AI开发过程中必须考虑的步骤,它直接影响着设计、开发、部署和优化等各个方面。随着ChatGPT的出现,其”通用性”特点使得人们开始忽视”应用场景”的重要性,甚至将其无限扩大到各行各业、各个方面,似乎无所不能。
经过这次的测试,我们无法从对话质量上看出文心一言和 ChatGPT 有多么大的差距,带有情绪的 New Bing 反而感觉略胜一筹。
不过连 AI 都在互相尊重,这让进行对比测试的我们人类有些自惭形秽。
恰逢苹果的黄色配色 iPhone 发布,我们又分别让文心一言和 GPT-4 为 iPhone 14 写了一篇推广文案。其中 GPT-4 的回答是:
而文心一言给出的答案是:
虽然双方都对手机的特色和亮点进行了介绍,但 GPT-4 在介绍中缺乏对于手机具体配置的描述,文心一言却也有 ” 黑色边框 ” 这样的胡说八道。
在面对一些略带调侃的问题时,双方的表现也不尽相同。我们让 GPT-4 和文心一言分别给出一个用 5 块钱度过一周的方案,GPT-4 的回答是:
文心一言的答案是:
显然,文心一言给出了更可行的方案,甚至最后还给出了像是 ” 伸手 ” 这样让人哭笑不得却又现实到极致的回答。而 GPT-4 的回答,仿佛一篇虚浮的说教。
最后,我们从网上的考试题中选择了一道数学题目,对两者的数学能力进行比较,其中 GPT-4 给出的回答是:
而文心一言在这方面的回答则是:
GPT-4 给出了一个疑似的分析过程,但似乎他并没有理解题干的内容,给出的答案和过程都似是而非。而文心一言这边,不仅仅没有给出准确的答案,甚至没有完整理解问题的题干。至少在处理数学问题方面,不管是 GPT-4 还是文心一言,表现得都不尽如人意。
需要额外补充的是,这是一道非常经典的题目,New Bing 通过搜索能力,在互联网找到了 “15” 这个正确答案。
仅从 ” 整活 ” 层面,文心一言与 ChatGPT 并不存在实质性的差距。在发布会上提到的多模态生成在目前还未上线,还有百度的看家本领搜索功能能不能接入文心一言也是颇具想象空间的一件事。
但至少,随着文言一心的逐步开放,对于对大部分人来说使用通用语言大模型的门槛进一步降低,不管是 ChatGPT 还是 New Bing,想要非常顺畅的使用还是有些门槛的。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!