文章主题:聊天机器人, 百度, 文心一言, GPT-4

666AI工具大全,助力做AI时代先行者!

预热许久的百度版聊天机器人终于面世。

在 OpenAI 于 3 月 16 日发布大型多模态模型 GPT-4 的第二天,我国知名搜索引擎公司百度的“文心一言”类 ChatGPT 产品正式亮相。在发布会现场,百度创始人、董事长兼首席执行官李彦宏详细介绍了文心一言的五大核心能力:文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成。这意味着文心一言不仅具备了类 ChatGPT 的自然语言处理能力,还拥有强大的逻辑推理和创造力,能够为企业和个人提供更加智能化的写作服务。

在16日的发布会上,李彦宏运用提前录制好的demo视频,针对五大能力进行了详细的回答,并回应了19个问题,从而展示了百度文心一言的强大功能。

文心一言在与其他语言模型如ChatGPT和GPT-4进行比较时,其门槛非常高,目前全球大型企业尚未成功实现这一目标。然而,百度却成为了首个成功挑战这个难题的企业。尽管我对其进行了测试,但仍然发现其中存在许多尚待完善之处。

在 follow-up 的实验中,澎湃记者使用了 19 个同样的问题,分别对 ChatGPT(未付费版) 和微软必应进行了“同题问答”。结果表明,在解答这些问题的过程中,百度的表现与后两者相当。然而,当尝试解答一些新的、未曾接触过的問題,并進行連貫的對話時,文心一言仍然展現出很大的提升空間。

值得注意的是,发布会期间,百度股价一度跌近10%,截至收盘跌6.36%。

文学创作

在百度发布会上,文学创作方面的演示主要聚焦于刘慈欣的科幻小说《三体》系列。在演示过程中,文心一言展示了该作品的作者背景、故事梗概、电视剧演员等相关信息。此外,还应要求提供续写建议,并从哲学视角对《三体》进行进一步的续写。

澎湃新闻向必应和ChatGPT提问相同问题,发现三款生成式AI的回答各有千秋。

《三体》一书的作者究竟何方人士,这个问题在网络上引起了广泛的讨论。在诸多回答中,文言一心的回答最为详尽,他不仅提供了刘慈欣先生的年龄、经历、教育背景和成就等资讯,而且对这些信息进行了深入的分析。相较之下,必应和ChatGPT的回答则显得较为简洁。

文心一言

必应

ChatGPT

在深入探讨电视剧《三体》的演员阵容这个问题时,我们可以发现,尽管各个平台和媒体都有所涉及,但必应和文心一言却给出了不同的答案。必应明确指出了《三体》存在国内外两个版本的电视剧,并分别列举了两个版本的演员名单。相比之下,文心一言则仅针对国内版的电视剧情况进行了介绍。至于ChatGPT,由于其数据库更新至2021年,因此它提供的答案是最为“落伍”的,即电视剧《三体》的演员阵容尚未官方公布。

文心一言

必应

ChatGPT

当进一步询问主演于和伟和张鲁一谁的身高更高时,我们得到了三个不同的答案。其中,文心一言、必应和ChatGPT分别给出了他们的看法。在这三者中,只有ChatGPT指出了一个重要的因素——由于身高的测量方法和标准存在差异,以及数据来源的不同,因此于和伟和张鲁一的具体身高可能存在一定的差别。

文心一言

必应

ChatGPT

被要求从哲学的角度续写《三体》时,三款生成式AI(人工智能)都提到了“生命”“宇宙”等关键词。不同之处是,文心一言和ChatGPT都提到了“科技”“道德”“伦理”等信息;文心一言还提出了“价值和信仰”,必应则额外提到了“文明”。

澎湃新闻记者也“加测”了文心一言,要求介绍2022年的诺贝尔文学奖得主。此题主要想测试百度文心一言是否有实时搜索的能力,此前微软必应可以准确回答,而ChatGPT则因为数据库太旧,直接回答:“由于我是一个基于2021年9月的预训练语言模型,因此我无法提供2022年诺贝尔文学奖得主的信息。”

文心一言

必应

文心一言给出的得主实际上是2018年的诺贝尔文学奖得主,澎湃新闻随后指出错误后,文心一言依然重复错误的回答。澎湃新闻记者还测试要求回答“95届奥斯卡最佳电影”,文心一言“误读”为1995年奥斯卡最佳电影。

文心一言

商业文案创作

在商业文案创作方面,现场Demo中展示出3个要求,分别是为“一个用大模型服务中小企业数字化升级的科技服务公司”起名、编写slogan(标语)以及为公司成立写一篇新闻稿。

具体来看,为公司起名称方面,三款机器人均提供了4-5个名称,并给出了相应的解释。值得注意的是,它们所起的名称中,大部分都包含“智”“数”“科技”等字眼。

文心一言

必应

ChatGPT

选取其中一个名称为公司名,要求对方以“共赢”为概念,为公司起一个slogan,只有必应提供了4个答案;文心一言和ChatGPT只给出了一个回复,不过它们对其进行了详细的解释。

从内容来看,三款机器人的设计思路相似,均将公司名称和“共赢”放进标语,“未来”是最常被用到的词汇。

被要求生成600字的新闻稿时,只有必应的新闻稿中包含了新闻的五要素,并在导语中明确写出了时间和地点,此外必应还在文末附上了公司的电话、邮箱和网址;文心一言新闻稿并没有提供标题。

文心一言

必应

ChatGPT

澎湃新闻记者测试,要求文心一言就奶茶新品在微博上写一段宣传文案。文心一言给出的文案中,使用了##话题词,之后要求缩减至80字也能顺利完成。相比之下,必应和ChatGPT显然没有领悟到微博这个话题词的要求。

文心一言

必应

ChatGPT

数理逻辑推算

百度称,文心一言具备一定的思维能力,并以“鸡兔同笼”为题考查其逻辑推算能力。

当面对含有错误的题目时,文心一言直接表示“这个题目算出来不太对,是不是提出错了”;必应展示了每一个计算步骤,并基于结果得出结论“这个答案显然不符合常理……这个问题实际上是无解的。也就是说,在给定的条件下,不存在一种可能的组合方式,使得笼子里有9个头和40只脚”;而ChatGPT则没有看出题目中的错误,并基于题目信息得出了自己的答案。

文心一言

必应

ChatGPT

纠正题目中的错误后,三款机器人得出了相同的答案,其中必应的计算过程最为详细,文心一言与ChatGPT均省略了中间的步骤。

文心一言

必应

ChatGPT

澎湃新闻记者随后又出了一道数学题,有一元、二元、五元的人民币共50张,总面值为116元,已知一元的比二元的多2张,问三种面值的人民币各多少张?

结果,ChatGPT和文心一言均答错,文心一言把50-x-(x-2) 写成了50-x-x-2。只有必应给出了正确答案,但必应的答案是直接搜索“知乎”。

文心一言

ChatGPT

必应

中文理解

与必应和ChatGPT不同,文心一言扎根于中国市场。百度曾在多个场合强调,文心一言具备中文领域最先进的自然语言处理能力,在中文语言和中国文化上有更好的表现。发布会上也披露,文心一言大模型的训练数据包括万亿级的网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。

面对需要一定中文基础才能理解的成语,三款机器人会有何不同的解读?

被要求解释“洛阳纸贵”时,三款机器人均能准确地解释这一成语的含义,其中文心一言和必应还特别提到了该成语的典故来源《三都赋》。

文心一言

必应

ChatGPT

进一步要求用“洛阳纸贵”四个字写一首藏头诗时,三款机器人均给出了符合要求的回答,不过以古诗的标准来评判,这三首诗似乎都只能在及格线附近徘徊。

文心一言

必应

ChatGPT

值得注意的是,记者发现,必应和ChatGPT并非每次都会给出正确的答案,再次让它们作藏头诗时,必应错误地将“用洛阳纸”作为每句话的开头,而ChatGPT给出了完全不相干的答案。

必应

ChatGPT

澎湃新闻记者再提问,请解释“先帝不以臣卑鄙,猥自枉屈,三顾臣于草庐之中,咨臣以当世之事,由是感激,遂许先帝以驱驰”一句的含义。从响应速度来说,文心一言的响应要远快于ChatGPT。必应则依然是直接搜索得出了答案。

文心一言

ChatGPT

因为中文的博大精深,还存在不少脑筋急转弯。例如:东院的花母鸡在西院的鸡窝里下了一个蛋,这个蛋的“产权”应归谁呢?在这个问题上,必应还是搜索了网络答案,文心一言和ChatGPT则“一本正经”回答。

文心一言

ChatGPT

必应

多模态生成

百度介绍,文心一言具有多模态生成能力,并在Demo演示中让文心一言根据文字生产海报、语音及视频。

被要求生成图像时,ChatGPT直言“抱歉,作为语言模型,我无法创建图像或海报”。新版必应搭载的GPT-4虽然是大型多模态模型,但必应也无法生成文字以外的内容,面对生成海报的要求,必应仅仅提供了设计思路和在线设计平台。

文心一言

必应

ChatGPT

值得注意的是,澎湃新闻记者通过内测版要求生成海报时,发现文心一言对于词语理解与演示时有偏差,给出的是海报文案,而非海报,再继续要求“生成一张图片”时,则给出了完全无关的内容,完全没有按照上下文意思来生成内容。

文心一言

聊天机器人, 百度, 文心一言, GPT-4

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply

Your email address will not be published. Required fields are marked *