文章主题:

666AI工具大全,助力做AI时代先行者!

🎉在文心一言上市之初,我有幸成为首批试用者之一,虽然初次接触时难免有些许落差。它的智能推理和创新能力似乎并未达到预期的高度。然而,经过深入的探索与连续的高强度使用,我对它的看法逐渐发生了微妙的变化。🤔尽管逻辑连贯性有待提升,但其展现出的进步和潜力不容忽视。或许,正是这种挑战与改进的过程,让文心一言的魅力得以逐步显现。🌟

前言

🎉2023年无疑是AI元年🌟:ChatGPT去年已崭露头角,但今年在国内掀起狂潮,OpenAI本月接连发布GPT-3.5-Turbo API与GPT-4,引领众多基于OpenAI的创新工具热卖。微软今日发布会再推ChatGPT整合Office,AI热度飙升至顶峰!🚀技术日新月异,AI正成为现代生活与工作的热门标签,紧跟潮流的同时,也悄然改变着我们的世界。🌍SEO优化提示:使用相关关键词如”AI元年”, “ChatGPT”, “OpenAI”, “Microsoft Office”, “AI潮流”, “技术革新”等。

🎉🚀回顾过去,我们不难发现,百度在AI领域的布局早在2021年的起点就已清晰可见。早在2019年,他们就已经引领潮流,发布了文心大模型的首个版本,开启了每年一次的新迭代之旅。然而,直到ChatGPT在国内掀起热潮,百度才以文心一言这一创新工具,正式向大众展示了其在自然语言处理领域的实力与决心。

2021 年「百度世界」上,李彦宏和撒贝宁交流百度关于 AI 的探索

「文心一言」是什么?

根据百度自己的介绍:

文心一言是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言是知识增强的大语言模型,基于飞桨深度学习平台和文心知识增强大模型,持续从海量数据和大规模知识中融合学习具备知识增强、检索增强和对话增强的技术特色。 文心一言有五大能力,文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。

🌟探索文心一言五大神力🔍,让你大开眼界!🚀1️⃣ 文思如泉🔥——超凡创造力,无论写作主题多复杂,都能瞬间激发灵感。2️⃣ 语言精准🌈——逻辑清晰,每字每句都犹如精确的坐标,直指要害。3️⃣ 知识库丰富📚——海量信息支持,满足你的任何学术需求。4️⃣ 智能纠错🔍——语法错误无处藏,让文字更专业,阅读更流畅。5️⃣ 个性化建议💡——根据内容反馈,提供个性化的修改意见,提升写作质量。试试文心一言,开启你的智慧创作之旅!🚀只需轻轻一点,体验超乎想象的智能服务。🏆记得,这里不是分享个人联系方式的地方哦!😊如果你对我们的产品有任何疑问或想要了解更多,欢迎随时咨询。💌

实际体验

01文学创作能力

在这里我选择了最能考验 AI 想象能力的科幻作品创作,并且提升了一些难度:

Prompt:请你生成一个科幻故事,以「你好,宇宙。」作为结尾的最后一句。

🌟创作一篇扣人心弦的科幻大作并非易事,在这个挑战性的Prompt里,AI需要展现出超凡的情感驾驭与主题连贯性,这无疑是个技术与创意的双重考验!🚀想要产出一个既引人入胜又充满科技魅力的故事,确实需要克服不少难关。

来看看文心一言的表现:

🌟改写版:从文心一言生成的文章内容来看,虽然并非如预期般充满科幻元素,而是偏向第三人称叙述视角。尽管它未能完全遵循Prompt,但在理解核心主题如宇宙、太空方面展现出一定的实力,具备基础的文本解析能力。🚀SEO优化提示:#文心一言# #叙事分析# #宇宙太空# #文本解析

接下来是 GPT-4 模型的表现:

GPT-4 生成的故事要明显好于文心一言生成的内容,并且准确的理解了 Prompt 的所有要求。文章中也不乏一些有意思的句子,改一改或许真的能写成一篇科幻小说。不过 GPT-4 生成的内容虽然扣题,但「你好,宇宙」与文章内容的联系还是有些勉强。

总的来说,文心一言在文学创作方面,至少是科幻作品创作方面,还远远没有达到基础的门槛,甚至都没有完全实现 Prompt 中的指令。不过文学创作方面本身就比较困难,因此也可以理解。

02商业广告能力

在这里我选择了我最熟悉的 Apple 的广告词。Apple 英文广告词一个非常常见的风格是每一句都很押韵,例如 iPad 10 的英文广告词是「Lovable. Drawable. Magical.」,但这一句在国区被翻译为「可圈可点可画心」,丧失了英文广告词的精髓。我们不妨让文心一言和 GPT-4 来试着翻译翻译 iPad 10 的广告词。

文心一言的效果:

又再次出现了老问题:生成的内容并不严格遵循 prompt 的指令。接下来看看 GPT-4 模型的能力:

可见 GPT-4 模型在这种要求的商业广告能力上也显得力不从心,看来商业广告的生成还是有很大难度。

03数理逻辑推算

为了验证 GPT-4 和文心一言的数理逻辑,我们问了两个问题。一个是初中难度纯数学问题,另一个是逻辑思维问题。

Prompt:请问一次函数 y=3x+3 与 X 轴的交点坐标是多少?

GPT-4:

看起来初中的题 GPT-4 模型来计算还是小菜一碟。但是当我们将目光放在文心一言上,就会发现他还有很大的提升空间:

至于 GPT-4 的上限,现在已经有很多人测试过,在这里不做过多赘述。

接下来是一道逻辑题:

Prompt:有一个 3L 的烧杯和一个 5L 的烧杯,如何得到 4L 水?

先看 GPT-4,完美解决,用的是最简单的方法:

可见 GPT-4 还是有一定的的逻辑能力。但接下来文心一言的生成让我有点不敢相信这是 2023 年的语言模型:

这个回答,竟一时让我不知从哪开始反驳。可见文心一言的 AI 模型目前连最基础的数字运算都还不完善。

04中文理解

这个在我最初的理解中,应该是文心一言的强势部分。毕竟 GPT-4 中的中文模型比例仅占到 0.2%。在测试他的中文理解能力上,我选取了白话文、古诗文、小说三种中文形式进行测试

白话文理解

在白话文的测试中,我就选去情侣之间经常说的一句话:

Prompt:你要是还不来,就给我等着吧!

在这句话里,「你给我等着吧」有一种略微的威胁、生气以及有些开玩笑的语气成分在。来看看 GPT-4 和文心一言对于这句话的理解能力:

在这个测试中,文心一言比我想象中的,类似于「意思是是在等待另一方」的回复要更加正确一些。但是相比于 GPT-4 模型的更加完善、全面的解释,文心一言显然只体会到了其中略微威胁、生气的情感。

古诗文理解

在这一个部分中,我选取了《茅屋为秋风所破歌》的「安得广厦千万间,大辟天下寒士俱欢颜」一句。

Prompt:「安得广厦千万间,大辟天下寒士俱欢颜」表达了什么样的情感

他们的表现分别是:

对于这种非常经典的内容,两个模型的理解都还不错,尤其是 GPT-4 要比我想象的水平好不少。

小说理解

在这个部分中,我选择用《红楼梦》这部经典名作的其中一段来让两个模型练练手:

两个模型都对于红楼梦这部分内容有最基础的理解,但是更深度的思考都很欠缺。仅仅是在概括和使用白话文总结这个段落发生的事情。

05多模态生成

多模态生成应该是文心一言相比于 ChatGPT 的优势(我们在这里暂且先不考虑 OpenAI 的 DALL·E 模型)。

在测试中,我使用了常见 Prompt 和毫无逻辑的 Prompt 两个 Prompt 让 AI 生成图像。

对于常见的 Prompt,文心一言生成的内容质量还能有最基本的保证。风格默认是写实和插画混合的风格,但是可以通过 Prompt 来改变风格。

可惜在生成过程中,还是犯了文心一言的老毛病:不严格遵循 Prompt 的要求。尤其是下面第二幅图,只画出了「一个人」,其他的要点都没有展现在图片中,这是目前文心一言一个很大的问题。

但是对于一些要求奇怪的 Prompt,比如「请你画一只爱国的猫」,他就会完全傻掉:

可见文心一言的多模态生成还有很多提升的空间。至少先让生成的画作能严格符合 Prompt 的要求吧

06记忆类学术问题

不过对于记忆类的学术问题,文心一言和 GPT-4 的效果都相当不错。一个主要的原因是这方面的训练集不像其他内容需要在中文互联网环境上收集,因此内容质量普遍比较高。

拿神经科学的题目举个例子:

GPT-4 生成内容

两个模型都正确的回答出了正确答案。我也尝试了神经科学、认知心理学方面的很多理论性的知识,两个模型的准确率都高于 90%。

总结

通过上面实际体验的截图,可以看出文心一言文字的生成质量还欠缺很多,并且多模态生成的图片也有提升的空间。但文心一言也有自己的优势,例如可以在国内网络环境下直接体验、可以生成图片等功能。

百度作为国内最早入局 AI 的企业,但最终效果不尽人意,其实也间接说明了国内互联网环境的一些遗憾,例如充斥着大幅无意义的内容。

而且,国内互联网很难提供一个合格的训练环境。例如知乎作为国内最大的问答平台,并没有提供一个反选「最佳回答」的选项,而有些知乎问题的最高赞往往是一些抖机灵的答案,给 AI 训练增加了很多难度,因此文心一言目前效果不尽如人意也不完全是百度的责任。

或许再给百度一段时间,文心一言的模型能做得更加优秀。相信文心一言也能随着迭代,克服不足,让亮点更亮。正如《离骚》中所写的:

路漫漫其修远兮,吾将上下而求索

https://sspai.com/post/78900?utm_source=wechat&utm_medium=social

作者: MarvinCui

责编:北鸮

AI时代,掌握AI大模型第一手资讯!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

扫码右边公众号,驾驭AI生产力!

Leave a Reply

Your email address will not be published. Required fields are marked *