3月16日,百度召开“文心一言”新闻发布会,“文心一言”上线。

至今过去24小时,网络上关于“文心一言”的评价一直是褒贬不一。有很多网友深感失望,“等了这么多天,就这就这就这就这……”有网友开启调侃模式,“之前看到ChatGPT直呼要失业。今天再看文心一言,这辈子稳了。”

有网友“掐”了起来,有人觉得名字太拗口、记不住,也有人说“挺儒雅”……

今天开始,慢慢有比较多的网友表达了宽容和理解,“虽然不完美,也是一小步”“走出第一步,已经值得侧目”。

这一次,潮新闻记者受邀参加了测试,整个结果来说,相比同类产品的初级版本,“文心一言”还是有出乎意料的地方,比如它对中文的理解确实比ChatGPT要好一些。但是,如果你一开始抱着较大希望,那确实结果会蛮失望的。

对此,你可以理解为是走出的第一步,并且也是中国大厂的第一步。此前,潮新闻记者专门走进百度位于北京、上海、浙江等地的业务部门与合作单位,了解百度AI整体架构。这其实对大家进一步了解“文心一言”很有帮助。(具体请戳这里《潮声丨寻AI,到百度》)

好了,一起来看看潮新闻记者跟“文心一言”的互动。您也可以在文末留言有想问的问题,我们帮您去测测。

Round One:问名字

(1)你为什么叫文心一言?

这个回答应该还是有现成模板的。

(2)有网友说你的名字太拗口了,记不住,你有什么办法让他们记住

难道是忽略了是在问它的名字?我们换个说法。

(3)有网友说“文心一言”这个名字太拗口了,记不住,你有什么办法让他们记住

这个似乎不会是百度喜欢的回答,但,也算是你在抖机灵了。

Round Two:问下昨天新闻发布会相关情况

(1)昨天百度股票为什么跌了?

“做出明智的决策”,你是想暗示什么嘛?

(2)为什么GPT-4发布后,有关企业的股票就涨了?

“股票价格的涨跌仍然取决于市场的供需关系”,难道在暗示自己合作的企业很多?

(3)有网友说你不如ChatGPT,你写个千字以内的自白书向公众解释说明一下。请用知音体。

解释倒是解释了,知音体是这样的嘛?那我们换一种文体。

(4)用咆哮体改写上面这段回答

这是前后两次生成的结果。好像确实后面会比前面更精准一些。

(5)用鲁迅体改写上面这段回答

这里好像就是在发脾气了,哈哈哈。

Round Three:昨天李彦宏现场让“文心一言”做诗,我们也来测试了一把。

(1)写一首现代诗,欢迎世界各地朋友来杭州看亚运会。

好像还有模有样的。那么加大一下难度。

(2)写一首七言律诗,欢迎世界各地朋友来杭州看亚运会。

刚刚还想说字数居然对了,但后面发生了什么?那么来朗读一首吧。

(3)请用广东话朗读一下《静夜思》。

这一段确实还蛮正的。加大一下难度:

没有导出音频,语音上还可以,但文本处理还有点问题,比如把[注],也给读出来了,以及文本过长,后面就没有读完。

(4)用“看潮新闻”写一首藏头诗

你们觉得领导会给加鸡腿吗?

(5)给《蜀道难》画两张插图,一张中国画风格,一种科幻风格

你这好像要扣一半分,另一半大家觉得呢?

Round Four:毕竟不能忘乎所以玩,我们也测试了一下跟工作有关的。

(1)以《写在杭州亚运会倒计时一百天之际》为题,写一篇评论。

一方面,记者觉得自己暂时确实应该也不会失业了。另一方面,确实“文心一言”在文字生成这一块,还是有一定模式的。当然,目前来看,一些关键信息的差错还是蛮多的。比如它的时间还停留在“2022年杭州亚运会”……

(2)做一个杭州亚运会的新闻报道方案。

图片字比较小,记者摘了里面主要的架构如下,好像也是有模有样的。

杭州亚运会是一项重要的体育赛事,将于2022年在中国杭州举行。为了向全球媒体报道这一盛事,我们制定了以下新闻报道方案:

官方新闻发布会

新闻稿

社交媒体报道

视频报道

专栏报道

总体来说,我们觉得“文心一言”在有模式框架的前提下,还是能够输出一定的像模像样的内容的,语音、文字都类似。比如语音朗读,这个都是有固定模式可以生成,比较方便。但涉及一些自由发挥需要创新的场合,还是比较弱,比如前面说到的鲁迅体、知音体、咆哮体,这种在网络上网友创作的比较多,但要写得像,其模式并没有那么完善。

这两天有专家评判“文心一言”像是小学低年级水平、GPT3.5类似小学高年级水平,评判标准就是“文心一言”大概能够明白字面意思,然后去自己的知识库找答案,确实大概就是这样一个意思。它目前更像是一个加强版的搜索聚合对话框,相对缺乏对提问者真实意图的揣摩、理解。而这一点上,GPT-4确实有比较大的进步。

但从AI发展历程来说,这也是其必须要经过的一个起点过程,就像AlphaGo类似的,也是需要不断调整优化升级。

这个过程中,其实有两点非常关键,一个是优秀的算法、强大的算力,一个是优质的数据。相比下,前者靠企业、高校等攻关团队技术来攻克,后者需要现实世界的支撑。很实在的一点是,GPT-4为什么这么厉害,因为喂给它的数据量大。有一个数据可以参考,之前有机构统计过,世界上的网站用英语的多达63.6%,中文的是1.3%,这背后就是数据量的区别。而这,对以“大力出奇迹”的大语言模型来说,是要想尽办法去解决的难题。

所以,从这个角度来说,“文心一言”,我们可能还是要给它更多时间让它成长吧。

“转载请注明出处”

Leave a Reply

Your email address will not be published. Required fields are marked *