文心一言再起,百度引领人工智能新潮
AI与数学

文心一言再起,百度引领人工智能新潮

近日,百度“文心一言”推出新功能,引发业界关注。这一功能旨在利用人工智能技术为用户提供个性化文学创作建议,将人工智能与文学创作结合,进一步推动了人工智能在文学领域的应用。“文心一言”是百度全新一代知识增强大语言模型,具备文学创作、文学评价等能力,其新推出的个性化文学创作建议功能,通过分析用户输入的关键词和内容,为用户提供适合的文学风格、故事类型等创作建议,使用户能够更快速地创作出满意的作品。这一功能的推出,标志着我国人工智能在文学创作领域迈出了重要一步。总的来说,百度“文心一言”新功能的推出,不仅展现了人工智能技术的进步,也为文学创作带来了新的可能,对于推动我国文学创作的发展具有重要意义。
AI挑战高考作文,文心一言 VS ChatGPT,谁能更胜一筹?
AI与数学

AI挑战高考作文,文心一言 VS ChatGPT,谁能更胜一筹?

道路千万条,套路第一条 这届高考,应该是过去五年来,最特殊的一次。因为多了一个新角色——AI考生。 第一天的语文考试刚结束,全网就掀起AI作文大赛。ChatGPT、文心一言、通义千问等AI大模型,被人们拿来写高考作文。几秒钟就能生成一篇,不仅速度惊人、逻辑严密,还能引经据典。 乍一看,AI大模型写作文,简直太轻松,似乎对人类构成降维打击。毕竟,论知识储备量,没有人可以跟AI比。AI把整个互联网上的资料都学习消化了,然后模仿人类的表达方式,用自己的逻辑输出。 但是,如果我们仔细分析AI考生的“答卷”,会发现AI并没有很多人想象的那样无所不能。AI大模型普遍存在的套路化写作、不会数数、胡说八道等问题,也在作文中出现。 事实上,按照高考作文的评分标准,AI生成的作文都存在某些方面的局限。战胜人类,目前还不现实。 深AI用高考作文测试了三款AI大模型——ChatGPT(OpenAI)、文心一言(百度)、通义千问(阿里),发现了一些有趣的结论。 比如,AI不会数数,文心一言、通义千问的作文都没有达到“不少于800字”的硬性要求;一本正经胡说八道的毛病还没改,为了凑字数可以车轱辘话来回说;AI写作文基本离不开套路,一个模板反复套用。 以下是详细内容,欢迎讨论。 01 一个没有感情的答题机器 今年高考全国甲卷的作文主题是“人·技术·时间”,要求以“人们因技术发展得以更好地掌控时间,但也有人因此成了时间的仆人”这句话展开,写自己的联想与思考。 我们先看一下教育部教育考试院发布的《试题解析》:考察逻辑思维和思辨能力。 划重点:引导考生深入思考信息时代理性分析和审慎判断的重要性。这是考察的一大内核。 深AI测试了三个大模型发现,它们都没有抓住这个内核——东拉西扯说一通,啥都说了但其实啥也没说。 先看ChatGPT的作文: 再看文心一言的: 最后看通义千问的: 这三篇作文,堪称顶级“端水大师”,围绕主题正反来回说,就是没有把“批判性思维”这个点说透。只有文心一言明确提到了“深入思考和批判性思维的培养”。 通义千问的作文是最空洞的。它把重点放在了“时间管理”上,偏离了主题,而且论述的道理也是人人皆知的常识。另外,通义千问的作文没有标题,扣分。 我们再用新课标I卷的作文试题“故事的力量”,看看三家的表现。 这篇作文要求根据以下这段话,写自己的联想和思考:好的故事,可以帮我们更好地表达和沟通,可以触动心灵、启迪智慧;好的故事,可以改变一个人的命运,可以展现一个民族的形象……故事是有力量的。 ChatGPT的作文: 文心一言的: 通义千问的: 不得不说,除了通义千问的作文相对平淡,其他两篇的表述方式、行文逻辑,尤其是用词还是可圈可点的。尤其是文心一言用场景化的开场方式,让人眼前一亮。 不过问题也是显而易见的——同一个事情用不同的话术翻来覆去说,导致全文读下来,给人一种“你说的我都知道”的感觉。 一个没有感情的答题机器,这是很多人的评价。 “内容空洞,车轱辘变着来回说。”有人评价。还有人说:“全是没营养没内涵的大白话。” 我们不妨拆解一下文心一言的这篇作文,就会知道什么是“车轱辘话”。 文中标黄、标绿的部分,都是完全相同的意思,甚至可以说是相同的话术,在文中反复出现。在文末“总结来说”标蓝的一整段,则是把文中的观点和话术,搞了个大杂烩。 这给人一种凑字数的即视感。 深AI更改提示词,让ChatGPT想象自己是一个在高考现场的考生,并再次写一篇作文,它上来第一句话就是“当我坐在这个考试的座位上时,我的手中拿着一只先进的电子笔……” 这样参加考试,估计会被判违规,直接零分。 没有灵魂,是AI作文最大的减分项。 02 套路,全是套路 为了让作文看起来像那么回事,AI用了很多套路。 它们很喜欢用“首先、其次、然后、最后”的句式。最典型的是ChatGPT,最后一段一定会是“总的来说……” 比如ChatGPT的这两篇作文: 文心一言、通义千问也有相似的套路。前面一顿输出猛如虎,最后一定用“总而言之”“总的来说”结尾。 这就跟弹吉他一样,只要掌握了万能和弦公式(比如万能的卡农进行),就能弹出上百首曲子。 甚至于,我们让文心一言给自己写的作文打分,它也是“首先、其次、此外、综上……”一顿长篇大论。 而在“人·技术·时间”的作文题中,ChatGPT和通义千问居然用了几乎完全相同的表述:用“那么”提出一个问题,用“首先、其次、最后”展开具体论述。框架和逻辑像是一个模子里刻出来的。 尽管如此,文心一言非常自信地给自己的高考作文打出了90分的高分(假设满分100分),还自我评价“值得肯定”。我们把它的作文丢给ChatGPT,ChatGPT竟然毫不吝啬地给出了100分的满分…… AI大模型就像工业流水线,批量生产作文。但本质上,无论它说出来的话多么像人话,驱动的技术都是数学和统计,而非意识。...
ChatGPT、文心一言、通义千问、讯飞星火做高考数学题,看谁的表现更好?
AI与数学

ChatGPT、文心一言、通义千问、讯飞星火做高考数学题,看谁的表现更好?

作者|杨文 袁博 编辑|六耳 来源|AI先锋官 高考已经接近尾声,小编先预祝各位考生金榜题名,前程似锦。此次高考不仅是各位考生们的大考,也是各家AI大模型之间的暗中较量。 之前小编也让文心一言、讯飞星火、GPT-4秀了一把作文能力。同时,我们也非常好奇它们的数学能力到底如何? 我们在今年的高考数学I卷中共挑选了13道题(其中选择题8道、填空题2道、解答题3道),共计84分。我们分别测试了GPT-4、通义千问、文心一言、讯飞星火四个大模型,其中GPT-4得分最高为36分,讯飞星火得分最低为19分。按百分制分别为43、35、26、23分。 一、选择题 测试题目:单选题5道、多选题3道。 [ 上下滑动查看更多 ] 选择题得分:GPT-4:19分;文心一言:22分;通义千问:29分;讯飞星火:9分。 答题过程描述:在解答选择题的时候,四个大模型表现都较其它题型要好。其中,通义千问答对了全部5个单选题,不过每道题都回答了4到5遍左右。这不禁让小编怀疑它答题也是靠“蒙”?文心一言在解答前两道选择题时,都是一遍对。 然而,讯飞星火表现的表现就有点掉链子。即便小编把答案告诉它,它依旧坚持选择错误答案,一副死犟死犟的范儿。 二、填空题 测试题目:2道 填空题得分:GPT-4:5分;文心一言:0分;通义千问:0分;讯飞星火:5分。 答题过程描述:在填空题方面,四个大模型表现都比较一般。GPT-4、讯飞星火得分相对较高。文心一言、通义千问得了一个零蛋。 在通义千问答题过程中,小编发现它还很固执。比如,在解答第13题时,我们让它做了不下10遍,无一次正确。甚至,通义千问还表示:“并不想考虑每类至少选修1门的限制”,这种“犟”劲儿有点让人哭笑不得。 三、解答题 测试题目:3道 得分:GPT-4:12分、文心一言:0分、通义千问:0分、讯飞星火:5分。 答题过程描述:在解答题方面,四个大模型的表现都很一般,出现胡编乱造的情况,甚至一度让自己陷入死循环。 相对而言,GPT-4更胜一筹,基本上能答一道大题中的一个小题。讯飞星火次之。文心一言、通义千问则全军覆没,全部答错。  .END. 扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。
2023数博会special:JackJ.Dongarra教授谈高性能计算与人工智能的未来
AI与数学

2023数博会special:JackJ.Dongarra教授谈高性能计算与人工智能的未来

本文介绍了美国田纳西大学电气工程和计算机科学系教授杰克唐加拉(Jack J. Dongarra),身为双院士以及2021年图灵奖获得者,其在高性能计算领域有着开创性的贡献。唐加拉教授参与了2023年的贵阳中国国际大数据产业博览会,并将就高性能计算和大数据 topics发表主旨演讲。