文章主题:科大讯飞, 认知大模型, 通用人工智能, 跨领域能力
内容来源: 本文来自“讯飞星火认知大模型”成果发布会。 轮值主编 | 智勇 责编 | 青羊 第 7412 篇深度好文:2219 字 | 6 分钟阅读
AI
笔记君说:
今日科大讯飞召开“讯飞星火认知大模型”成果发布会。
科大讯飞董事长刘庆峰、科大讯飞研究院院长刘聪,从文本生成、语言理解、知识问答、数学能力、逻辑推理、代码生成、多模态输入及生成7个维度演示了大模型的通用能力,以及认知大模型与讯飞现有产品结合的商业应用成果。
国内认知大模型的最高水平是什么样?一起来看看。
一、认知大模型的七个能力维度
自从去年11月OpenAI推出ChatGPT以来,认知大模型技术在全球掀起了人工智能的全新浪潮,认知大模型的出现不亚于PC或者互联网的诞生。
在统一大模型的训练之后,系统能够效仿人类的广泛知识掌握能力,实现跨领域的卓越表现。这标志着认知大模型已实质性推动通用人工智能的发展,犹如星火燎原,预示着无限可能。
目前,国内通用大模型的水平如何?
我们无法确定,然而讯飞的大规模认知模型已经拥有了七项通用技能,能够在教育、办公、汽车和数字员工等多个领域得到实际应用。此外,在文本生成、知识解答以及数学技能方面,该模型已经超越了ChatGPT的表现。
1.长文本生成能力
刘聪现场用星火认知大模型生成了一段欢迎词,展示了大模型的文本生成能力。
为了测试不同文本类型的生成能力,刘聪还让星火认知大模型生成了邮件、故事、中英品宣文案等文字内容。
认知大模型,生成了一段孙悟空和奥特曼的故事,还使用语音朗读了这段现场生成的小故事。
所有 generated content 都由大模型随机生成,即使是相同的关键词和描述,每次生成的内容也会有所不同。目前,星火认知大模型在中文文本生成领域的能力已经超过了 ChatGPT,其在英文方面的表现也相当不错,获得了 4.29 分的高分,相比之下,ChatGPT 在英文方面的得分更高,为 4.48 分。
2.语言理解能力
科大讯飞通过两个例子,演示了大模型在语法检查和语义理解上的成果。
在遇到包含单词拼写错误、单复数错误以及时态错误等英文段落时,星火认知大模型迅速地纠正了所有的错误,生成了修正后的文本。
在验证大模型对语义理解的掌握程度时,刘庆峰先生利用了“俗语说男子汉大丈夫宁死不屈,但俗语又说男子汉大丈夫能屈能伸”这一经典案例来进行测试。这个案例旨在检验大模型是否能够正确地理解这两句话所蕴含的深层含义。
此外,对同一句话在不同语境中的不同理解,大模型也给出了准确的回答。
3.知识问答
大模型的知识问答能力涵盖了诸多领域,其中包括生活常识、科学知识、工作技巧以及医学知识等等。举例来说,在医疗领域,大模型不仅能够成为医生的得力助手,同时还能够成为我们每个人生活中的健康助手,为我们提供全方位的健康咨询和服务。
在中国科学院的倾力支持下,我国的大模型将不断丰富其知识体系,引入更多的科普内容,以此提升其在科学问答领域的专业素养。
4.逻辑推理
为了测试星火大模型是否真的可以理解人类提问,刘庆峰通过常识理解和故事编辑两种方式进行了演示。
在我们的现场提问中,大模型被要求回答:“孔子在2008年奥运会上发表了什么讲话?”然而,大模型基于其对历史和常识的深入理解,轻易地得出了一个令人惊讶的结论——孔子不可能出现在2008年的奥运会现场。面对这样的情况,我们不禁要赞叹大模型的卓越表现。接着,让我们来欣赏一下大模型如何从这个有趣的视角出发,生成了一段富有趣味性的小故事。在这个故事中,孔子并没有如人们所期待的那样出现在奥运会现场,而是通过一种神秘的方式,向全世界传递了他的智慧和理念。这个故事不仅让人捧腹大笑,同时也引发了人们对孔子及其思想的更多思考。总的来说,大模型在这个问题上的表现,无论是其严谨的历史和常识判断,还是其富有创意的故事生成能力,都充分展示了人工智能在处理复杂问题和生成 creative content 方面的巨大潜力。
5.数学能力
数学能力一定意义上代表了认知大模型通用能力的认知水平,星火认知大模型在数学能力方面遥遥领先。
从基础计算到三角形求度数再到应用题,星火认知大模型都在现场演示中给出了准确答案。
6.代码能力
发布会现场星火认知大模型进行了一小段“找出1到100之间的质数并输出结果”代码生成的演示。
代码生成能力主要针对工业互联网和企业内部使用,星火认知大模型仍在不断训练中,未来两到三个月代码运行能力将有很大提升。
7.多模态输入和表达能力
除了前文已经提到过的语音识别和朗读功能,发布会中还展示了大模型的图文输入和理解能力,不仅可以把英文菜单翻译为中文,还可以对菜单里的菜名进行解释,描述菜品的味道。
这一功能不仅可以应用在简单的图文翻译中,也可以成为旅行助手,在提供翻译功能的同时,介绍不同名胜古迹背后的含义和历史故事。
更值得一提的是,星火认知大模型还可以根据文字直接生成视频内容,无论是声音、虚拟人形象、唇型、手势还是视频背景都由大模型实时生成。
后续,星火认知大模型完善的方向如下:进一步提升大模型的开放式问答和多轮对话能力;实现代码生成能力升级,并将多模态交互能力开放给客户;全面实现通用模型对标ChatGPT等。
二、四个领域,取得落地成果
在教育领域,一直以来,作文提升都是教学中的一大难点,以批改为例,找出病句、好句、给出评语,一篇文章最少需要老师用30分钟才能完成。
而星火大模型的语言能力和学习机结合,可以对作文快速进行深度理解,自动生成评语和范文。
在办公领域,大模型升级产品,帮助智慧办公迈入了全新阶段,可以满足语音转写、会议记录等多语种翻译等多种办公需求,助力职场人提升工作效率。
在汽车领域和数字人领域,大模型和产品及业务进行全面结合,比如虚拟人智能交互机现已有1000多个虚拟形象资产、300多个专业声音、30多万用户自定义音库,可以提供更加自动化、个性化的数字员工服务,实现24小时不打烊营业。
三、中外大模型能力差距争议
追赶OpenAI首先需要一套科学系统的评测体系。
刘庆峰认为,认知大模型刚刚起步,还在快速成长和迭代过程中。
让这次智慧涌现的认知智能解决社会刚需,需要一套脚踏实地的科学系统的评测体系。
在认知大模型还在快速迭代中,如果只是找单点例子来证明某个系统的强弱,是没有意义的。
*文章为作者独立观点,不代表笔记侠立场。
左战略、右组织,扫码成为笔记侠的朋友
领取10万字+的战略、组织干货合集,迭代你的赚钱思路
科大讯飞, 认知大模型, 通用人工智能, 跨领域能力
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!