电子发烧友网报道(文/李弯弯)3月16日下午,百度在北京总部举行新闻发布会,正式发布新一代大语言模型、生成式 AI 产品文心一言。百度创始人、董事长兼首席执行官李彦宏,百度首席技术官王海峰出席,并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。

文心一言在五大使用场景中的能力展示

在文学创作方面,李彦宏以《三体》为例,针对“《三体》的作者是哪里人?电视剧《三体》演员都有谁?于和伟和张鲁一有哪些共同点?于和伟和张鲁一谁更高?”等事实性问题,文心一言都给出了准确的回答。

针对“可以总结一下《三体》的核心内容吗?如果要续写的话,可以从哪些角度出发?如何从哲学的角度续写?”等问题,文心一言也从多个角度给出了建议,体现出强大的总结分析能力和推理能力。

在商业文案创作方面,文心一言顺利完成了给公司起名字、写Slogan、写新闻稿的任务。可以看到文心一言可以准确理解人类意图,能够清晰地表达。这是基于庞大数据规模的训练,文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。

在数理逻辑推算方面,文心一言体现出了很强的推理能力。比如,面对“鸡兔同笼”的问题,文心一眼就能够很快识别出问题不对。当修改问题之后,文心一言能够很快理解题意,给出解题思路,设立方程式,一步步得出正确答案。

在中文理解方面,文心一言表现出了对中国文化的强大理解力。比如,正确解释“洛阳纸贵”的含义,以及“洛阳纸贵”在现代经济学原理里对应的理论。文心一言还用“洛阳纸贵”创作了一首藏头诗,“洛阳城里春光好,阳艳无双不负赏。纸贵漫天诗词赋,贵比黄金乐未央。”

在多模态生成方面,文心一言展示出了文本、图片、音频和视频的生成能力。在音频生成方面,文心一言可以生成多个地方的方言,比如广东话、闽南语,在发布会现场演示的是四川话。视频生成能力方面,因为成本较高,现阶段还未对所有用户开放,未来会逐步接入。

李彦宏表示,多模态是生成式AI一个明确的发展趋势。未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力会不断提升。

从上述演示来看,文心一言某种程度已经具备了对人类意图的理解能力,能够较为准确的、有逻辑的、流畅的表达。不过李彦宏表示,这类大语言模型还在不断完善的过程中,它有时会带来惊喜,有时也会出错,不过它的发展非常迅速。

大型语言模型带来的产业机会

无论是哪家公司都不可能靠几个月突击,就做出这样一个大型语言模型,深度学习、自然语言处理等都需要多年的坚持和积累。可以说,文心一言是百度过去多年努力的延续。

人工智能时代,IT技术栈发生了根本性改变,从原来的三层变成了现在的四层,包括芯片层、框架层、模型层、应用层。百度是全球范围内为数不多在四层都有领先产品的公司。

百度AI全栈布局的优势在于,可以在技术栈的四层架构中实现端到端优化,大幅提升效率。相比于之前判别式AI,生成式AI非常消耗算力,费用相当昂贵,四层之间的协同作用很关键,尤其是框架层和模型层的协同,能够大大提升效率。

百度自2月宣布文心一言以来,已有超过650家企业宣布加入文心一言生态。生成式AI代表了一个新的计算范式,它会带来市场需求的爆发式增长,将释放出前所未有的、指数级的商业价值。文心一言不仅影响搜索、互联网公司,它可以让每一家公司都离自己的客户更近。

大型语言模型会带来哪些产业机会?李彦宏谈到了三点:一是新型云计算,文心一言将根本性地改变云计算行业的游戏规则,之前企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架、模型,以及芯片、框架、模型和应用四层之间的协同。

二是行业模型精调,这是这是通用大模型和行业企业之间的中间层,他们可以基于对行业的洞察,调用通用大模型能力,为行业客户提供解决方案。这方面,百度文心大模型已经在工业、金融、交通、媒体等领域,发布了10多个行业大模型。

三是应用开发,即基于大模型底座进行应用开发的公司,对于大部分创业企业来说,真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型,而是基于通用大语言模型抢先开发重要的应用服务。目前基于文本、图片、音视频生成、数字人、3D生成等场景,已经涌现出很多创业明星公司。

从技术层面来看,文心一言是新一代知识增强大语言模型,具备对话交互、内容创作、知识推理、多模态生成等能力。

据王海峰介绍,它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的技术,ERNIE和PLATO中已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新,也是文心一言未来越来越强大的基础。

在知识增强方面,文心一言主要是通过知识内化和知识外用两种方式。知识内化,是从大规模知识和无标注数据中,基于语义单元学习,利用知识构造训练数据,将知识学习到模型参数中;知识外用,是引入外部多源异构知识,做知识推理、提示构建等。

在检索增强方面,文心一言是来自以语义理解与语义匹配为核心技术的新一代搜索架构。通过引入搜索结果,可以为大模型提供时效性强、准确率高的参考信息,更好地满足用户需求。

在对话增强方面,基于对话技术和应用积累,文心一言具备记忆机制、上下文理解和对话规划能力,实现更好的对话连贯性、合理性和逻辑性。

飞桨深度学习平台支撑文心一言效果更好、效率更高、性能更强。王海峰强调,对于开发训练,飞桨动静统一的开发范式,以及自适应分布式架构,可以实现大模型的灵活开发和高效训练。在推理部署方面,飞桨提供高并发弹性服务化部署,深度计算融合优化,软硬协同稀疏量化加速、模型自适应蒸馏剪裁等,支持大模型高效推理。

小结

文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五大使用场景中展示出了比较强的理解能力和推理能力。

不过整体而言,文心一言目前来说还并不完善,未来随着用户的接入使用,及百度在技术上的不断调优,文心一言将会不断迭代,并展现出更强大的能力。在李彦宏看来,人工智能会彻底改变今天的每一个行业,文心一言是创新驱动发展的最佳证明。

Leave a Reply

Your email address will not be published. Required fields are marked *