3月16日下午,百度在北京总部召开新闻发布会,基于百度新一代大语言模型的生成式AI 产品文心一言正式面世。 

从现场演示来看,文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成等方面有突出能力。 

百度创始人、董事长兼首席执行官李彦宏说,“文心一言对标ChatGPT,门槛是很高的,全球大厂还没有一个做出来的,百度是第一个,我自己测试感觉还是有很多不完美的地方。我们大家都希望文心一言能够快速成长,能够尽早地给用户和客户带来价值。” 

百度创始人、董事长兼首席执行官李彦宏

“这不是头脑发热,而是十余年的技术积累和产业实践的水到渠成”

去年11月30日,ChatGPT上线。今年2月以来,国内多家科技公司先后宣布有关大模型与类GPT相关的产品。此次百度率先发布了文心一言。 

文心一言是新一代知识增强大语言模型,也是百度继文心一格之后的又一个生成式AI产品,具备对话交互、内容创作、知识推理、多模态生成等能力。对标ChatGPT这个高门槛,文心一言的目标是做到“人有我有,人有我优,以及人有我待优”。 

百度首席技术官王海峰说,新一代知识增强大语言模型文心一言,是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的技术,ERNIE和PLATO中已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新,也是文心一言未来越来越强大的基础。

“这不是头脑发热,而是十余年的技术积累和产业实践的水到渠成,我们在人工智能四层的技术架构上都有很深的积累,尤其是框架层和模型层联合优化发挥了非常大的作用。”王海峰说。 

之前谷歌微软都在“一本正经地胡说八道”上翻车案例,文心一言做了哪些改进?李彦宏说,我们做了知识增强和检索增强,知识增强就是有5500亿知识图谱里面的事实,叠加生成式大模型之后,就可以做一些检查,看看生成出来的到底和事实是否吻合。检索增强也一样的。有检索能力、知识增强叠加训练生成大模型,就可以做得更好,未来会不断进步。

李彦宏说,百度连续十几年一直在人工智能领域进行坚定的投入,十几年的技术发展非常快,从最早期用深度学习来解决图像识别问题,到后来几乎每一年都出现一个新的算法,使得更多的事情变成可能。 

李彦宏认为,过去这一年多,人工智能领域发生了比较明显的变化,就是从过去判别式的人工智能,转向了生成式的人工智能。 

去年9月1日,在世界人工智能大会上,李彦宏首次向外界表达了“人工智能技术发展从判别式走向生成式转变”的观点。“拿一个照片说这是杯子还是茶壶,过去十几年时间人工智能在做这件事。过去一两年,人工智能开始走向生成式,就是你提一个要求,可以产生符合你要求的东西,不管是文字、图片,还是视频。” 

李彦宏说,“这半年多时间,基本可以证明这个判断是正确的。更多机会出现在生成式AI方面,无论是百度内部产品还是合作伙伴需求都是非常强烈。这也是为什么我们在非常积极进行研发、迭代,推出文心一言来满足各行各业的需求。” 

“希望文心一言能快速成长,尽早给用户和客户带来价值”

发布会上,李彦宏坦言,这段时间不断有人问他为什么现在发布文心一言?百度是否真的准备好了?

“从我自己在内测过程中体验到的文心一言的能力来说,(当前)确实不能叫作‘完美’”。李彦宏表示,发布是因为有市场需求——百度的各个产品线都在等待这样的技术,客户也在等待,因而需要尽早推出。 

李彦宏认为,文心一言这类大语言模型产品一旦发布,就会获得真实的用户反馈,而有用户反馈,它的迭代速度会非常快,能力提升就会非常快。“我们大家都希望文心一言能够快速成长,能够尽早地给用户和客户带来价值。”

“有那么多聪明的人在涌向这个赛道,大家会逐步发现还有很多过去想也想不到、想也不敢想的可能性,能大幅提升效率、提升公司竞争力。我也非常期待这个新技术、新平台,能给社会、给公众带来各种各样新的可能性。”李彦宏说。 

有观点认为,文心一言,从第一行代码到最后一行代码,以及整个训练平台,完全自研,是不折不扣的“中国创造”。

李彦宏的一句“要卷就卷创新”曾引发很多网友共鸣。“科技是第一生产力、人才是第一资源、创新是第一动力”。在当前国际国内环境下,企业发展需要韧性,亟须鼓励“反馈-创新-增长”的正反馈式创新。

事实上,纵观全球科技史,能跨越60年产业周期的企业共性都是用创新驱动增长。IBM、微软都面临过转型的阵痛。今年全国两会期间,有政协委员提出,由于软件研发需要在使用过程中不断完善发展,往往需要几年或者十几年时间,人力物力投入都比较大。所以说,一般的企业很难坚持得下来,需要政府支持与企业合力共同推进。企业进行痛苦蜕变时,社会应给予更宽容的环境。

中国已进入“科技创新定成败”的新发展阶段,企业是科技创新的主体,创新要发展,必须给企业一个安定、安静、健康、有利的发展空间。我们常常说要创新驱动,但创新往往是九死一生的,没有对风险的高容忍和分担机制,科创企业特别是民营科创企业,很难走远。“我们往往有一种误区,一谈创新言必称硅谷,却不去仔细研判硅谷的创新文化、风险投资机制、人力资本机制、资本市场支持、宽容失败的气氛,以及学术科研领域与产业界的紧密协同。对自己身边一些中国企业的创新,我们既缺少耐心,也缺少包容和鼓励。”

百度创始人、董事长兼首席执行官李彦宏

“困难会刺激创新,而创新是增长的真正动力”

今年1月10日,在百度举办的Create AI开发者大会上,李彦宏说,“芯片卡脖子很要紧,但软件卡脖子一样要紧。必须要把软件的根扎下去,才能让创新持续发生,才能让顶层的商业更加繁荣。” 

回顾百度人工智能投入的历程,在相当长时间是寂寞的。有观点认为,李彦宏是一个技术信仰者,在人工智能领域倾注了最多的心血,他也是一个绝不服输的强者。他推出文心一言并不是要凑热点,而是要证明,在新的全球科技竞赛升级之时,中国人工智能企业可以站出来,应该站出来,也有信心站出来。

“要卷就卷创新”。如同李彦宏所言,在创新上,百度一直在“卷”。早在2010年,百度便开始默默研发机器学习,直到2013年才对外公布AI战略。十年来,百度在研发投入上下千亿重注,在人工智能技术领域培育尖端人才。

截至目前,百度在北京、上海、深圳及新加坡、日本、美国设立了六大研发中心,共有 1 万名研发人员。百度研究院共有9 大实验室,包括硅谷人工智能实验室、深度学习实验室、大数据实验室、商业智能实验室、机器人与自动驾驶实验室、量子计算研究所、认知计算实验室、生物计算实验室、安全实验室。

作为中国技术创新的领导者,百度坚持压强式、马拉松式的研发投入。数据显示,近十年百度累计研发投入超过 1000 亿元。2022 年百度核心研发费用 214.16 亿元,占百度核心收入比例达到 22.4%。 

“所有伟大的企业、伟大的创造者没有一帆风顺,只有不断地历经困难再凯旋。困难会刺激创新,而创新是增长的真正动力。”李彦宏曾说。

Leave a Reply

Your email address will not be published. Required fields are marked *