文章主题:ChatGPT, 文心一言, 大模型, 人工智能技术
ChatGPT 和文心一言作为大模型领域的两种代表,正在展开一场备受关注的“大模型之战”。尽管 ChatGPT 技术先进,处于世界领先地位,但是它面临着商业化和监管的压力。与此同时,文心一言则瞄准了中国的市场占领先机,但是也面临着巨大的竞争压力。大模型领域的发展日新月异,使得这场没有硝烟的战争才刚刚开始。随着技术的不断进步,大模型的应用范围也越来越广泛,从自然语言处理到计算机视觉、语音识别等多个领域都有广泛的应用。因此,对于企业而言,能否在大模型领域占据一席之地,不仅关系到自身的未来发展,也关系到整个行业的发展方向。
自2023年起,人工智能领域的领军人物非ChatGPT莫属。这款由美国OpenAI公司研发的基于人工智能技术的大规模语言模型,不仅可以帮助用户解答各类问题,还能提供丰富的知识和信息。ChatGPT的问世引起了广泛关注和讨论,我国各大科技公司也纷纷布局大模型领域。其中,百度这家一直致力于深耕人工智能领域的公司,率先推出了多模态大模型“文心一言”,成为国内该领域的佼佼者。尽管目前文心一言仅开放了测试功能,但在打造中国版ChatGPT的道路上,它已经被寄予厚望。
文心一言,避开国际竞争
ChatGPT从诞生之初就是一个多语言大模型。公开论文显示,按语种划分,ChatGPT的英文数据集占据了将近50%,其余主流语言均有涉及。MMLU测试结果表明,GPT-4的多语言解决问题能力十分强大,26个测试项目中有24个优于GPT-3.5与其他大模型。从后续的用户反馈中我们得知,ChatGPT在英文反应速度和内容质量上优于中文,但从整体看,表现仍优于其他模型。
GPT-4跨语言MMLU测试结果。 图片来源:OpenAI官网截图
OpenAI公布的训练GPT模型采用的三种方式:有监督微调(Supervised Fine-Tuning, SFT), FeedME(Feedback Made Easy)、人类反馈的强化学习(PPO),都是大模型训练时常用的方法。但由于训练过程复杂,数据集不透明,加上长期技术迭代等,外界复制ChatGPT并不容易,ChatGPT目前在大模型领域的霸主地位无人能够撼动。
百度官方发布声明指出,文心一言大模型的训练数据源自互联网的公开数据,其创始人李彦宏在发布会上着重展示了该模型在中文理解方面的强大能力。李彦宏透露,对于英语和其他语种,文心一言采取的是“逐步探索”的策略。相较于ChatGPT等多语种的跨国界应用,文心一言更注重发展中文市场。
这并不难理解。首先,凭借多年深入挖掘的丰富中文语料资源,文心一言得以顺利发展并实现中文大模型的突破。百度CTO王海峰在接受采访时提到,文心一言不仅在常见的三大模型训练方法之外,还采用了三种创新的策略,即知识增强、检索增强和对话增强。这些策略所依赖的数据来源、搜索框架以及对话技术,都依赖于丰富的中文语料库。值得注意的是,百度所具备的可扩展资源(例如用户真实反馈和搜索请求)主要集中在中文领域。
其次,当前我国内无法正常使用的ChatGPT,其原因主要在于文化差异导致的进入市场的困难。在短时间内,ChatGPT想要进入我国市场并不容易。而面对国内急切的需求,仅依赖OpenAI的“烧钱模式”去创建我国的ChatGPT,无论是从时间还是成本上都显得不切实际。因此,文心一言在这种情况下,选择优先抓住我国市场的发展机会,成为了必然的选择。
同样的技术,不同的方向
大模型技术的迅速崛起,如同雨后春笋一般,吸引了众多企业和个人用户的关注。据当前公开的信息披露,ChatGPT和文心一言在探索商业化模式方面呈现出不同的走向。
ChatGPT超越TikTok成为用户活跃增长最快的公司,显然是靠C端用户。2023年2月,ChatGPT面向C端的个人用户推出了付费版ChatGPTPlus,每月收费20美元。有消息称,ChatGPT的商业版也将推出,目前尚不清楚其定价及成本。
与ChatGPT相比,文心一言的B端倾向更强。发布会前后,百度的外宣更多关注与企业合作建立生态圈。据财经十一人报道,目前百度将文心一言定义为“一个通用的赋能平台”,希望其他行业基于文心一言来做智能化改造,实现效率提升,在这一点上,OpenAI只允许微软系产品接入,封闭性更强。百度官方微博称,截止到2023年3月20日,已有超过10万企业用户排队申请文心一言企业版API调用服务测试。对C端的赋能,百度似乎没有过多宣传。
强大如ChatGPT,仍处于亏损状态,比起技术的突飞猛进,大模型商业化的探索显得磕磕绊绊。小冰CEO李笛在接受北京商报采访时表示,大模型运行成本巨大,TOB与TOC盈利方式不同,要想商业化落地,首先必须解决准确性问题,在这个基础上再考虑进一步优化成本。TOB好还是TOC好?这个问题目前没人能准确回答。
在不确定中迎接挑战
当人们为技术进步兴奋、欢呼或者惆怅时,来自监管层面的压力对ChatGPT的落地应用泼了一盆冷水。当地时间3月31日,意大利当局宣布全域禁止使用ChatGPT。随后,德国、法国、爱尔兰、西班牙等欧洲国家的监管机构也相继表达了考虑暂时禁用ChatGPT的可能性。4月11日,美国政府开始研究对ChatGPT等人工智能工具进行审查。
同样,在中国国内,4月11日,国家互联网信息办公室就《生成式人工智能服务管理办法(征求意见稿)》公开征求意见,这预示着文心一言类的产品在国内落地应用的合规成本将会提升。
未来人工智能技术如何与用户、公共政策制定者、社会进行良性互动,是除了技术更新迭代与商业化以外必须考虑的问题。
ChatGPT以“大力出奇迹”的模式走到了行业前列,短期内没有其他大模型可以取代其地位。文心一言在中国国内则没有那么幸运。在ChatGPT无法进入中国的情况下,其他中国科技公司对文心一言的挑战不小。
4月11日,阿里发布语言大模型“通义千问”。阿里云CTO周靖人在接受CSDN访谈时表示,“通义千问”在训练时,既有中文语料,也有跨语种语料,既能做机器翻译,也能自动切换各语种,是一个多语种的智慧体。目前,通义千问处于从语言模型到多模态模型发展的过程中,文心一言已经是多模态模型,通义千问稍落后于文心一言。从长远来看,未来要开辟国际市场,通义千问的多语种模型更有优势。
比起与ChatGPT的竞争,中国企业内部的竞争在接下来一段时间会更加激烈。华为、京东、腾讯、字节跳动、科大讯飞都向外界透露了相关领域的积累,大模型之战才刚刚开始。可以预见的是,这些科技巨头一定会踩着前人的石头过河。百度虽走在最前,抢占了市场先机,但前期探索的成本不小。未来大模型落地向垂直领域纵深发展时,产品的优劣很快能分出胜负。
关于第二届EqualOcean全球化峰会(ESG2023)
在出海全球化成为“必选项”的背景下,第二届EqualOcean全球化峰会(ESG2023)将于2023年6月1日-2日在深圳举办。此次峰会,将以“中国溢出、本地融入“为主题,聚焦第三代全球化创业创新者,搭建出海/全球化方向的顶级交流互动舞台。
峰会将邀请安克创新、昆仑万维、传音控股、华大基因、正浩创新、云鲸智能、影石Insta360、卧安科技、极飞科技、酷家乐、Geek+、徕芬科技、名创优品、禾赛科技、元气森林、IDG、源码资本、高榕资本、峰瑞资本、凯辉基金、复星锐正资本、BAI资本、天图资本、蓝湖资本、盈动资本等公司和机构的负责人,以及印尼、阿联酋、尼日利亚、巴西、荷兰、匈牙利等国的外交官到场。
ESG2023上,EqualOcean将发布一系列报告和榜单:《2023中国机器人出海报告》(中英文版)、《2023中国新能源出海报告》(中英文版)、《2023中国出海/全球化服务商报告暨50榜单》、“2023中国全球化新锐公司Top 50榜单“、“2023出海/全球化30人“、“2023出海/全球化青年50人“、“2023出海/全球化投资20人“;同时,EqualOcean将联合相关机构发布《2023出海东南亚报告》、《2023出海美国报告》、《2023出海中东报告》。
ESG2023正在火热报名中,请有意向的朋友扫描下方二维码与我们取得联系。
ESG2023正在火热报名中,请有意向的朋友请联系contact@equalocean.com。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!