文章主题:- 大模型玩家 – 通义千问 – 阿里云
■开源是通义千问发展的最佳出路,也是唯一出路。
■所有大模型玩家随时超越彼此,通义千问的体验感与 ChatGPT 互有胜负。
■未来国内大模型生态会收敛至最合适的状态
作者 | 闫学功
在AI时代,阿里巴巴的CTO周靖人对通义千问寄予厚望,将其视为最开放的大模型。在一个月前的云栖大会上,他同样将阿里巴巴定位为AI时代最开放的一朵云。
今天,我国知名云计算服务商阿里云成功开源了通义千问720亿参数模型Qwen-72B,这一举措标志着我国大模型开源领域取得了重要突破。在此之前,通义千问已经成功开源了18亿、70亿、140亿、720亿参数的四款大模型,同时还包括视觉理解和音频理解两款多模态大模型。阿里云将这两款多模态大模型统称为”全尺寸、全模态”开源,展现了我国在大模型领域的强大实力。
今年 4 月发布的通义千问,从 8 月起正式走向开源之路。据阿里云披露,截至 10 月末,旗下开源社区 ” 魔搭 ” 已有超过 2300 个模型,开发者超过 280 万,模型下载次数破亿。开源是阿里云大模型最重要的战略,但这在业内并不常见。
在全球范围内,无论是国外的ChatGPT,还是我国自主研发的文心一言,都采取封闭的操作方式。大约半个月前,我国著名的人工智能科学家沈向洋曾在一个行业论坛上,深入探讨了关于大模型开源与闭源的争论。他在演讲中明确表示,业内 leading 的企业一定是选择闭源策略,而排名第二的企业则尚无定论,至于第三名的企业,可能会倾向于开源。
当时,周靖人就坐在台下。
在12月1日的发布会上,周靖人明确地阐述了中国阿里云坚定推行开源策略的原因。”阿里云的初衷并非将模型紧握在自己手中以实现商业化,相反,我们致力于协助开发者,开源策略与我们的初心高度契合。”他认为,要想在当前环境中突破和创新大型模型核心技术,开源无疑是”最佳且唯一的选择”。
巨头们争相布局的大模型,想象空间到底有多大?
在十月底,联想集团展示了其AI PC(即人工智能个人电脑)的功能,并且联想集团的董事长以及CEO杨元庆展望了未来的前景,他提出每个人都可以拥有自己的人工智能个人电脑。而周靖人则更加具体地描述了这个未来的场景,他从我们早上的第一声闹钟开始,到生活中的每一个环节,甚至到我们使用的每一个电子设备,他都描绘出了人工智能的支持。这些都预示着未来人工智能将在我们的生活中扮演越来越重要的角色。
他甚至表示,不远的将来,阿里云再举办沟通会,他希望全程用通义千问来回答问题。
在探讨大模型对未来行业和社会的影响方面,我们已经可以看到一些显著的进步。在我国,超过200个大模型正在研发之中,这无疑预示着未来的生态将会更加繁荣和充满活力。然而,这些大模型的竞争也将可能导致行业的洗牌,优胜劣汰将成为常态。目前,通义千问和ChatGPT之间的差距仍然不容忽视。尽管两者都在人工智能领域取得了卓越的成就,但它们在某些关键指标上仍有改进的空间。这种竞争不仅有助于推动技术的发展,也会使最终的产品更好地满足用户的需求。而对于更为乐观的预测,我们期待着超级人工智能(AGI)时代的到来。在这个时代,人工智能将具备高度的智能,能够像人类一样思考和行动,甚至超越人类的认知能力。然而,实现这一目标还需要克服许多挑战,包括理论、算法和伦理等方面的问题。目前,我们还无法准确预测何时能实现这个目标,但可以肯定的是,随着技术的不断进步,我们离这个目标越来越近。
就上述问题,12 月 1 日,阿里云 CTO 周靖人在通义千问发布会后做了一场闭门分享,雪豹财经社也受邀参与,以下是对话实录(内容经摘编):
通义千问和 ChatGPT 4.0 互有胜负
Q:阿里云在三季报发布后宣布,坚持更长期的投入及优先公共云的战略调整,大模型是否会有相应的策略调整?
A:我们从年初发布至今整个策略都没有变化,即一方面做技术的突破,另一方面做生态,提供模型的能力。阿里 CEO 吴泳铭提出的战略调整,也跟整个大模型社区的发展方向非常吻合,没什么具体的差异。公司最近会把技术工作路线更加明确下来。
Q:很多大型厂商选择了不开源,阿里云为什么要选择开源模式?
A:我认为是大家站位不同。在过去 10 年内,整个开源社区蓬勃发展,今天我们要让更多技术和更多人参与进来。开源社区是最佳的、也是唯一的途径。只有真正从心底去拥抱开放的生态,去促进开发者社区的发展,才能将我们的技术融入到各行各业,最终帮助整个核心技术的突破和创新。
阿里云的初衷不是把模型攥在自己手里,或者做商业化,而是帮助开发者。我们的开源策略,跟整个阿里云的初心是完全一致的。因此,我们不光在模型方面开源,数据库、技术等也都贡献到开源社区。今天 AI 的发展,一定不是由一家公司完成的。不管谁有最强的模型,如果没有开放的技术和经验,是无法在各项应用场景中落地的。
Q:在大模型能力上中国企业和美国企业的差距是什么?
A:科技创新上,原则上是大家你追我赶,都在做非常中长期的一系列探索,在这个时间点或许有差距,但也许差距在缩小,甚至扭转也有可能。这就是科技创新的魅力。
我们能看到(和 ChatGPT)之间有一定差距,还有需要提升的空间,但是不能妄自菲薄。比如多模态等,国内很多产品也能做到 ChatGPT 的水平,甚至超越它。通义千问和 ChatGPT 4.0 在使用体感上,是互有胜负的。
Q:通义千问与其他闭源模型相比水平如何?
A:讲到评测指标,国外的 Hugging Face 在全球比较有影响力,它有一系列测评标准,会展现一个客观的评价。当然,不是所有闭源模型都会参与测评。在 Hugging Face 上,我们在开源 14B 的时候是非全模型排名第三,72B 发布之后我们会继续等待测评。我认为我们可能会登顶。
编者注:Hugging Face 是全球最大的开源模型公司,它发布的各项关于 AI 公司的榜单在业界有一定影响力。《时代周刊》今年首次发布的全球百大 AI 人物中,有两位来自 Hugging Face。
Q:Open AI 最近选择了 Agent 作为下一步开发方向,你们有什么思考和跟进?
A:Agent 这个概念不是 Open AI 最近提出的,但它是一个非常重要的模型利用的领域。目前我们社区已经贡献了很多关于 Agent 的开发和创新,接下来每个月都有相关进展,包括如何帮开发者搭建这样一个 Agent,也会有一些新的功能推出。
编者注:Agent 可以理解为 ” 智能业务助理 “,它具有人类的思维,在大模型技术驱动下,以自然语言为交互方式,高自动化地执行和处理专业或繁复的工作任务。
AI 时代:大模型将改变日常生活
Q:联想未来将会发布与阿里云合作完成的 AI PC(个人电脑),大模型会给 PC 带来哪些实质性影响?
A:与联想的合作是一个良好的开端。我们希望不单单是在复杂和昂贵的机器上使用模型的能力,而是把它带到各种端。当我们真正进入 AI 时代,大模型将改变日常生活,模型服务在各个领域无所不在。今后每一个电子设备和生活环节,从早晨的闹钟开始,都会有模型的支持。我相信很快会进入这样一个时代。
Q:未来是否会和更多硬件厂商进行合作?
A:目前已经有不少硬件厂商在洽谈,我们的心态是非常开放的。之所以开源,就是为了不局限于某一个或某几家厂商,而是有更多开发者和硬件厂商一起来参与、推动。
Q:怎么看待大模型在 C 端和 B 端商业变现的机会和价值?
A:我们要做是生态的方方面面,所以当前更加关注的是模型本身。在 to C 和 to B 方面应用的探索会有一些,但还没有到井喷的状态。模型的应用是没有 to C 和 to B 之分的,但我们也希望模型的能力能够渗透到日常生活和工作学习中。接下来会看到一些创新,也许今后几个月,我们就会聊到一系列应用,以及如何帮助到 to C 和 to B 的产品。
Q:阿里云认为实现 AGI 还要多久?
A:AGI 已经成为社会性的话题,有各种各样的解释。但我认为现在谈 AGI 还太早,因为还有很多技术难题,还有很多长足的工作要做。由于 ChatGPT 的爆发,让一年前不怎么关注人工智能的人现在都在关注,我作为技术工作者感到欣慰。但从整个技术发展来看还需要很多时间,请大家给予更多耐心。不要今天关注一个热点,3 个月没爆发,大家就淡忘了。
编者注:AGI 可以理解为超级人工智能,Open AI 将其作为最终目标并写在公司白皮书中。它如此定义 AGI:” 一个高度自治的系统,能在多数有经济价值的工作上超越人类。”
Q:通义千问会将技术产品优化和商业化落地当成重点,还是像 Open AI 一样将 AGI 当作愿景?
A:我们做的工作其实是没有人指引的。通义千问首先是追求技术的卓越和极致的技术探索。如何能够把模型的方方面面提升起来?这本身就是一个研究课题,这方面一定是我们接下来的工作重点。
但在这个时代,科研、技术、产品这几个维度是更有机地联合在一起的,没办法像以前分得那么开。光埋头苦干做研究,不做技术产品、不做技术生态,在今天也不行。这就是为什么通义千问是一整个通义模型家族。我们不断追求技术突破,同时也开源自己的模型,帮助整个生态繁荣。我们还做产品,包括通义千问 App、网页版产品。
200 多款大模型的优胜劣汰
Q:通义千问在技术上还面临哪些挑战?
A:整个大模型还处在发展初期。不管谁家的大模型,都还有很多提升空间。今天的模型具备视觉、听觉的能力,但如何像人一样思考、去识别万物,所有大模型都还有一定差距。通义千问产品这次推出了视觉模型能力,对图片的理解在很多层面是超过 ChatGPT 4.0 的,但距离人类的认知能力还有一定差距。
如何让这个模型有更多思维能力、像人一样去思考,这方面才刚刚起步。我们当前有非常多要解决的技术难点,这也是为什么接下来每个月都会有一系列技术突破。整个通义千问模型的升级能力远远没有结束。
Q:实现了从 0 到 1 后,是创新更重要,还是推广产品更重要?
A:追求技术的卓越一直是阿里云的初衷。在一定程度上,所谓从 0 到 1 和从 1 到 2 没有本质区别,都是在做突破。从 0 到 1 非常难,因为要探索一条新的道路。但继续把产品技术打磨好,每提高一个百分点,其实也隐藏着非常多的技术难题和投入。
Q:上一次开源 14B 反响不错,为什么要再去开源更高的 72B?哪些场景是 14B 无法解决的?
A:14B 是一个非常好的起点,但模型的能力还在不断发展中,创新技术的突破一直没有停止过,14B 更往上还有很多提升的空间。这是推出 72B 模型的初衷,今后 14B 和 7B 也会有升级的版本出来。
在不同的企业和不同的开发环境,大家对模型的尺寸、能力及背后使用的资源有不一样的考虑,有时会追求极致的性能。我们不应该用一个模型、一个尺寸,要求大家对接所有的场景,而是应该把选择权留给开发者和企业。
Q:国内已经发布了 200 多个大模型,需要这么多吗?合理的生态是什么样的结构?
A:任何一项技术都有一个蓬勃发展并快速迭代的周期,最终也可能受技术、商业等各方面的约束而收敛。生态的好处,就是它自己会收敛到合适的局面。
今天我们有 200 多款大模型,能够感受到科技界积极拥抱的态度。今年 1 月时大家还感觉很消极,觉得跟海外差距很大,到 12 月已经没有这样的感觉。我相信整个市场、整个生态也会进行优胜劣汰的选择,也会收敛到更完整、完善的状态,这就是生态的魅力。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!