文章主题:人工智能, AlphaGo, ChatGPT, 围棋

666AI工具大全,助力做AI时代先行者!

上一篇提到最终大模型的格局很可能是有一个偏通用大模型,比如 ChatGPT,它会颠覆现有信息集散的基本格局,同时还会有很多面对垂域的大模型,每一个都会像是一个个成功了的沃森(《AI 大模型没有商业模式?》)。但没说为什么这么认为,这篇就来讲讲这个问题。回答这个问题首先要回到一个类似关公战秦琼的问题:ChatGPT 如果去下围棋能干得过 AlphaGo 么?

ChatGPT 和 AlphaGo 下围棋,谁赢?

在过去十几年的人工智能领域中,有两个事件深深地印刻在我们的脑海中。首先是在2016年,AlphaGo在与围棋世界冠军李世石、柯洁的对决中失败,这一事件标志着人工智能在围棋领域的突破。其次,在2022年,ChatGPT成功地展现了通用智能的能力,引发了全球范围内的广泛关注。这两件事情不仅推动了人工智能技术的发展,也让我们对这一领域有了更深刻的认识。

有趣的是,这两次突破分别针对垂直领域(AlphaGo)和相对通用的领域(ChatGPT)。

在观察AlphaGo的训练方法时,我们可以发现一个显著的特点,那就是它将自身视为数据的来源,这一观点与人们常提到的“数据飞轮效应”不谋而合。然而,在AlphaGo的案例中,这种效应在后期演变成了内部化的机制。当我们升级到AlphaGo Zero这个版本时,可以看到它已经不再依赖人类的棋谱,而是开始进行自我对弈。而这种做法所带来后果则是相当令人震撼的。

在仅仅21天的时间里,AlphaGo Zero便通过自我对战,成功达到了与自身哥哥AlphaGo Master相当的水平。这一成果充分展示了人工智能的自主学习和进步能力,它无需任何外部支持和帮助,仅依靠内部的数据和算法,便能够实现如此显著的提升。

这对判断谁赢有什么帮助呢?其实这非常关键。

在评价胜负时,仅仅依赖技术是不足以确定结果的。过去十年的经验告诉我们,从技术的角度去预测未知领域往往会导致判断失误。因此,我们需要采用一种新的方式来评估优劣。

AlphaGo 的成功标志着人工智能在围棋领域达到了一个前所未有的高度。这一成就的取得,意味着人工智能从诞生到发展,再到应用于各种场景,经历了一个清晰且完整的成长过程。在这个过程中,我们可以总结出一个关键阶段,即人工智能从诞生到顶点的形成。

这三个阶段是:现有全量数据阶段—自我数据生成阶段 – —启动数据→智能飞轮,领域高点。

在当前的全量数据阶段,AlphaGo正在从人类棋谱中汲取经验。在战胜了世界冠军李世石之后,它的学习之旅进入了新的阶段,这个阶段的特点是从数据到智能飞轮的启动。

这是一种递进的关系,全量数据意味着对场景描述已经比较充分,人工智能可以比人干得好。只有过了这个阶段,它才可能自己产生有价值的数据,而一旦它可以自己产生有价值的数据,那后续的进化就会非常快。

但形成这种数据的闭环并不容易,领域越宽越难。

在面对真实世界的诸多问题时,要实现高效解决,一个能够包容世间万物的虚拟宇宙显得至关重要。这便是垂直领域所具备的核心优势。通过精挑细选,我们有望迅速达到类似于围棋之神AlphaGo的境界,从而在众多领域中脱颖而出。

让我们回归最初的问题:尽管 GPT-4 对围棋没有涉猎,但它在理论层面上显然无法与 AlphaGo 相提并论。AlphaGo 通过数据飞轮已经在围棋领域达到了顶尖水平,而 GPT-4 的表现则类似于初学者与小朋友和专业拳击手对战。

这个结论其实非常关键,这既能回答垂直领域大模型是否能够存在,还能回答垂直领域大模型的基础战略到底应该是什么样的。

但要想真的做垂直领域大模型,还需要考虑的问题是解决垂直领域问题除了大模型还需要什么,大模型到底在其中占多少权重。是大模型往那儿一摆,垂直领域的问题就解决了么?还是说会有更关键的决定性因素?

大模型在 ” 沃森 ” 类系统中的权重

郭士纳之后,IBM 好像彻底变成了个只会赚钱的公司,创新的业务比如 IBM Watson,总是给我们一些负面的消息。但这个时候不能忽视的恰恰是它,因为它落过地,也许技术不行,但对场景的总结和描述一定就是大模型也需要解决的问题。

成功的案例可能会更耀眼,但失败的案例往往可以让我们学到更多。(考虑 ChatGPT 到 2022 年底才出来,我们实在也找不到更好的成功的案例。)

沃森的产品架构大概这样:

现在代表 Watson 那个球完全可以替换成大模型,然后你就会发现其它的部分未来再做落地的时候一个都少不了,还可能需要增加。

我们来简单翻译下上图的各种输入,沃森作为一个辅助诊疗的系统,它第一个需要的是关于病人当前症状的数据,比如 X 光等。而病人的数据有可能是不完整的,所以它可能会主动激发一些问题,让病人进行回答,让它能够形成判断,最后病人的基因数据也需要作为一个关键数据提供给它。

除了病人的数据外,它还需要具备这个领域相关的知识,比如哪些诊疗方法是不被允许的,过往类似的病情都是如何处理的以及新药等。这就是上图右侧的部分。

这个表述比较形象,但会有点杂乱,不利于推测后续垂直领域大模型的关键点,所以我们换个视角对此进行再分类,这就可以更清晰看到垂域大模型所对应的系统构成。

需要最终面对对象(也就是患者)的全量数据。全量数据包括:当前这个时间点的数据(当前病症)、历史数据(病例)、基础特质(基因)。这其中当前数据有可能需要在时间和空间上都进行展开,时间上的展开,比如 24 小时心电图,空间的展开,比如传染病的时候你的行动轨迹等。这代表了对象的充分数字化。

垂直域的大模型自身必须是一个活的专家。也就是说它的领域知识不止要全量还要是活的,所以不管是行业规则还是最新研究成果都要形成有机的联动。这里面规则可能更关键,因为它需要立刻生效。

这两部分数据的获取会导致所有 AIoT 的相关部分全需要被挪过来,你需要大规模管理设备(对接医疗设备等),需要云原生,需要数据库,需要内容审核和对接等。大模型相当于在原来的基础上强化了脑袋,并不是把一切推翻重来。

在这个过程中,大模型提供了构建有价值的认知类系统的机会,但在最终成型的认知系统中远不是全部,从创造价值所占的权重的角度看也许只有 30%。这看似有点矛盾,但可以拿移动互联网做类比,没有 Android 和 iOS 就没有移动互联网,但如果把移动互联网看成一个整体,从创造价值的角度看,他们的权重也许就不到 1%。

这是从沃森这样系统中可以直接看到或者联想到的部分。

那数据飞轮在哪儿呢?答案是一时半会这类系统不会有数据飞轮。

人以及病例毕竟不是棋谱,可以人工智能自动生成。按照 ” 现有全量数据阶段—自我数据生成阶段—数据→智能飞轮,领域智能高点 ” 的阶段划分,这好像完全到不了自我数据生成阶段,因为在漫长的时间里人是不能充分量化的,新的创造也是会实时发生的。也就是说沃森这种系统会长期处在第一个阶段。

这也帮我们引出垂直领域大模型相关的第三个话题:不是所有垂域都有数据飞轮效应。万物皆数的程度和数据飞轮效应正相关。

万物皆数与数据飞轮

像围棋这种领域数字化的成本极低,因为本质上这是一个数字空间的游戏。纯粹数字空间的事其实不多,虽然过去都产生比较大的影响,比如搜索、社交网络、IM 等。

到电商和 O2O 的时候数字化的成本就变关键了,必须有一个简单的方法能够让物理的商品或者外卖小哥能充分数字化,然后才能获得数字和算法所带来的红利。

大模型的作用域和后者类似,都是需要走出纯粹的数字空间。

这样一来万物皆数反倒是更关键了。就像没有米饭做得再好也没意义一样。当大模型离开了纯粹的数字空间(ChatGPT 在这里)一样要走过 O2O 的历程,否则你就没法解决现实问题。在这里感知和认知需要无缝的融合。

这是完全不一样的游戏规则,这个环节最关键的反倒是传感器,传感器的小尺寸和成本大幅下降,让物理世界的数字化成为可能。但它的部署很麻烦,每一个场景的数字化的成本估计和大模型的研发是类似的。同时他们俩又是双生的。

这类场景确实还会进一步细分,一部分更贴近数据飞轮效应,一部分则相去甚远。比如同样牵涉人,但教育应该就比医疗更好做,税务就比战争好做。

所以大模型落地的顺序大致会是:纯粹的数字领域,比较低成本可以做到万物皆数的领域,高成本但还是可以做到万物皆数的领域。

下面这个是纯粹猜测,数据→智能飞轮,领域智能高点这个阶段里可能算力需求会下降。这只是一个观察,非技术性的结论。

计算成本的考量

在能力增加的时候,AlphaGo 所需的算力是下降的:

显然 GPT 还在继续放大的路上。从最新透漏出来的消息看,GPT-4 在 120 层中总共包含了 1.8 万亿参数,而 GPT-3 只有约 1750 亿个参数。按照这趋势 GPT-5 不太可能变小。

这也许是因为问题域太大,而限定边界的话就可能可以更早的进入优化阶段。AI 未必不能优化自己。

相信什么样的回答就有什么样的选择

上面说了很多观点,每个判断和选择都影响未来几年大模型的真正走势。

关键是这只是看着能行,没人能给出准确判断。这就变成了一个是否相信的问题。相信什么就有什么样的选择,而什么样的选择就会有什么样的结果。我们来对此做个简单总结:

相信通用大模型不能覆盖垂域大模型么?

相信这种三段划分么?现有全量数据阶段—自我数据生成阶段→数据飞轮,领域智能高点。

相信最终价值链条中大模型只创造 30% 么?

相信万物皆数的成本和大模型本身其实一样关键么?

这些节点上的判断非常关键,会影响资源的投入。

OpenAI 首席科学家说得对:” 你先要选对,然后你的信念就是结果。”

小结

从做事的角度看,纯粹数字空间的大模型对绝大多数人而言机会几乎为 0,垂直领域大模型早期会加大亏损,但增加最终商业模式跑通的可能性。短期一定会出很多垂域大模型,因为下围棋的话 ChatGPT 总是干不过 AlphaGo。长线看通用大模型和垂域大模型的竞争会一直都在,但如果通用大模型真的覆盖每一个 AlphaGo 这样的领域,那意味着什么呢?

查看原文

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply

Your email address will not be published. Required fields are marked *