文章标签:人工智能, 大语言模型, 涌现, 风险提示

本文来自2023年4月14号笔者和一群投资分析师做的关于人工智能投资的分享,略有删节。

(1)

在开始本文之前,我想先为大家做好风险提示。首先,我所分享的所有信息都来源于公开的、可以在网络上查询的资料,没有任何保密或内部信息。其次,由于我对亚洲和中国的股市并不熟悉,以下讨论主要基于我对美国股市的经验和理解。再者,我进行的预测主要是针对长期趋势,也就是三四年以上的情况,而且我对此类研究的兴趣浓厚。这意味着,如果你决定投资,那么在未来几年内都可以无需关心这些事情,只需耐心等待即可。同时,我也想强调,你无需费尽心机去猜测下一个季度的收入情况,也不必过于担忧竞争对手的出现。最后,我要强调的是,我的观点会随着新的信息和变化而进行调整。因此,今天所分享的内容,只是我当前的看法,并非投资建议。投资本身存在风险,因此在进入市场时一定要谨慎对待。

(2)

以ChatGPT为代表的人工智能大型语言模型的涌现,其影响力将远超蒸汽机、印刷术、文字以及火。这种进化和传播的速度是前所未有的,只有深入其中才能真正体会到它的威力。这一变革将对世界结构和运行方式产生深远影响,且已经无法回头。

去年,Jason Wei在谷歌公司工作期间发表了一篇名为“emergent abilities of large languages models”的论文,该文深入探讨了大型语言模型的涌现能力,被认为是未来科技快速发展的重要规律之一。值得注意的是,许多大型语言模型在计算训练量达到10^23 FLOP之后,其准确性会突然大幅提升。

ChatGPT的出现被视为一种“涌现”现象,这是数学逻辑的必然结果。深入理解这一机制,将揭示一系列即将出现的AI强大功能,这也是无法避免的数学趋势。在这里,“涌现”被定义为系统在特定维度参数达到临界点时,其特定能力的快速增长。这种能力在临界点之前并不存在或表现不明显。

LLM的关键之处在于,当模型大小和数据量达到临界值时,过去被认为不可能的推理能力,突然变得可行。这标志着大模型的“人工智能顿悟时刻”。人类的一生都在不断地对各种情况进行建模和分析判断,而现在,人工智能拥有了自身的推理能力,并且正在不断地规模化和自动化,成本也在持续降低。这无疑触及到了人类活动的本质,对未来产生了深远的影响,其潜力不可限量。

GPT中的T,代表的是Transformer。这种技术的出现,对于自然语言处理领域带来了革命性的影响,特别是在AI理解力的训练过程中。它通过建立词语间的联系,尤其是那些在传统AI语言模型中难以建立的联系,从而提高了AI的理解力。比如,“我对花生过敏,每次吃到它,身体就不舒服”。利用Transformer的“注意力”机制,它可以将“花生”和“它”这两个词建立起关联,这使得传统的AI语言模型在理解这两者之间的关系时显得力不从心。因此,我们可以得出一个结论,要提高自己对世界的理解力,就需要像Transformer一样,不断地训练自己的“注意力”机制,以便能快速地捕捉到那些看似距离较远,但实际上却有着强烈关联的事物关系。

(3)

人工智能技术的突破一个重要因素是大规模并行计算能力的提升。

作为一篇高质量的科技文章,我们需要深入探讨人工智能技术中的核心元素,即神经网络。在这个领域中,神经网络的算法——调网络参数时所采用的前向传播和反向传播计算,其实质上是矩阵乘法。矩阵乘法是一种高效的计算方式,每个元素的计算过程可以单独并行展开,而不会影响到其他元素的计算,因此,它特别适用于利用GPU的大规模并行计算能力来实现。

人脑的初级视觉皮质层(Primary visual cortex)拥有大约四亿个神经元,这些神经元在幕后的复杂并行计算和信息传递中发挥着关键作用,为人脑赋予了敏锐的视觉感知能力。这一机制与GPU并行计算所获得的图像识别能力在底层有着相似之处。在生存竞争激烈的环境中,具有视觉能力的动物往往能够迅速占据优势,通过自身的视觉感知能力,有效地捕捉猎物或避免天敌。相比之下,缺乏视觉感知能力的其他动物则可能在竞争中处于劣势,逐渐被淘汰。因此,视觉能力在生存竞争中起到了至关重要的作用,对于动物的繁衍和进化具有重要意义。

但在听觉和其它文字处理任务上,人脑的并行计算处理能力其实非常差。即使一目十行,也就最多同时看两百多个字。而现在 Gpt-4一次性输入可以接受三万多个词,比人的能力要高两个数量级,而且还会继续迅速增加。这种不断增加的高并行度,意味着其对文字和世界的理解力和穿透力,将不断达到一个常人难以理解的高度。所以一定要努力学习用这种工具来提升自己对世界的理解力。

需要理解的是,gpt 作为一种以自然语言为界面的工具,可以容忍输入信息的一定模糊性,因此可以几乎无限的向更大的数据培训量上扩展.之前的很多工具,需要特定的输入界面和语法,差几个字母就完全无法理解,根本不具有扩展性,和 gpt 完全不是同一性质的东西。

效率高的工具,演化到一定程度,会把各种元素连接综合起来,成为一个前所未有的效率越来越高的实体,甚至从一个遥远的观察者来看,像一个有着明确目标的生命体。要注意观察 Gpt 的连接,会造就出什么样的全新的,结构完全不同的实体。

大语言模型将成为智能组合叠加的超级胶水。本质上是语言理解力强,降低了接口的精确性要求(一般软件接口种类繁多,各家定义不同,格式严格精确性要求高,还要考虑兼容,做到通用性不容易),大大提高了接口的通用性,降低了各个子领域技术组合的门槛

把这个思路延伸一下,在分配时间和注意力的时候,最重要的不是你掌握某个具体的技术的能力,而是要保持始终和智能最高的大语言模型生态连接(而不被切断)的能力。始终沉浸于这个生态中,你就赢了大半;孤立的闭门造车,而幻想能创造出什么竞争优势,最好也就是昙花一现,大概率则是白忙一场。

未来超级个体和公司的区别会越来越模糊。人与人之间沟通互动的带宽是比较窄的,容易出错掉链子,经常要等待。LLM 和其插件的带宽是没有上限的,而且应当会越来越稳定,迅速,准确。

Gpt 之类的大语言模型属于一种 meta tool (元工具)。一个典型特征是它可以自己对自己纠错,叫它自己反省一下自己的输出后,马上就可以输出新的更高质量的内容。这种能力可以用于无数场景,这是此类工具和之前的各类创新有着本质不同的一个关键。这也是为什么“普通人觉得自己总有什么特长无法被 AI 替代”的想法极为幼稚。

Gpt 的技术,相当于可以让极少数人具有”超大规模处理非结构化数据信息”的能力,这个能力层层叠加爆发出的生产力,看不到上限。以前是机器无法处理“非结构化数据”,现在不一样了。软件开发中大量人力密集型的比较繁琐的工作(比如写胶水代码),将很容易被替代。

有些人狂妄的以为自己某个单项技能比 AI 强,就不会被超越替代。但 LLM 和各种插件链接上后,想获得新技能是个非常轻松的事情。然后自然会涌现出各种前所未有的超人的能力。

AI 会最终把现在所有人能干的活,慢慢全部自动化,边际成本压到无限接近于零。整个社会结构会有现在无法想象的变化,很多传统概念要么消失,要么彻底重构。而且这个变化已经无法逆转。

英伟达的黄仁勋预计AI 算力十年后可以增加一百万倍,就是六个数量级,2^20。(相对于 Chatgpt 而言)算力增加的原因,主要来自于新的芯片,芯片之间的并行连接,系统之间的并行连接,新的操作系统,新的算法,等等。

技术进步如此之快,以至于现在对普通人而言最佳的策略,恐怕默认是以“躺平,养好身体,等待”为主。否则你拼死拼活积攒的那点资源,很可能过几年,就因为技术因素而一钱不值,但你的健康则是切切实实损失掉了。

互联网真正造成实体经济生产力的加速发展,大概要到2002年之后。比如说,以前美国银行业的文件处理程序还是比较落后,大量依靠传真,或者隔夜快递来传送文件。传真经常会有发不出去的问题,还必须自己打印传真确认发出的信息,免得接收方找不到或者抵赖。真正大家做生意,都开始使用宽带互联网传送文件,是在2002年之后才慢慢展开的。这已经是互联网浏览器出现后九年的事情了。彻底全面普及要到2009年之后。

类似的,大语言模型 LLM在很多实体产业应用上普及,需要时间,但这次应当快一些。可能一两年内,一些公司之间做生意,就开始使用 LLM 的工具来提高效率。也许四年之内,2027年之前就可以全面普及。然后那时的企业再看现在的企业的运作模式,就如同现代人看老人用传真机慢慢发几十页的文件一样,觉得很可笑与落后。

(4)

从投资角度看,唯一值得长期投资的是能够控制生态的,强垄断的,具有征税能力的公司;没有征税能力,竞争者可以不断绕过去,或者不断杀你的价,这都不是好的投资对象。

什么是“收税的生态位”?

1.就是说某个公司的产品和服务,生态内的其它大部分玩家不得不用;

2.而且用了之后就无法离开,无法换别的公司的产品。(因为使用习惯和功能持续深度整合,产业链群体惯性,或其它原因),而且时间越久,就越难离开;

3.因为很难有竞争者替代,此产品服务的价格相对整个生态经济占比,不会下降。甚至可能持续上升。

当你的投资对象占据收税的生态位的时候,可以拿得很稳,而且基本不会为各种捕风捉影的新闻影响心情和判断力。而且这样你对投资不在“收税生态位”的企业,兴趣就不大了。

收税能力也有强弱之分,比如苹果的收税能力就要强于脸书,强于谷歌。

大部分创业的折腾,如果没有达到“收税的生态位”时,非常辛苦,对投资者风险也大。达到“收税的生态位”是一个长期耕耘的过程,也需要一定运气。但如果你还不确信某个东西是否达到“收税生态位”,那就还没到。

AI 是无限游戏,构建最大最开放最丰富的生态者,让尽可能多的玩家加入自己的生态,帮自己分摊成本,才能真正占据战略制高点。

Netflix 全球付费用户超过一亿。chatgpt plus 据说现在已经有接近两百万付费用户,但只要它不断提升服务的功能,没有任何理由,它的付费用户数会低于 Netflix.

微软和 openai 有一个利润分成的长期协议,大概 openai 前面利润,微软分75%,直到它把自己给 openai 最初的一百三十亿美元的投资收回。之后的利润分成比例是各自拿49%。所以基本上可以把微软和 openai 看成一体的。

真正的竞争壁垒不在于数据,而在于生态的构建,尤其是当大量第三方开发者自发参与生态的建设。

对于开发者而言,微软是 github 的主人,开发者默认要使用的门户网站,你一旦用上 github,就会使用 github 提供的编程工具 copilot,一旦用的习惯了,就很难换了。那么你用了 github,阻力最小的路径就是继续使用微软生态内其它的工具和设施,因为方便和便宜,比如说 chatgpt 的 plugin 插件,或者自己也参与做相关的插件,因为 openai 这个生态圈里的潜在客户最多。做好之后,不管你是自己训练大模型,还是要把服务部署在云端,你都很难逃离微软的 azure 云服务的轨道,还是因为方便。而且微软正在一步步,把所有这些微软的 AI 工具整合到 office, bing, edge 浏览器, windows 里面. windows 仍然占有桌面电脑市场份额70%以上。azure 占市场份额20%以上,微软的 office 软件包,包含 excel, powerpoint, word,占整个相关办公软件市场的份额大约85-90%。这些工具都会被微软和他的 AI 软件整合。所以你一旦接触到微软的任何工具,就会自然被吸引到他的 AI生态圈里面,越陷越深。

还有一个数据,就是硅谷这边的做天使投资的公司 Y combinator,最近一期扶植的项目,280个,里面大概38个是给 chatgpt 相关的项目,所以这些人最后都是在给微软和 openai 打工,帮助他们壮大自己的生态。

现在默认微软/openai 是这个领域的领先者。其它竞争者要想超越,必须靠大量的市场数据来证明自己,而不是靠发几篇新闻通稿,就想来忽悠投资者和用户。

微软现在股价不到290, PE 比值大约30左右,并不是特别高。这一波人工智能的狂潮,可能未来五年内导致其利润翻番。有个历史数据,微软2022年的收入,比2017年增加100%,而利润增加了200%也就是涨了三倍。所以预计微软未来五年利润翻一番,并不是很离谱。这是目前逻辑比较清晰的长期躺赢的机会之一。(非投资建议,投资有风险,入市须谨慎!)

关于 AI 的硬件公司,它最大的风险在于,相对而言在价值链的低端,收入来自企业用户,波动可能更大,遇到泡沫崩溃时价格下跌非常厉害。即使是当年的网络器材公司巨头思科 Cisco,2002年相比于2000年最高点时的价格回撤,达到接近90%。而同期微软的价格回撤只有50%左右。

(5)

这是我认为未来几年AI投资领域的一个可能发展趋势。历史很少重演,但它经常押韵。

人们看到了LLM 的力量,看到了OpenAI赚钱;

人们想与OpenAI竞争;

新竞争者购买新的GPU;

像英伟达这样的GPU制造商赚钱;

新竞争者想要超越英伟达,或制造专用芯片。

像TSMC这样的芯片制造商赚钱;

竞争者想要超越TSMC建立更好的晶圆厂,需要更好的光刻设备;

ASML赚钱;

OpenAI上市,早期风投获得超过100倍的回报。

早期风投出去筹集新的巨额基金;

机构投资者涌入,担心错过良机。

更多与AI相关的公司得到资助,尤其是基础设施公司。

估值模型逐渐变得基于恐惧(错过的恐惧、被竞争对手收购的恐惧、显得愚蠢的恐惧)的凭空捏造,而非基于现金流的现实贴现值的合理计算。

追逐趋势的操盘法一段时间内很赚钱,保守行事的人一开始看起来相当愚蠢。

风投可以根据私有市场中虚幻或不可持续的估值,对外炫耀高的内部收益率 IRR,从幼稚的投资者那里筹集更多资金。

然后美联储降低利率,更多的热钱涌入。

潮水涨起,所有的船只都随之上升。有一段时间,每个人都赚了很多钱。

LLM、芯片制造商、晶圆厂、设备供应商、风投、分析师、AI公司员工。任何未将其投资收益重新投入AI相关股票的人,与这样做的人相比,会觉得自己非常愚蠢。

在泡沫的顶峰,做空股票泡沫的对冲基金将遭受重创。

一直对泡沫持谨慎态度,但在五年内一直错误的分析师,在顶峰时改变观点,变得乐观。

然后美联储收紧。然后一切都垮了。

(6)

面对泡沫,普通人很难独善其身。一是没有资源长时间坚持一种看上去相对平庸的策略,二是无法承受看上去比自己蠢的人居然暂时大幅度超过自己的巨大精神压力,三是认为自己可以择时提前退场,四是认为自己可以择时而选择主动做空,等等.

即使知道大概演化的框架,实际上无法改变什么。企业资金因为竞争的恐惧而入场,机构资金因为错过的恐惧而入场,散户因为恐惧隔壁老王赚钱比自己多很多而入场,所有入场的资金争先抬高价格,互相强化。这种恐惧驱动的策略相当长一段时间确实有效,大家对此策略的信念也不断强化,难以改变。

公司估值最终要看现金流。但早期高科技公司的现金流分析,非常困难,很多时候几乎不可能,这时人们就容易用一些自欺欺人的片面摘取的技术细节和新技术名词来分析评判公司技术实力,并把它作为现金流分析的替代品。这种分析方法在泡沫膨胀的早期往往显得有效,因此容易被(错误的)强化。

很多高科技公司的投机者容易陷入的误区是,当整个估值模型发生火山喷发式的彤塌时,没有能力迅速改正思维模型,逃离灾难。

在泡沫酝酿的上升期时,可能有几年时间“投资某个炫目的增长型高科技公司,不管利润多少,不管是否可以持续,在更高的价格卖出”这种思维模式,一直有效,渐渐变得根深蒂固,理所当然,理直气壮。

当必然的下跌和行业洗牌发生时:公司的很多客户本身就破产了,来自他们的营收也消失了;原来盈利的公司突然变成负现金流;原来因为 fomo 的恐惧而原意支付一百倍 PE 的投资者现在自身难保,只愿意支付25倍 PE ;原来可以拆东墙补西墙的财务造假,也没有更多腾挪空间来维系。这时候,预期和现实的合龙,只能靠崩溃的股价来实现,没有别的选择。

之前发财的投资者,没有理解这是一个大彤塌,本来理性的反应是马上切换成“自我保全的应急模式”,逃得越远越好。但对于思维模式固化的人而言,阻力更小的更自然的反应是,自我安慰说,这一切都是暂时的,几个月后就会会反弹的,以前我都是这样渡过暂时的难关的!

在火山喷发时,还继续往里跑,不断投入自己宝贵的资源去消耗。这是把自己一生的积蓄,几个月内就消耗光的最有效模式。不管你之前做得有多好,积累有多少,在必然到来的周期性萧条和行业洗牌之前,远离这种大彤塌造成的伤害,是决定成败的关键之一。

行业洗牌时,即使是一些长期基本面看好的龙头公司,也难免遭遇股价下跌75%以上的价格回撤。原因很简单:营收减少20%,利润可能减少一半以上,pe 再从比如60跌到30以下,股价自然下跌75%以上。至于非龙头公司,价格回撤95%以上或者彻底归零,更是司空见惯。价格回撤无法完全避免,但行动之前要清楚理解可能出现的最坏情况,并且有资源有能力能够承受这种冲击。

面对新的科技浪潮来临,创业者常犯的一个错误是,没有理解自己真正有什么可以持续的竞争优势的时候,就跟风往前冲,以为自己把某个一厢情愿的产品做出来之后,一切就会迎刃而解。更多时候,他内心深处,可能并不想真正做好产品,只是幻想做了足够多的时候,一定可以找到下家接盘,发笔小财。如果他碰巧遇上一个和他同样天真而猴急的投资者,很容易一拍即合,把这种盲动推进下去。

实际操作上,一旦要面临市场考验的时候,会发现:产品做出来,潜在客户不买账;有客户有兴趣,但不愿意付那么多钱;客户服务和运营支持成本太高,根本无法盈利;突然有新的竞争者推出类似产品,价格更低更好用,推广渠道更强大,自己过去花的功夫完全白搭;长时间没有反馈,无人理睬的感觉实在痛苦,只能打掉牙往肚子里吞。最后实在没有财力物力继续,只能灰溜溜悄悄收摊,然后惨痛教训淹没在茫茫人海中,继续被后面各种满怀希望的年轻人一次次重复。

——-

作者简介:王川,投资人,现居加州硅谷。

人工智能, 大语言模型, 涌现, 风险提示

Leave a Reply

Your email address will not be published. Required fields are marked *