文章主题:
发展历程:
🌟2012年,AI领域的巨擘Jeff Suntown带领一队才华横溢的学生团队,伊利亚·Sartsky夫及另一位杰出人物,共同研发出一款图像识别精度惊人的AI模型,震惊学术界,从此奠定了Sartsky夫在业界的不朽地位。他们的创新突破,不仅引领了科技潮流,也深深影响了人工智能的发展方向。🔍
🌟2012年,杰夫·辛顿和萨特斯基弗的里程碑研究开启了AGI(通用人工智能)的大门,然而,尽管科技日新月异,我们谈论AGI仍犹如探索永生般遥不可及——对于许多人来说,它仍是科幻领域的理想。AGI,即超智能,象征着无所不能的人工智慧,与那些局限于单一任务如人脸识别、翻译或围棋的AI形成鲜明对比。🚀
2014年,美国硅谷流行“AI取代人类”说法。
🌟【2015夏巅峰合作】马斯克携手创新巨头,与Y Combinator的萨姆·阿尔特曼联手,斥资10亿打造非盈利性质的AI实验室——OpenAI。他们的目标是引领AI研究,探索AGI的无限可能,旨在以更安全的方式推进AI技术的发展。谷歌的顶尖人物——萨特斯基弗也倾力加盟,为这个未来愿景注入强大动力。🌟
2015-2016先后有大量研究人员加入OpenAI,但尚未有明确的研究目标。
🌟2017年,openAI的转折点!🎉3月,谷歌的一篇论文掀起了AI领域的风暴——Transformer架构公开亮相!它革新性地让AI理解人类语言,仿佛一把开启AGI之门的神秘钥匙。自此,AI步入了前所未有的大模型时代。但这背后的科技巨头们可没少砸钱——大数据、强算力与复杂算法是其根基。就这样,OpenAI紧随其后,开始了深度探索的征程。🔥
2018年初,马斯克为避免与特斯拉AI业务有所冲突宣布辞职。
🌟阿尔特曼在2019年引领了OpenAI转型为盈利型企业,这一举动引起了全球科技界的广泛关注。微软随之大手笔投资$10亿,为其注入强大动力。这家公司始终坚持Transformer技术路线,不断迭代创新,推出了NLP领域的四代里程碑模型:从无监督学习的GPT-1,到多任务处理能力显著提升的GPT-2,再到参数量惊人的GPT-3,以及神秘且非开源的GPT-3.5。每一款都展示了OpenAI在人工智能语言理解领域的深厚造诣和前瞻性思考。🚀
🚀🔥2022年12月1日,OpenAI引领创新,发布ChatGPT,源于GPT3.5的超强力量!这款人工智能巨作,借助AzureAI(微软云赋能的超凡运算),通过独特的人工标注数据强化学习路径训练,实现了卓越的交互体验。🚀💥让科技与智慧碰撞,ChatGPT正以它的智慧光芒改变世界!🔍🌐SEO优化提示:ChatGPT, GPT3.5, OpenAI, AzureAI, 人工智能, 强化学习, 互动体验, 科技创新, 知识引擎友好
2023年1月,Buzzfeed(“美版今日头条”)宣布将用OpenAI提供的人工智能API——甚至不是被一些媒体误传的ChatGPT本身——来协助创作。
2023年2月,Chat-GPT的全球月活突破了1亿。OpenAI发布了ChatGPT的付费版ChatGPT Pro,每月42美元(约285人民币)。微软计划在 Word、PowerPoint、Outlook 等软件中,悉数加入 ChatGPT 等 AI,或将ChatGPT应用于Bing,带来搜索引擎革新。
微软希望向OpenAI追加投资100亿美元,如谈判达成,微软将持有OpenAI 49%的股权,OpenAI的非营利性母公司持有2%,其余投资者持有剩余49%。
ChatGPT因用户量激增而频繁宕机,更加体现了ChatGPT对算力层的高度依赖。英伟达CEO黄仁勋称ChatGPT的出现堪称AI领域的“iPhone时刻”
ChatGPT内核:
Chat-GPT本质是以GPT-3模型为框架,通过“对话”这一场景,搭建了一个普通用户也能使用的AI应用,两者之间的技术进步并不算大,没有革命性。爆发是由于C端的强烈关注。
“智能”在哲学上是“记忆”,机器智能的应用对人而言,本质上是让渡了自己的记忆权”,历史上有类似的让渡,如廉价印刷术的发展。记忆栈不能产生意识,更适合用“给出正确答案的能力”来定位它。
ChatGPT的训练:
训练步骤:1.选择大规模语料库,构建训练集。2.定义模型架构,通常使用Transformer模型。3.选择优化算法并设置超参数。4.训练模型,根据训练损失下降情况和验证集结果决定是否需要调整超参数。5.使用测试集评估模型性能。6.如果需要,对模型进行微调,以提高性能。
ChatGPT的基础是Transformer模型,它是一种采用自注意力机制的深度学习模型,自注意力的意思即可以按照输入数据各部分重要性的不同而分配不同的权重。它通过计算词与词之间的相对位置关系来确定注意力的权值,最终生成语句的语义表示。其优势在于其可以并行计算,速度快,精度高,是目前自然语言处理中最常使用的模型之一。
ChatGPT在GPT3的基础上,添加了海量的代码语料库,其可能具有详细的注释,用于帮助AI理解代码功能。
算法:Transformer、GPT-3均为开源,国内企业在大模型上的技术差距仅在半年到两年之间。比如GPT-3发布之后,百度、腾讯、阿里等企业诸如一言、M6、混元等十万亿参数级别的大模型也很快跟进。
算力:AI计算通常采用CPU+加速芯片的形式。通常搭载GPU、FPGA、ASIC等加速芯片,利用CPU与加速芯片的组合可以满足高吞吐量互联的需求。ChatGPT是在GPU上训练的,训练高度依赖英伟达A100、H100等AI专用显卡。常见的消费级显卡通常会将部分算力让渡于光追等功能,相比之下,A100的特点则是从硬件设计到软件配套 all in AI。英伟达A100在BERT等先进对话式AI模型上可将推理吞吐量提升到高达CPU的249倍。从2022年开始,美国已经限制英伟达向中国大陆销售A100/H100显卡,但英伟达推出了A800,成为中国特供版A100平替。
数据:一款通用AI算法所使用的预训练语料库大小为1-10GB之间,而用于训练ChatGPT的前身——GPT-3的语料库达到了45TB。
ChatGPT未来展望
1.具身智能(有物理装置的智能,如人形机器人)与ChatGPT的结合会非常有想象力。目前特斯拉的人形机器人还是有漏洞:1)需要想明白具身与环境到底在交互什么?唯识学认为交互的是”身体的记忆”(可以简单理解为习性);2)神经网络的工作不是简单的“小脑”的工作方式、动力学(自动驾驶)也不是简单的(像现右这么)流程化的。
2.GPT-4或不再以“大”取胜,数据在精不在多,依靠提高模型效率和数据质量达成改进。GPT-4的推出对商业应用的潜在影响:1)模型能够生成更有“温度”的文字,对应AI客服、AI心理咨询、营销文本等场景;2)模型能够生成更加“专业”的文字,对应金融、医学、新闻、工业等垂直行业应用。
3.未来算力升级主要路径为CHIPLET、存算一体。短期使用CHIPLET异构技术加速各类应用算法落地,长期来看打造存算一体芯片(减少芯片内外的数据搬运),或将成为未来算力升级的潜在方式。Chiplet异构技术不仅可以突破先进制程的封锁,并且可以大幅提升大型芯片的良率、降低设计的复杂程度和设计成本、降低芯片制造成本,但需要牺牲一定的体积和功耗,因此将率先在基站、服务器、智能电车等领域广泛使用。存算一体就是存储器中叠加计算能力,以新的高效运算架构进行二维和三维矩阵计算。存算一体的优势包括:(1)具有更大算力(1000TOPS以上)(2)具有更高能效(超过10-100TOPS/W),超越传统ASIC算力芯片(3)降本增效(GPU通常为万量级,存算一体一般百万量级等效计算核心)
4.产业数字化方面,TO B和传统行业融合更具优势,汽车、工业、能源等行业是较好的应用场景。我国提出的新型工业化的背后,工业数字化就是很大一块,在投资上的确定性很高。以前投数字化或者投科技就是投TMT行业本身,买做IT、做CT、做芯片的公司。但未来买数字化,很多时候可能也要买传统行业的公司,其与人工智能是一种双向奔赴。
受益标的
1.推出类ChatGPT产品的公司:
谷歌:Bard机器人
百度:宣布推出智能机器人“文心一言”ERNIE
京东:京东云旗下言犀人工智能平台宣布将推出产业版ChatGPTChatJD
阿里巴巴:达摩院正在研发类ChatGPT的对话机器人,进入内测阶段
字节跳动:字节AI实验室正开展类似ChatGPT和AIGC相关研发,未来或为PICO提供支持
网易有道:近期将推出教育场景下的ChatGPT模型
科大讯飞:类ChatGPT技术将于5月落地,率先用于AI学习机。2023年将正式发布软硬一体机器人。NLP能力公司。
2.接入AI系统的公司:
微软:推出整合OpenAI技术的新版必应(Bing)搜索引擎和Edge浏览器
汤姆猫:目前公司团队已尝试应用ChatGPT模型进行AI交互产品开发的初步测试
捷成股份、天地在线:参股子公司世优科技数字人“阿央”已经接入世优科技目前正在开发的ChatGPT小程序
昆仑万维:旗下Opera浏览器计划接入ChatGPT功能
天娱数科:下属子公司元境科技虚拟数字人已经接入ChatGPT等模型,并已在Tik Tok跨境电商直播、虚拟主播直播互动等场景实现应用,并形成产品化解决方案。
初灵信息:以Chatbot方式面向用户提供多媒体智能应答服务,但营收贡献不大
风语筑:接入百度文心一言,布局虚拟人
博彦科技:微软小冰AI助理相关软件外包
慧博云通:对话机器人
3.算力优势公司:
英伟达:ChatGPT的GPU供应商
胜宏股份:国内英伟达的供应商
鸿博股份:与英伟达合资成立北京AI创新赋能中心,有ChatGPT相关产品在研发测试阶段中。
汉王科技:在NLP技术领域的全面性以及长期在行业端的深耕,已经形成自身独有的算法模型
浪潮信息:在人工智能服务器领域的市占率位居全球AI服务器市场第一,在中国市场份额已连续五年保持50%以上。
拓尔思:NLP能力及语义处理
神思电子:NLP能力公司
汉邦高科:数字水印
海光信息:国产CPU+GPGPU
天孚通信:CPO技术提升光模块性能
宇通通讯:CPO明年量产
寒武纪:国产GPU
景嘉微:国产GPU
龙芯中科:国产CPU
格灵深瞳:现有业务的技术和算法模型训练与ChatGPT的理念一脉相承,大型沉浸式交互体验产品灵境将利用ChatGPT相关技术
首都在线:首个国际数据服务和算力服务中心,提供100p算力
兴森科技:chiplet技术
4.数据优势公司:
知乎:问答型互动平台,具有数据优势。
三六零:搜索引擎具有良好的数据基础。此外计划推出基于类ChatGPT技术的demo版产品。
海天瑞声:专注为AI产业链提供算法模型开发训练所需的专业数据集,NLP类项目占总业务10%。
视觉中国:与百度旗下AI作画平台“文心一格”合作,AICG数据源供应商。
沪电股份:国内PCB龙头,提供路由器、数据存储、AI加速计算服务器产品等数据中心基础设施
中文在线、中信出版、果麦文化、科华数据、润泽股份、奥飞数据:提供训练数据
5.算法优势公司:
昆仑万维:9日下午在宣布,昆仑万维与奇点智源合作,将在今年内发布中国版类ChatGPT代码开源,防止大公司技术垄断。
云从科技:在视觉、语音、NLP等多个领域开展预训练大模型的实践,提升了核心算法性能效果和算法生产效率,以实现各领域全面打通整合。来自网络分享,仅供参考。
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!