ChatGPT 背后的核心技术
AI与地理

ChatGPT 背后的核心技术

架构师指南 我们都是架构师! 架构未来,你来不来? 缘起 输入几个简单的关键词,AI能帮你生成一篇短篇小说甚至是专业论文。作为上知天文下知地理对话语言模型,最近大火的ChatGPT在邮件撰写、视频脚本、文本翻译、代码编写等任务上强大表现,让埃隆·马斯克都声称感受到了AI的“危险”。 最近大火的ChatGPT的计算逻辑来自于一个算法名字叫Transformer。它来源于2017年的一篇科研论文《Attention is all your need》。本来这篇论文是聚焦在自然语言处理领域,但由于其出色的解释性和计算性能开始广泛地使用在AI各个领域,成为最近几年最流行的AI算法模型,无论是这篇论文还是Transformer模型,都是当今AI科技发展的一个缩影。 这也是我想在这里给大家分析这篇文章的核心要点和主要创新的初衷。 但我非AI(数学,计算机)专业,只是梳理并分享自己学习的体会和思考,与大家一起讨论,欢迎各位多提宝贵意见;所述并不专业,各位大牛可以绕行。 从Transformer提出到“大规模预训练模型”GPT(Generative Pre-Training)的诞生,再到GPT2的迭代标志Open AI成为营利性公司,以及GPT3和ChatGPT的“出圈”;再看产业界,第四范式涉及到多个重要领域比如生物医疗,智能制造纷纷有以Transformer落地的技术产生。在这个浪潮下,我的思考是: 一是,未来很长一段时间在智能化领域,我们都将经历“科研、算力、基础架构、工程、数据、解决方案”这个循环的快速迭代;流动性、创新性短期不会稳定下来,而是会越来越强。 我们很难等到科技封装好,把这些知识全部屏蔽掉,再去打磨产品。未来在竞争中获胜的,将是很好地“解决了产品化和科研及工程创新之间平衡”的团队。我们一般理解的研发实际上是工程,但AI的实践科学属性需要团队更好的接纳这种“流动性”。因此对所有从业者或者感兴趣智能化的小伙伴了解全栈知识成了一个刚需。 二是,通过对这篇论文的探讨,可以更直观地理解:在科研端发生了什么,以什么样的速度和节奏发生;哪些是里程碑?是科学界的梅西横空出世,带我们发现真理;哪些是微创新?可能方向明确了,但还有很多空间可以拓展;哪些更像炼金术?仍然在摸索,尚需要很长一段时间,或者一直会保持这个状态。 三是,在AI领域,由于技术原因,更多的论文是开源代码的,一方面,促进了更多人参与进来改进迭代;另一方面,科研跟工程实现无缝连接,一篇论文可以拉动从核心代码到平台,到具体应用很大范围的价值扩散。一篇论文很可能就是一个领域,一条赛道,甚至直接驱动业务价值和客户价值的大幅提升。 四是, AI技术发展有很多领域(感知,认知,感知又分图像、语音、文字等,认知也可以分出很多层次),之前这些领域的算法逻辑存在很大差别,Transformer的出现有一定程度上推动各个领域汇聚的迹象,介绍清楚这篇文章,对把握整体,可能有些作用。另外ChatGPT属于现象级应用,大家更有直观感受,未来这类应用的体验提升和更新速度只会更快,理解了其背后的逻辑,更有助于我们把握这个趋势。 论文介绍 下面步入正题,开始介绍这篇论文,会涉及一些技术细节及公式,可能还需要仔细看一下,相信一旦看进去,你会对AI的理解加深很多。 总体把握 这篇论文的结构非常精炼,提出问题,分析问题,解决问题,给出测试数据。顶刊文章讲究言简意赅,有描述,有代码,有结果;其中最核心的是以下这张图,作者团队提出Transformer的核心算法结构: 整篇文章就是围绕这张图来进行解释的,由于篇幅所限,我们聚焦在一条主线上:1、文章想解决主要问题是什么;2、如何解决的;3、从文章提出的解决方案作为一个案例来引发整体思考,因此我们将内容简化,主要关注核心部分。 这张图表达的内容如果理解了,那基本上你掌握了这篇论文85%的内容,也是最关键的部分。 《Attention is all your need》在编写时主要是为了考虑NLP任务,是由几个Google的科研人员一起完成的,其中一个背景是Google也在推广自己的并行计算芯片以及AI TensorFlow开发平台。平台主要功能特点是并行计算,这篇文章的算法也是在最大限度的实现并行计算。我们就以一个简单的例子来把这个算法串一遍。 核心内容 需求是我们需要训练一个模型,进行中文到英文翻译。 背景知识:这个需求要把“翻译:我爱你 to I love you”转置成一个y=f(x)问题,x代表中文,y是英文,我们要通过训练得到f(),一旦训练成功f(),就可以实现翻译。大家拼的就是谁的训练方法更准确,更高效,谁的f()更好用。 之前自然语言处理主要的算法叫RNN(循环神经网络),它主要的实现逻辑是每个“字”计算之后将结果继承给第二个字。算法的弊病是需要大量的串行计算,效率低。而且当遇到比较长的句子时,前面信息很有可能会被稀释掉,造成模型不准确,也就是对于长句子效果会衰减。这是这篇文章致力于要解决的问题,也就是说这篇文章有训练处更好的f()的方法。联想一下ChatGPT可以做论文,感受一下。 在Transformer里,作者提出了将每个字与句子中所有单词进行计算,算出这个词与每个单词的相关度,从而确定这个词在这个句子里的更准确意义。(这句话要是理解了,后面其实可以不看了。) 在此处,要开始进入一些技术细节,在开始之前,我们有必要再熟悉一下机器学习领域最核心的一个概念——“向量”。在数字化时代,数学运算最小单位往往是自然数字。但在AI时代,这个最小单元变成了向量。这是数字化时代计算和智能化时代最重要的差别之一。 举个例子,比如,在银行,判断一个人的信用额度,我们用一个向量来表示: 向量是一组数据的集合,也可以想象成在一个超高维度空间里的一个点。一个具体的信用额度向量,就是在8个特征组成的高维空间的一个点。数据在高维空间将展现更多的数学性质比如线性可分,容易让我们抓住更多隐藏的规律。 向量的加减乘除是计算机在进行样本训练是最主要的计算逻辑。第四范式一直强调的高维,实时,自学习,其中高维就是把企业信息拉升到一个非常高维的空间,变成向量。...
AIGC革命已来?三大路径带你掘金未来产业
AI与地理

AIGC革命已来?三大路径带你掘金未来产业

智通财经APP获悉,华西证券发布研究报告称,我国国产ChatGPT生态正逐渐繁荣。百度(09888)是少有预训练模型(大模型)语言训练能力的公司,已经经历多次迭代,参数方面,模型基于ERNIE3.0,拥有千亿级参数。预训练方面,具备海量知识沉淀和丰富场景的文心大模型,跨模态方面,已有地理-语言、视觉-语言、语音-语言等模型架构,已覆盖众多方向,例如自然语言处理、机器视觉等其他重大任务,此外,根据IDC数据,目前已有近百万开发者使用文心大模型,生态正在逐步繁荣,合作厂商覆盖科技、教育、工业、媒体、金融等诸多产业。 投资建议:关注鸿蒙OS的生态伙伴 该机构认为AIGC的出世会产生革命性的影响,有望赋能千行百业,同时梳理了三条路径图,积极的推荐以下三条投资主线: 1)具备算力基础的厂商,受益标的为寒武纪(688256.SH)、商汤(00020)、海光信息(688041.SH)、浪潮信息(000977.SZ)、中科曙光(603019.SH)、景嘉微(300474.SZ)、联想集团(00992)、紫光股份(000938.SZ)、龙芯中科(688047.SH); 2)具备AI算法商业落地的厂商,重点推荐科大讯飞(002230.SZ)、拓尔思(300229.SZ),其他受益标的为:汉王科技(002362.SZ)、海天瑞声(688787.SH)、云从科技(688327.SH); 3)AIGC相关技术储备的应用厂商,受益标的为:百度集团-SW(09888)、同花顺(300033.SZ)、三六零(601360.SH)、金山办公(688111.SH)。 华西证券主要观点如下: ChatGPT算法的核心壁垒 (1)庞大的数据训练数据,往往意味着模型精准度的上升;数据量大,往往意味着数据特征维度大,模型的参数越复杂,训练数据维度跟算力指数呈现正相关,算力成本高。 (2)底层算法Transformer,相较于传统神经网络综合特征提取能力、远距离特征捕获能力、语义特征提取能力,全部明显增强,正逐步取代RNN(循环神经网络)。 (3)AI预训练模型(大模型),本质是“大算力+强算法”结合的产物,对自然语言理解能力明显上升,谷歌BERT模型就是典型跨时代的例子,华西证券认为其是AIGC的初始应用算法。 (4)多模态数据协同,极大推动AIGC的内容多样性与通用性,让AIGC不只局限于文本和图像等单个部分,而是多应用相容。 不同类别AIGC算法比对 1、ChatGPT:训练模型为强化学习近端策略优化,可以理解成在“人脑思维”的基础上加入了“人类反馈系统”,是一种奖励模型,拥有175B参数,训练数据为语言文本。 2、LaDMA(谷歌Bard):参数方面为137B,奖励模型是人类评分机制,训练数据为对话数据。 3、图神经网络(GNN)作为科学领域预训练模型(大模型)备受瞩目,强大之处在于数据结构,其应用广阔例如推荐系统、药物发现、合成物发现、芯片设计等众多科学前沿领域。 国产ChatGPT生态正在形成 百度是少有预训练模型(大模型)语言训练能力的公司,已经经历多次迭代,参数方面,模型基于ERNIE3.0,拥有千亿级参数。预训练方面,具备海量知识沉淀和丰富场景的文心大模型,跨模态方面,已有地理-语言、视觉-语言、语音-语言等模型架构,已覆盖众多方向,例如自然语言处理、机器视觉等其他重大任务,此外,根据IDC数据,目前已有近百万开发者使用文心大模型,生态正在逐步繁荣,合作厂商覆盖科技、教育、工业、媒体、金融等诸多产业。 风险提示:核心技术水平升级不及预期的风险;AI伦理风险;政策推进不及预期的风险;中美贸易摩擦升级的风险。
旗帜鲜明地支持 ChatGPT 干掉遍地垃圾的互联网内容刘亦菲上学时没人追?当看到她的学生照后,网友:我也不敢追
AI与地理

旗帜鲜明地支持 ChatGPT 干掉遍地垃圾的互联网内容刘亦菲上学时没人追?当看到她的学生照后,网友:我也不敢追

上知天文、下知地理的聊天机器人 ChatGPT,对话截图流传整个互联网——没跟它聊过秦皇汉武、新冠病毒的人生,是不完整的。 就在亚洲球队接连失利、告别 2022 卡塔尔世界杯之时, ChatGPT 给出了一个振奋人心的答案。也许,在某一个平行世界里,我们曾有两次入选世界杯正赛的辉煌。 这几天,每个人都看了太多 ChatGPT 的惊艳表演,无论是写论文,还是写代码,它都一气呵成,游刃有余。但它的回答依然具有一定的局限性,也不乏错误。如果你知道正确答案,不妨随意浏览。如果你不知道的话,还是慎重一点好。 ChatGPT 的深远意义在于,它拉高了世面上所有文章的下限。 绝大多数泛滥于各个渠道的文章,其准确性、知识性和逻辑性都远逊于 ChatGPT 。「众所周知」,互联网上有大量人力,要么做标题党,要么生产水文,要么炮制庸俗的话题。Google Webmaster 的趋势分析师 Gary Illyes 称,互联网上六成的内容是重复的。 但是,AI 写的文章再好,终究只是「短平快」的资料整合。 写作者不应该满足于 ChatGPT 这种赛博「影子写手」的套路;读者应该去追求更深入、更有质量的报道。 圣诞老人和圣诞树 ChatGPT特别擅长处理一些生活难题,比如家庭纠纷、情感问题等。 上个星期就流传一张 ChatGPT 帮人解答「妻子气恼丈夫嫌圣诞树太贵不买」的截图,ChatGPT 先拉架,说有事好商量千万不要情绪化,再给出解决方案——要么俩人自己动手做一个圣诞树,惠而不费;要么出门旅行,就不用在家死磕圣诞树的贵贱。 这个套路完全符合心理学理论:安抚情绪,站在说话人一边,然后理性地给出一些切实可行的办法。从这个角度看,ChatGPT 堪比最贴心的可爱朋友。 「圣诞」是十二月份的高频问题。Shopify 高管辛西娅·萨瓦德就对 ChatGPT「破防」了。ChatGPT 帮她给儿子解释圣诞老人:「我写信是为了让你知道,我不是一个真实的人,而是一个你父母出于爱告诉你的故事的角色。」 「你的父母给你讲了关于我和我的精灵的故事,以此给你的童年带来欢乐和魔法。他们希望你相信其中蕴含的精神和假日的魔力。」 文中充满感情地写道,「父母对你的爱和关心是真实的。他们为你创造了美好的回忆和传统,希望你的童年变得特别。」 两则「圣诞」的故事,实际上突显了 ChatGPT 作为新一代「聊天生成预训练转换器」的真正能力:尽量全面、得体、有信息量地像人类一样,回答人类提出的问题。 顺着人类心思作答 ChatGPT 来自 OpenAI...
ChatGPT能否取代人类写作?这股潮流背后隐藏的秘密与挑战
AI与地理

ChatGPT能否取代人类写作?这股潮流背后隐藏的秘密与挑战

九派新闻评论员 歇山 经过多年迭代升级,人工智能终于成精了。 最近,聊天机器人ChatGPT横空出世,各路诸侯八方豪杰纷纷与之展开对话。上至天文地理,下至投资理财,诸如美联储将何时将停止加息?如何在一年内通过法考?人工智能会不会谈恋爱?ChatGPT不慌不乱,一一作答,答得有鼻子有眼。 ChatGPT的神奇不止于此。据说摸出门道的美国学生们,已经开始使用ChatGPT生成论文,得到了A+的分数。这款聊天机器人是人工智能技术驱动的自然语言处理工具,能够像真正的人类一样聊天对话,还能完成撰写邮件、视频脚本、文案、翻译、代码等任务。由于ChatGPT的泛滥,美国很多大学已经打响了ChatGPT反击战——重设课程,提前预防。 ChatGPT写作确实厉害,日前,以色列总统艾萨克·赫尔佐格为网络安全会议“2023特拉维夫全球网络技术”录制了“特别开幕致辞”,他在2万名观众面前透露,开场白是由ChatGPT撰写的,第一句话是:“能成为一个拥有如此充满活力和创新力的高科技产业的国家总统,我真的很自豪”。 为了验证ChatGPT写作能力,我们也测试了一下,全文如下: 这篇“故事”,结构完整,用词妥帖,有主题,有意境,如果作为一篇课堂作文来评判,分数恐怕不低。 但是,当我们把这则“故事”仔细掰扯一下,总感觉哪里不对劲。这篇看似完整华丽的文章,其实是堆砌辞藻的“假大空”,读着读着,竟读出了一种负心汉套路满满说情话的感觉——信手拈来的遣词造句背后,是言之无物的美好,是空洞洞的情感。 ChatGPT正是妥妥的“话术大师”。我们把互联网平台各种ChatGPT问答拿来看看,形式上多是“首先”“其次”“然后”,结构上多是清晰的总论分论,逻辑上是有条有理,加上海量的资讯、知识、语言的加持,ChatGPT完全可以冒充人类了。但正如OpenAI的联合创始人埃隆·马斯克推文所称:“许多人陷入了疯狂的ChatGPT循环中”。虎嗅APP的用户们说得更直接:我们问了ChatGPT 100个问题,它说了不少废话。 冒充人类作者的ChatGPT,更像是人类的一面镜子。在ChatGPT面前,那些套路满满的话术,那些四平八稳的场面话,那些拼辞藻、拼华丽的假大空,就此无处遁形了。 语言学家乔姆斯基谈ChatGPT:它的出现将检测论文的抄袭行为变得更加困难 未来的ChatGPT可以代替我们,书写那些脱离群众、食之无味的机关八股文。机关八股文,开会首先必须是“意义重大”,反映成绩必然是“一二三四五”“五四三二一”,务实的工作、有效的办法可能一个没有,但捏造的概念、捡来的网言网语必然是一套又一套。这样的机关八股文,是从材料堆里做文章,而不是从问题堆里找思路,远离了社会发展形势与群众急难愁盼,徒留下语言的形式主义,今后这类八股又怎敌得过能写诗会谈心的“端水大师”ChatGPT? 未来的ChatGPT可以手把手教我们的孩子,写作那些套路满满的“满分作文”。各种“满分作文”书籍中,是否随处可见这样的文辞?“我顿时感到,浑身的血在沸腾、在燃烧,窗外的雨仍在不停的下着,淅淅沥沥的。正是那位盲人的纯真善良,时刻教育我、提醒我,对于身边的任何人有困难向我求助时,我都会毫不犹豫的伸出热情的双手去帮助,就像弟子规中所言:‘人之初,性本善’。”——如何写作“满分作文”?记叙文要交待时间、地点、人物,议论文要多加入些“老子说”“庄子云”,结构要总分总,主题要大汗淋漓地升华……这么多的套路,无非是教育我们的孩子完美避开忠诚表达、真情表达,这些技巧与套路又怎敌得过算法精密而语言库无限的ChatGPT呢? 未来的ChatGPT也可以发布那些没有情感和温度的“通报”“通告”“提醒”。关乎公共利益的那些公文,用于告知重要情况,起着沟通情况的作用,但如果总是板着冷静的、格式化的面孔,说着一些没有担当的言语,那么这些工作何妨不交给ChatGPT?我们这个社会,有太多的“写作手法”教育我们如何“去人格化”,仿佛一旦进入职业与公务的状态,人的鲜活必须让位于机器般的“客观理性”。这些时候,其实是人在扮演聊天机器人的角色,而聊天机器人兴许还能更多一些虚假的热血与温情。 “强大到危险”的ChatGPT能取代人类吗? 也许能取代人类的许多方面。但“算法”原本是人类心灵的产物。进入智能时代,“生命的重与轻”“自由与公平的关系”“社会治理有没有最优选择”?这些先哲们思考的古老命题,正在智能时代呈现出新的表达方式。ChatGPT真正能取代的,恐怕是那些只会操持套路满满的“正确的废话”的人。未来,那些并非发自内心的浮夸文辞,那些不切实际的表达,倒真的可以交给ChatGPT了吧。 九派评论投稿邮箱:pinglun@jp.jiupainews.com