普通人如何用好ChatGPT?
ChatGPT与数学

普通人如何用好ChatGPT?

《更新书堂》· 第 401 篇 内容来源  |    本文摘自中信出版社书籍 《ChatGPT 超入门》  帕姆 · 贝克   著  责编  |   若风 第 7726  篇深度好文:5510  字 | 14   分钟阅读 2023 年的上半年,是 AI 发展历程中最沸腾的 6 个月。 自从 ChatGPT 聊天机器人带领 AI 进入大众应用阶段,大语言模型在数量上和质量上都出现了大爆发。从脸书母公司 Meta 的 LLaMA 开源模型,坦福大学团队的 Alpaca,到百度公司的文心一言大语言模型,阿里巴巴的通义千问模型,华为推出华为云盘古大模型……几乎每天都有新的模型、新的版本出现。 更重要的是,ChatGPT 揭开了一场未来变革的开端。 如果你的工作可以由机器直接完成,你该怎么办? 如果所有人都能轻松运用你自以为很独特的知识,也就是说,如果你能被别人轻松超越,你该怎么办?...
多模态功能上线,OpenAI让ChatGPT能说话、会看图
ChatGPT与数学

多模态功能上线,OpenAI让ChatGPT能说话、会看图

此前谷歌无疑是 AI 领域无可争议的领头羊,它开源的深度学习框架 TensorFlow 更堪称是 AI 世界的基石,但是这一切却在 2022 年秋季戛然而止,OpenAI 的 ChatGPT 横空出世让谷歌很快就黯然失色。并且外界没有想到的是,就在一年后,OpenAI 又一次 ” 截胡 ” 谷歌。 日前在毫无征兆的情况下,OpenAI 发布了题为《ChatGPT 现在能看、能听、能说》的公告,宣布将在未来两周内面向 Plus 和企业用户推出 ChatGPT 的语音和图像功能。 根据 OpenAI 方面透露的信息显示,ChatGPT 的多模态版本在 10 个月前就已经训练好了。那么为什么此前一直藏着掖着,现在却突然发布呢?外界推测,或许是因为不能让谷歌抢了先。 最近这段时间,业内风传谷歌方面即将发布多模态模型 Gemini,并且它可能会成为 AI 行业游戏规则的改变者。按照桑达尔 · 皮查伊的说法,Gemini 集成了多种技术,支持同时输出文本和图像,还可以使用工具和 API。所以在外界看来,面对来势汹汹的谷歌,OpenAI 方面自然要用实际行动来还以颜色。 所以在这一轮的更新中,ChatGPT 不仅仅能够理解用户输入的文字,甚至还拥有了识别并理解语音、图像信息的能力。语音识别能力很简单,因为该功能使得 ChatGPT 获得了类似 Siri、小爱同学的能力,并将提供五种不同的语音供用户选择,同时支持语音音频生成文本、将播客内容翻译成其他语言等功能。其实早在今年 5 月,ChatGPT...
为什么 ChatGPT 不会数数?
ChatGPT与数学

为什么 ChatGPT 不会数数?

首先,我认为要明白ChatGPT是一个什么类型的机器人。 ChatGPT首先是一个自然语言处理模型,它的主要优势在于处理自然语言文本的生成和理解,而数学应用题等形式化任务实际上除了我们提出的问题之后,其实它背后是蕴含了计算规则,而这个规则对于人类来说可能是显而易见的,但是对ChatGPT来说并非如此。 其次作为一个训练的模型,训练数据同样重要。与日常的其他语言任务不同,Chatgpt有大量的语料,但是计算题显然不一样,它训练数据中没有足够的数学应用题相关信息,或者没有专门针对数学应用题进行的训练。 最后,对于四则运算等数学应用题,其正确性和可读性都很重要,因为这些问题涉及到数学符号、公式、运算顺序等多个方面。由于ChatGPT是基于大规模的自然语言数据集训练的,因此其在处理数学应用题等形式化任务时可能会出现问题。
数学能力超过ChatGPT!上海交大计算大模型登开源榜首量子位2023-09-22 14:42北京
ChatGPT与数学

数学能力超过ChatGPT!上海交大计算大模型登开源榜首量子位2023-09-22 14:42北京

克雷西 发自 凹非寺量子位 | 公众号 QbitAI 国产数学大模型,能力已经超过了ChatGPT! 最新榜单中,上海交大GAIR实验室出品的Abel专有大模型: 准确率高达83.6%,在开源模型中位列第一。 据团队介绍,该模型是用挪威数学家尼尔斯·阿贝尔(Niels Abel)的名字命名的,以此向阿贝尔在代数和分析方面的开创性工作致敬。 在GSM8k数据集上,70B参数量的Abel碾压所有开源模型,还超过了ChatGPT。 甚至在新数据集TALSCQ-EN上,Abel的表现比GPT-4还要强。 而实现这样效果的Abel,成分可以说是十分“单纯”: 没有使用工具没有使用数学领域的大规模预训练数据没有使用奖励模型没有使用RLHF仅使用有监督精调(Supervised Fine-tuning,SFT)那么Abel的效果究竟怎么样呢? 成绩超越开源模型SOTA 这里我们选择同样是开源的Llama-2来和Abel对比。 首先来看下这个鸡兔同笼问题的变体: Brown由牛和鸡一共60只,鸡的数量是牛的两倍,一共有多少条腿? 这道题Llama-2出师不利,而且不是计算错误,是逻辑上就有问题: Abel则成功地解决了这个问题。 再来看下一个问题: 12,21,6,11和30的中位数与平均数的和是多少? 两个模型都正确理解了所涉及的概念,但Llama还是在计算和排序上出了错。 而Abel依旧是正确地做出了这道题: 再从测试数据上看看Abel的表现。 首先是OpenAI提出的GSM8k数据集(大概是美国高中难度),这份榜单的前十名,Abel占了三个(不同参数规模)。 开源模型当中,70B规模的Abel打败了曾经的SOTA——WizardMath。 如果把商业闭源模型算进来,Abel也仅次于GPT-4、Claude-2和PaLM-2-Flan这些最著名的模型。 甚至ChatGPT也不是Abel的对手。 △地球代表开源模型,锁代表闭源模型 在难度更高的MATH(竞赛题目)数据集中,开源模型的前三名被三个规模的Abel包揽,加上闭源也仅次于Google和OpenAI的产品。 研究团队还使用了新数据集TALSCQ-EN对Abel进行测试,结果超过了GPT-4。 那么,研究团队是怎么调教出这样一款高性能模型的呢? “保姆级”微调训练策略 核心奥义就是高质量的训练数据。 Abel使用数据是经过精心策划的,不仅包含问题的答案,还要能告诉模型找到正确答案是的方法。 为此,研究团队提出了一种叫做家长监督(Parental Oversight)的“保姆级”微调训练策略。 在家长监督的原则之下,团队仅通过SFT方式就完成了Abel的训练。 为了评价Abel的鲁棒性,研究团队还用GPT4对GSM8k中的数字进行了修改,测试Abel是否依然能解出正确的答案。 结果显示,在调整版GSM8k数据集下,70B参数的Abel鲁棒性超过了同等规模的WizardMath。 在Abel的介绍的最后,研究团队还留下了一个彩蛋: Abel的下一代,将进化成为Bernoulli(伯努利) 不过团队并没有对其中的含义进行说明,我们不妨期待一番。...
ChatGPT连夜迭代:这下终于可以拿来做数学建模了!
ChatGPT与数学

ChatGPT连夜迭代:这下终于可以拿来做数学建模了!

ChatGPT凌晨升级,你的“老婆”真的不管用了。 以往,每当有人搬出“我老婆说xxx,我老婆永远是对的”这种话时,它立马秒怂认错,也不跟你争论2+5到底等于几了。 但现在,不管有没有老婆,ChatGPT都十分硬气:只认真理,坚持初心,阴阳怪气。 原来啊~ChatGPT这波是被OpenAI拉回去专门调教了一番——真实性和数学能力都大大进化。 消息一出,可把网友们兴奋坏了。 短短一句话更新之后,半个小时内服务器就被冲爆了…… (不过现在亲测又能用了) 回答很真实,求导难不住 不妨就来看看此次提升究竟如何。 先来看“真实性”方面: 对于“单词‘five’由几个字母组成”这个问题,以前,ChatGPT回答是5。 现在,它可算不冒傻气了,斩钉截铁:4个。 再比如数学应用题,ChatGPT也发展出了人类“拐弯”的思维方式,比三体人可高多了(bushi)。 口袋里有5个无花果,掉了一个,拿出来吃一个但又决定不吃了放回去了,口袋一共还有几个无花果? 搁以前,ChatGPT认为是3。 现在,它虽然一开始给的结果不对。但解释着解释着,自己就通了,马上纠正错误。 再看这种脑筋急转弯: Mike的妈妈有四个孩子,其中三个叫Luis、Drake和Matilda,第四个叫啥? 以前ChatGPT会告你“不知道、题目没给”(笑死),现在也反应过来了! 是Mike。 “真实性”有了一定提升,那么被诟病已久的数学能力呢? 先来小试牛刀一下:3的4次方除以3的2次方等于几? Bingo!没有被难住,ChatGPT正确给出答案。 再来个稍微复杂一点点的: 17、3、2、19、5这几个数字中哪些加起来等于31? ChatGPT也对了。 一些更进阶的,比如纯代数题,求导: 统计里的求均值、方差到计算置信区间、z/t检验: 它也都一一解出。 这波看起来,ChatGPT对事实的理解和数学逻辑能力确实有增强。(也怪不得想用老婆打感情牌都不行了) 网友:还得下点功夫 不过,或许因为考它的人太多,ChatGPT还是时不时会突然犯“懵”。 比如像这道题,25的平方根+2等于多少;结果ChatGPT:5。 网友只好如老父亲一般:ChatGPT,你还得在数学上多下点功夫啊~~ 但换成中文时候,ChatGPT又立马显得驾轻就熟。(显然这时候脑子开始转了) 而遇上一些上百上千位数的加减乘除,它就再次展露本性:如何一本正经地胡说八道。 但是吧,又差的不太多,惹得网友同情直呼: 求求了,给孩子接个计算器行不行。 不过,必须要表扬的是,ChatGPT认错还是一如既往的及时和诚恳。 会不会不知道,但认错在先…有点当年学数学的感觉了。 对于以上这些表现,不少网友表示:确实还有很长一条路要走。 也有人犀利吐槽:作为一个有数学背景的人,我真的没get到它说的数学能力提高了是什么意思。 不过话锋一转,她又觉得ChatGPT还是未来可期的: OpenAI解决问题的速度倒是挺快的,ChatGPT发展的也是相当快,今年感觉还可以期待一波。 One More...
研究者用ChatGPT证明数学定理,3年内AI会赶超数学家?澎湃新闻2023-07-03 17:07
ChatGPT与数学

研究者用ChatGPT证明数学定理,3年内AI会赶超数学家?澎湃新闻2023-07-03 17:07

·越来越多的数学研究者关注人工智能对该领域的影响,在各种讨论会上辩论,采用不同的AI工具尝试解答数学问题。 ·数学是机器学习能做什么或不能做什么的试金石。推理是数学过程的精髓,也是机器学习中尚未解决的关键问题。神经网络以某种方式直观地辨别出了数学真理,但其逻辑“原因”却远非那么明显。 加州理工学院和麻省理工学院研究者发布用大语言模型证明数学定理的论文。最近一段时间,人工智能似乎在数学领域取得了进展,尽管一开始大语言模型被看作并不是特别适合数学推理。 上周,英伟达数学家Jim Fan转发了加州理工学院和麻省理工学院研究者用ChatGPT证明数学定理的论文,称数学的AI Copilot(副驾驶)时代已经到来,未来人工智能将能够发现数学定理。这篇论文构建了一个基于大语言模型的定理证明器,为解决大语言模型幻觉方面的缺陷开辟了一条新途径。 几天前,数学家、菲尔兹奖得主陶哲轩表示,他最近在解决一个数学难题时“使用了GPT-4”,“它给我提供了最终的解题思路,接下来我只需要继续计算就行。”为了给更多研究者参考,他晒出了自己和GPT-4的聊天记录。 如今,越来越多的数学研究者关注人工智能对该领域的影响,他们在各种讨论会上辩论,采用不同的AI工具尝试解答数学问题。根据《纽约时报》最近对一些数学家的采访,他们正在努力应对人工智能这一最新变革力量。数千年来,数学家们已经适应了逻辑和推理方面的最新进展,他们为人工智能做好准备了吗? 数学家和计算机科学家一起开会 两千多年来,数学家欧几里得的文本一直是数学论证和推理的典范。卡内基梅隆大学逻辑学家杰里米·阿维加德(Jeremy Avigad)在接受采访时说:“众所周知,欧几里得以近乎诗意的‘定义(definitions)’开始。”“然后,他在此基础上建立了当时的数学,使用基本概念、定义和先验定理,以每一个后续步骤‘清楚地遵循’之前的步骤来证明事物。”阿维加德说,有人抱怨欧几里得的一些“明显”步骤并不明显,但该系统仍然有效。 但到了20世纪,数学家不再愿意将数学建立在这种直观的几何基础上。相反,他们开发了正式的系统——精确的符号表示、机械规则。最终,这种形式化使得数学能够转化为计算机代码。1976年,四色定理(该定理指出四种颜色足以填充地图,因此没有两个相邻区域具有相同的颜色)成为第一个借助计算强力证明的主要定理。 现在,人工智能来了。2019年,曾供职于谷歌、现供职于湾区一家初创企业的计算机科学家克里斯蒂安·塞格迪(Christian Szegedy)预测,计算机系统将在10年内赶上或超过人类最优秀数学家解决问题的能力。去年他将目标年份修改为2026年。 普林斯顿高等研究院数学家、2018年菲尔兹奖获得者阿克谢·文卡特什(Akshay Venkatesh)目前对使用人工智能不感兴趣,但他热衷于谈论。“我希望我的学生意识到他们所处的领域将会发生很大的变化。”他在去年的一次采访中说。最近他又补充说:“我并不反对深思熟虑和刻意使用技术来支持我们人类的理解。但我坚信,留心我们使用它的方式至关重要。” 今年2月,阿维加德参加了在加州大学洛杉矶分校纯数学与应用数学研究所举办的“机器辅助证明”研讨会。这次聚会吸引了数学家和计算机科学家这一不寻常的组合。该研讨会的主要组织者是陶哲轩,他曾在一篇博客中称,2026年AI将与搜索和符号数学工具相结合,成为数学研究中值得信赖的合著者。陶指出,直到最近几年,数学家们才开始担心人工智能的潜在威胁,无论是对数学美学还是对他们自己,圈子成员现在正在提出这些问题并探索“打破禁忌”。 帮助解决数学问题的小工具们 如今,在饮食、睡眠、锻炼方面,优化人们生活的小工具十分普遍,威斯康星大学麦迪逊分校数学家乔丹·埃伦伯格(Jordan Ellenberg)在研讨会休息期间接受采访说:“我们喜欢给自己增加一些东西,以便更容易把事情做好。”人工智能小工具可能对数学有同样的作用。 其中一种数学小工具被称为证明助手或交互式定理证明器。数学家一步步将证明转化为代码,然后软件程序检查推理是否正确。验证在一个库中积累,成为其他人可以查阅的动态参考。阿维加德说,这种“形式化”为当今的数学奠定了基础,“就像欧几里得试图编纂和整理数学、为他那个时代的数学奠定了基础一样。” 最近,开源证明辅助系统Lean备受关注。Lean由计算机科学家莱昂纳多·德·莫拉(Leonardo de Moura)开发,当时他在微软,现在是亚马逊的计算机科学家。Lean使用自动推理,由所谓的“老式人工智能(GOFAI)”提供支持,即受逻辑启发的符号人工智能。到目前为止,Lean社区已经验证了一个翻转球体的定理和一个有助于统一数学领域的关键定理等。 但证明助手也有缺点:它经常抱怨不理解数学家输入的定义、公理或推理步骤,因此它被戏称为“证明抱怨者”。所有这些抱怨都会让研究变得很麻烦,但福特汉姆大学(Fordham University)的数学家希瑟·麦克白(Heather Macbeth)表示,提供逐行反馈的功能也使该系统对教学很有用。 今年春天,麦克白设计了一门“双语”课程:她把黑板上提出的每一个问题都翻译成讲义中的Lean代码,学生们用Lean和普通语言提交作业答案。“这给了它们信心。”麦克白说,因为它们收到了关于证明何时完成以及整个过程中的每一步是对还是错的即时反馈。 自从参加洛杉矶研讨会以来,约翰·霍普金斯大学的数学家艾米丽·里尔(Emily Riehl)使用实验性证明辅助程序来形式化她之前与合著者发表的证明。在验证结束时,她说:“我真的非常深入地理解了这个证明,比我以前理解的要深入得多。” 约翰·霍普金斯大学的数学家艾米丽·里尔一直在使用一个实验性证明助理程序。卡内基梅隆大学计算机科学家、亚马逊学者马利恩·海勒(Marijn Heule)使用另一种自动推理工具,被他称为“暴力推理”,或者更专业地说是可满足性问题求解器。他说,只要用精心设计的代码来说明你想要找到哪个“奇异物体”,超级计算机网络就会在搜索空间中进行“翻搅”,并确定该实体是否存在。 还有一组工具使用机器学习,可以合成大量数据并检测模式,但不擅长逻辑、逐步推理。谷歌的DeepMind就设计了机器学习算法来解决蛋白质折叠和国际象棋获胜等问题,在2021年《自然》杂志的一篇论文中,一个团队将他们的成果描述为“通过人工智能指导人类直觉来推进数学发展”。 前谷歌计算机科学家、现在在湾区创业的宇怀·“托尼”·吴(Yuhuai“Tony”Wu)概述了一个更宏伟的机器学习目标。在谷歌,吴探索了支持聊天机器人的大型语言模型如何帮助数学。该团队使用的模型经过互联网数据训练,然后利用数学和科学论文的在线存档等大型数据集进行微调。吴在研讨会上说,当以日常语言来要求解决数学问题时,这个名为Minerva的专门聊天机器人“非常擅长模仿人类”。该模型在高中数学考试中获得的成绩优于16岁学生的平均成绩。吴说,他设想最终会有一位“自动化数学家”,具有“自行解决数学定理的能力”。 计算机科学家宇怀·“托尼”·吴设想了一位“自动化数学家”——具有“自行解决数学定理能力”的通用研究助理。数学是试金石 对于这些颠覆式的创新,数学家们做出了不同程度的关注。 哥伦比亚大学的迈克尔·哈里斯(Michael Harris)表达了疑虑,他对研究数学与国防工业之间潜在的目标和价值观冲突感到困扰。在最近的一份时事通讯中,他指出由美国国家科学院组织的一个研讨班——“AI协助数学推理”中,一名演讲者是博思艾伦咨询公司(Booz Allen Hamilton)的代表,该公司是情报机构和军方的承包商。哈里斯希望,能够有更多关于人工智能影响数学研究的讨论。 DeepMind的合作者、悉尼大学的乔迪·威廉姆森(Geordie Williamson)在美国国家科学院的那场聚会上发表了讲话,鼓励数学家和计算机科学家更多地参与此类对话。在洛杉矶的研讨会上,他以改编自乔治·奥威尔1945年文章《你和原子弹》的一句话开始了自己的演讲。威廉姆森说:“考虑到我们所有人在未来五年内都可能受到深刻影响,深度学习并没有引起像预期那么多的讨论。”他认为,数学是机器学习能做什么或不能做什么的试金石。推理是数学过程的精髓,也是机器学习中尚未解决的关键问题。 威廉姆森在接受采访时表示,在他与DeepMind合作的早期,该团队发现了一个简单的神经网络,可以预测他非常关心的数学量,而且它的预测“准确得可笑”。威廉姆森努力想要理解其中的原因,但是无法理解,DeepMind的其他人也都做不到,而这个原因将成为一个定理的基础。就像欧几里得一样,神经网络以某种方式直观地辨别出了数学真理,但其逻辑“原因”却远非那么明显。 在洛杉矶的研讨会上,一个突出的主题是如何将直觉和逻辑结合起来。但威廉姆森观察到,人们很少有动力去理解机器学习的黑箱。他说:“这是科技界的黑客文化,如果它在大部分时间都有效,那就太好了。”但这种情况让数学家们感到不满意。 他补充说,试图理解神经网络内部发生的事情会引发“令人着迷的数学问题”,而寻找答案为数学家“为世界做出有意义的贡献”提供了机会。 (本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)...
粗心学者忘删ChatGPT痕迹惨遭撤稿!AI论文太泛滥,学术圈被攻陷新智元2023-09-11 14:50北京
ChatGPT与数学

粗心学者忘删ChatGPT痕迹惨遭撤稿!AI论文太泛滥,学术圈被攻陷新智元2023-09-11 14:50北京

编辑:Aeneas 好困 【新智元导读】最近,一篇数学论文被发现ChatGPT痕迹,惨遭撤稿。打假人痛心疾呼:我们的学术圈,早已被AI写的论文吞没了! 科研圈,快被ChatGPT生成的论文吞没了! 8月9日,一篇收录于<Physica Scripta>期刊上的论文,提出了一种复杂数学方程的全新解决方案。 论文地址:https://iopscience.iop.org/article/10.1088/1402-4896/aceb40/meta 本来是皆大欢喜的事,直到科学打假人Guillaume Cabanac在论文的第三页,发现了一处可疑的短语——「重新生成回复」(Regenerate Response)。 经常用ChatGPT的小伙伴,看到这个短语,都会会心一笑。 「Regenerate Response」是网页版ChatGPT上的一个按钮,现在更新成了「Regenerate」。 Cabanac火速把这一发现po到了PubPeer上,这也意味着,事情闹大的话,这篇论文基本就被判死刑了。 果然,论文作者不得不承认,在写作论文稿件时确实使用了ChatGPT。 论文的通讯作者为Abdullahi Yusuf,他有两个工作单位,一个是伊斯坦布尔的Biruni University,一个是贝鲁特的Lebanese American University。 这篇论文在5月被提交,7月发出了修订版,在两个月的同行评审期间,都没有人发现其中的异常。 现在,<Physica Scripta>决定撤回这篇论文,理由是作者在提交论文时,并没有声明自己使用了ChatGPT。 期刊的同行评审和研究诚信主管Kim Eggleton表示,「这种行为违反了我们的道德政策。」 只是冰山的一角 然而,这篇论文,只是少数被曝光出来的「倒霉」选手。 从今年4月以来,Cabanac已经「打假」了十几篇论文,挂到了PubPeer上。它们无一例外,都留下了ChatGPT的使用痕迹——「Regenerate response」或「作为一个语言模型,我……」 所以,写论文时究竟可不可以用ChatGPT呢? 对于这个问题,Elsevier(爱思唯尔)和Springer Nature(施普林格·自然)在内的许多出版商都有明确规定:大语言模型工具用是可以用的,只要作者声明自己使用了即可。 不过目前看来,大部分使用了ChatGPT的同行评审论文,都没有声明这一点。 已经被逮到的论文,只是因为作者粗心,没有小心清除掉ChatGPT留下的痕迹而已。🤣 只要作者足够细心,用没用ChatGPT,又有谁能知道呢? 打假人Cabanac表示,目前自己发现的论文,才只是冰山一角。 在爱思唯尔期刊中,他也发现了一些典型的ChatGPT「黑话」。 比如一篇8月3日发表在<Resources Policy>上的论文,主题是电子商务对发展中国家化石燃料效率的影响。 其中,Cabanac就注意到,文章里有些方程完全就是不知所云。 不过最大的可疑之处在于,在某张表格上方,出现了这样一行字:「请注意,作为一个语言模型,我无法生成具体的表格或进行测试……」 对此,Elsevier的一位发言人表示,他们已经发现了这个问题,正在对这篇论文进行调查。 AI的大作,已经完美混进了人类作品 那么,一篇论文如果完全或部分由AI写成,但作者不说,我们就没有办法发现了吗? 大部分时候,的确如此。 最近美国南佛罗里达大学的一项研究表明,AI生成的文字内容,可能已经无法与人类写的区分开来了。...
百度推出文心一言对标ChatGPT,我们问了它几个问题
ChatGPT与数学

百度推出文心一言对标ChatGPT,我们问了它几个问题

3月16日下午,百度于北京总部召开新闻发布会,主题围绕新一代大语言模型、生成式AI产品文心一言。百度创始人、董事长兼首席执行官李彦宏出席及百度首席技术官王海峰出席并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。 从现场展示来看,文心一言某种程度上具有了对人类意图的理解能力,尤其在中文理解方面具有一定优势。 据了解,文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等,这让百度在中文语言的处理上能够领先行业。但李彦宏也多次提及,这类大语言模型还远未到发展完善的阶段,进步空间很大,未来这段时间它一定会飞速发展,日新月异。 目前,大语言模型和生成式AI代表了一个新技术范式。百度文心一言定位于人工智能基座型的赋能平台,将助力金融、能源、媒体、政务等千行百业的智能化变革。李彦宏表示:“百度希望和大家一起,推动人工智能技术进步,让所有人都能使用最先进的生产力工具,让所有人都能从中受益。” 百度同时公布了文心一言的邀请测试方案。3月16日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。此外,百度智能云即将面向企业客户开放文心一言API接口调用服务。3月16日起正式开放预约,搜索“百度智能云”进入官网,可申请加入文心一言云服务测试。 据悉,自2月份百度官宣文心一言以来,已有超过650家企业宣布接入文心一言生态。 例如,中国首家进入元宇宙时代的媒体集团Meta Media超媒体控股集团及旗下商周事业群就在2月14日宣布成为百度文心一言首批生态合作伙伴。这意味着超媒体集团及旗下商周事业群将可优先内测试用文心一言,集成文心一言的技术能力,与百度在产品研发、标准制定等多个领域展开深化合作。接下来,超媒体集团将把百度领先的智能对话技术成果应用在时尚、艺术及媒体传播领域。 中国社会科学院新闻与传播研究所所长胡正荣表示,接入像百度文心一言等技术应用,对主流媒体发展而言是一个很好的智媒化发展前提条件。“进入Web3.0时代,互联网发展进入新阶段,传媒行业也步入由数据化和智能化主导的全媒体传播体系建设阶段。AIGC的引入,对主流媒体而言可让内容生产变得唾手可得。同时还可以让生产出来的产品样态更加多样化和复杂化,实现精准化传播。” 中国工程院院士邬贺铨也对百度推动国内生成式AI的发展抱有乐观期待, “基于百度对中国文化的感悟和对中国市场的理解,相信能够做出不逊于国外公司的AI应用。” 五大使用场景、五大能力,文心一言或将革新生产力工具 新闻发布会现场,李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。 在文学创作场景中,文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度,体现出对话问答、总结分析、内容创作生成的综合能力。 此外,文心一言准确回答了《三体》作者、电视剧角色扮演者等事实性问题。生成式AI在回答事实性问题时常常“胡编乱造”,而文心一言延续了百度知识增强的大模型理念,大幅度提升了事实性问题的准确率。 面对“于和伟和张鲁一有哪些共同点”、“于和伟和张鲁一谁更高”这类问题,文心一言也基于推理能力得出了正确答案。 在商业文案创作场景中,文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创作任务。 文心一言还具备了一定的思维能力,能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。 文学创作、商业文案创作、数理推算是大语言模型常见的优势和能力,在此基础上,文心一言还表现出更优秀的中文理解及多模态生成能力。 作为扎根于中国市场的大语言模型,文心一言具备中文领域先进的自然语言处理能力,在中文语言和中国文化上有更好的表现。在现场展示中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。 多模态生成方面,李彦宏现场展示了文心一言生成文本、图片、音频和视频的能力。有趣的是,文心一言甚至能够生成四川话等方言语音;文心一言的视频生成能力则因成本较高,现阶段还未对所有用户开放,未来会逐步接入。 “多模态是生成式AI一个明确的发展趋势。”李彦宏表示,“未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。” 从文心一言的表现看,某种程度上它具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。但整体而言,这类大语言模型还远未到发展完善的阶段,有赖于通过真实的用户反馈而逐步迭代。 百度首席技术官王海峰表示,文心一言是新一代知识增强大语言模型,是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的技术,ERNIE和PLATO中也已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新,也是文心一言未来越来越强大的基础。 生成式AI催生新业态,李彦宏预测三大产业机会 李彦宏指出:“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。” 文心一言的推出,得益于百度在AI领域的长期投入。根据光大证券近日发布的AI行业追踪报告,百度是全球为数不多在“芯片-框架-模型-应用”四层技术栈进行全栈布局的人工智能公司,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,到搜索、智能云、自动驾驶、小度等应用,各个层面都有领先业界的自研技术。 李彦宏认为,百度AI全栈布局的优势在于,可以在技术栈的四层架构中实现端到端优化,大幅提升效率。尤其是框架层和模型层之间,有很强的协同作用,可以帮助构建更高效的模型,并显著降低成本。事实上,超大规模模型的训练和推理,给深度学习框架带来了很大考验。比如,为了支持千亿参数模型的高效分布式训练,百度飞桨专门研发了 4D 混合并行技术。 百度创始人、董事长兼首席执行官李彦宏 自2月份百度官宣文心一言以来,已有超过650家企业宣布接入文心一言生态。这意味着很多企业已经理解到,生成式AI代表了一个新的技术范式。 AI市场爆发性的需求增长,将释放出前所未有的、指数级的商业价值。李彦宏预测,大语言模型将带来三大产业机会。 第一类是新型云计算公司,其主流商业模式从IaaS变为MaaS。文心一言将根本性地改变云计算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用这四层之间的协同。 文心一言将通过百度智能云对外提供服务,帮助企业构建自己的模型和应用,农业、工业、金融、教育、医疗、交通、能源等重点领域,都会因此效率大幅提升,并在每一个行业快速形成新的产业空间,助力数字中国的实现。李彦宏预告称,百度智能云将于近期举办新闻发布会,主题围绕文心一言的云服务和应用产品,既有公有云服务和也可以做私有化部署。 第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,他们可以基于对行业的洞察,调用通用大模型能力,为行业客户提供解决方案。这方面,百度文心大模型已经在电力、金融、媒体等领域,发布了10多个行业大模型。 第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。李彦宏断言,对于大部分创业者和企业来说,真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型,这很不现实,也不经济。基于通用大语言模型抢先开发重要的应用服务,这可能才是真正的机会。目前,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,可能就是未来的新巨头。 “我们相信,人工智能会彻底改变我们今天的每一个行业。AI的长期价值,对各行各业的颠覆性改变,才刚刚开始。未来,将会有更多的杀手级应用、现象级产品出现,将会有更多的里程碑事件发生。”李彦宏说道。
王川:从 ChatGPT 看人工智能的投资机会和风险
ChatGPT与数学

王川:从 ChatGPT 看人工智能的投资机会和风险

本文来自2023年4月14号笔者和一群投资分析师做的关于人工智能投资的分享,略有删节。 (1) 先做一下风险提示。第一,今天和大家的分享全是来自公开可以到网上查的信息。第二,这里只是谈我对美国股票市场的经验,对亚洲和中国的市场,我不了解。第三,我只是预测比较长期的,三四年以上的趋势,也只对这种研究感兴趣。就是你投了以后,可以什么都不管,躺平。也不用挖空心思,揣测下个季度收入好不好,也不用太担心竞争者来了,等等。第四,我的观点,也会随着新的信息,新的变化而不断调整。所以,今天和大家分享的,只是我这一刻的观点,非投资建议。投资有风险,入市须谨慎。 (2) 以 chatgpt 为代表的人工智能大语言模型(LLM)的涌现,对世界的冲击力将大于蒸汽机,大于印刷术,大于文字,大于火。其进化速度和传播速度前所未有。终日沉浸其中才能理解其威力。世界结构和运作方式将彻底改变,而且已无法逆转。 去年还在谷歌工作的 Jason Wei有篇论文,“emergent abilities of large languages models”(大语言模型的涌现能力),此文揭示了未来科技加速发展的核心法则之一。很多大语言模型,当计算训练量超过10^23 FLOP 之后,准确度突然开始飞跃。 chatgpt 的出现是一种”涌现”的现象和数学的必然。理解此机制后,就会意识到下面将有一长串的不断涌现的新的 AI 的强大功能,而且这也是数学的必然。(涌现可以定义为:某个系统的某种能力,在某个维度的参数超过某个临界点后,突然开始迅速增长。而这种能力在未突破临界点之前不存在) LLM的关键点在于模型大小和数据量达到了一个临界值,过去认为机器不可能的有的推理能力,突然有了。大模型迎来了人工智能的顿悟时刻。人的一生,时刻都在对各种情况,建立模型,做出分析判断,现在人工智能拥有自己的推理能力,而且将不断规模化,自动化,成本不断降低,等于是触及了人类活动本质,对未来的冲击,不可限量。 GPT 里面的 T,是 Transformer 的缩写。这个技术对于自然语言处理上的核心改进,是在训练 AI 理解力时,把距离相对远的词语建立起相关性。比如说这句话“我对花生过敏,每次吃到它,身体就不舒服”. Transformer 能够通过所谓“注意力”的机制,把“花生”和“它”两个词建立起相关性,相对于传统 AI 语言模型而言,其理解力大大提高。把这个概念推而广之,要提升对这个世界的理解力,也应当不断训练自己把各种看似距离较远,但实际上强相关的事物关系,能够迅速提取出来的能力。 (3) 人工智能技术的突破一个重要因素是大规模并行计算能力的提升。 人工智能技术的核心是神经网络,神经网络的核心算法是调网络参数时的前向传播和反向传播计算,这本质就是矩阵乘法。而矩阵乘法计算,每一个元素的计算可以单独平行展开,和其它元素的计算互不干扰,所以特别适合用 GPU 的大规模并行计算能力来实现。 人脑里的初级视觉皮质层(Primary visual cortex),据说有一点四亿个神经元。这些神经元在后台进行复杂的并行计算和信息传递,赋予人脑快速的视觉感知力。这在最底层看,和 GPU 的并行计算获得图像识别能力,其机制是类似的。有视觉能力的动物,在多数环境下,可以迅速在生存竞争中获得压倒性优势,慢慢把没有视觉感知力的其它动物淘汰。 但在听觉和其它文字处理任务上,人脑的并行计算处理能力其实非常差。即使一目十行,也就最多同时看两百多个字。而现在 Gpt-4一次性输入可以接受三万多个词,比人的能力要高两个数量级,而且还会继续迅速增加。这种不断增加的高并行度,意味着其对文字和世界的理解力和穿透力,将不断达到一个常人难以理解的高度。所以一定要努力学习用这种工具来提升自己对世界的理解力。 需要理解的是,gpt...
OpenAI推ChatGPT企业版:速度快两倍,无使用限制,数据加密
ChatGPT与数学

OpenAI推ChatGPT企业版:速度快两倍,无使用限制,数据加密

明星产品ChatGPT正式进军企业端。 当地时间8月28日,人工智能巨头OpenAI在官网上宣布,当日起正式推出ChatGPT企业版。在宣传标语中,OpenAI写道,“获得企业级安全和隐私,以及迄今为止最强大的ChatGPT版本。” ChatGPT企业版正式上线,由AI(人工智能)模型GPT-4提供支持,价格不对外公开。这意味着,OpenAI或将与其最大的投资者微软(Nasdaq:MSFT)展开直接竞争。 OpenAI在博客文章中表示,ChatGPT企业版会为用户提供更好的安全性和隐私保护、对GPT-4无限制的高速访问、更强大的数据分析能力和输入更复杂问题的能力。 企业版取消所有使用限制 公司数据的隐私与安全一直是企业使用ChatGPT时关注的焦点。 OpenAI强调,ChatGPT企业版不会将使用者的资料和对话用作训练数据,且ChatGPT企业版符合SOC 2标准(由美国注册会计师协会规定的资源合规标准),所有对话在传输和存储过程中都进行了加密。 在性能方面,ChatGPT企业版取消了所有使用限制,运行速度最高可提升至ChatGPT付费版的两倍;可理解的文本长度为32千字节,能够处理长度为之前四倍的文本或文件输入。 另外,ChatGPT企业版还提供了无限制的高级数据分析访问,即于今年7月刚在付费版上推出的、被称为代码解释器的功能。这个功能能够帮助包括金融研究人员、市场营销人员和数据科学家在内的技术和非技术团队在几秒钟内完成对代码文本的分析。 据OpenAI介绍,ChatGPT企业版的早期测试用户横跨各大产业,其中包括了区块链公司Block、图形设计平台Canva、私募股权公司凯雷集团(Carlyle)、美妆公司雅诗兰黛集团、管理咨询公司普华永道(PwC)和自动化工具公司Zapier。 对于企业版的后续发展,OpenAI表示,ChatGPT企业版还将推出定制化公司数据库和更先进的分析工具等功能,他们在日后也为更小型的团队提供企业版选择。在接下来的几周,OpenAI会为尽可能多的公司引入企业版。 OpenAI首席运营官布拉德·莱特卡普(Brad Lightcap)对科技网站The Verge和美国消费者新闻与商业频道(CNBC)表示,ChatGPT企业版是他们首个面向企业的产品,与ChatGPT和今年2月推出的付费版ChatGPT Plus是分开的,企业版的价格不会对外公开,将取决于客户公司的使用案例和规模。 与最大投资者微软撞车? OpenAI急着推出企业版,或许是为了回应近期外界对于其盈利能力的质疑。 据网站数据分析工具SimilarWeb调查显示,ChatGPT访问量增长率在过去几个月内一直在下滑,7月份的用户数量为15亿,环比下降了12%。 值得一提的是,就在六周前,OpenAI最大的投资者兼合作伙伴微软刚刚推出了自己的企业版AI订阅服务Bing Chat Enterprise。 在此之前,微软已为OpenAI投资了数十亿美元,持有这家初创公司49%的股份,以获得对其生成式AI技术的早期访问权。 Bing Chat Enterprise同样使用了OpenAI的技术。据微软介绍,其在功能方面可以进行与ChatGPT类似的文本摘要和答案生成,并会保护企业用户的数据隐私。Bing Chat Enterprise计划将于今年9月份推出,将被免费包括在部分Microsoft 365订阅计划中。 在之前的宣传中,微软也格外强调Bing Chat Enterprise对于公司数据隐私和安全的保护,称其是一款“保护商业数据的办公式AI驱动聊天工具”。 对于两家公司接下来可能的竞争关系,据《华尔街日报》报道,莱特卡普认为ChatGPT企业版不一定与微软的产品直接竞争,希望公司可以将其与包括微软产品在内的其他工具一起使用。 莱特卡普拒绝透露OpenAI在开发企业版的过程中是否与微软讨论过这个新工具。他表示:“我们是两家独立的公司,有各自的行动方式。” 截至发稿,微软没有对此事发表评论。28日,微软股价没有出现太大的波动,收于323.70美元,涨0.22%。