硬刚ChatGPT!百度大语言模型“文心一言”正式发布!
AI与英语

硬刚ChatGPT!百度大语言模型“文心一言”正式发布!

3月16日14:00,百度创始人、董事长兼CEO李彦宏亲自坐镇,通过线上直播的形式发布了旗下新一代大语言模型文心一言(Ernie)。 继昨日凌晨GPT-4发布之后,百度紧急预告了文心一言的发布。作为国内第一个面向大众群体的大语言模型,文心一言被人们寄予了厚望,甚至出现了其将成为中国AI新旧时代划分里程碑的判断。 但其实在此之前,百度的“文心”阵营早已成型,涵盖文心大模型、工具与平台、产品与社区三个层级,本次发布的文心一言,即是产品与社区中的一员,与之前发布的文心一格(AI艺术和创意辅助平台)等产品是兄弟关系。 被寄予万千期待的“中国版ChatGPT”文心一言到底表现如何,今天的发布会终于为我们揭晓答案。 01 文心一言的五大能力 在李彦宏演讲环节,首先公布了文心一言的五大能力,即文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。 1、文学创作 在文学创作能力方面,李彦宏向文心一言提出几个问题(提前录制好的演示视频):包括《三体》的作者是哪里人、从哪些角度可以续写《三体》、如何从哲学角度续写,演员张鲁一和于和伟的身高对比等。 在演示中,文心一言准确地回答了《三体》作者的籍贯,并列出4个可以续写的方向,甚至从哲学角度给出了续写《三体》的几个梗概方向。 李彦宏表示,这几轮问答体现出文心一言总结分析、推理能力,对于一个生成式大模型来说,能把这些问题都答对并不容易,文心一言可以相对保证事实性的内容比较准确。 2、商业文案创作 对于很多人关心的文心一言在商业内容的生产力方面,百度展示了文心一言生成公司名称、slogan、新闻稿三方面的能力。可以看出,文心一言在中文语境下面对商业问题的处理,确实有望与GPT-4一决高下。 3、数理逻辑推算 这一环节,李彦宏提出了经典的“鸡兔同笼”问题,这也是早期导致ChatGPT“翻车”的问题之一。 但在演示中,文心一言确实表现出了强大的数理计算和推理能力。第一次提问故意把题目出错,文心一言发现算不出来时,会提示“是不是题出错了?”并在题目更正后给出了正确答案。 不仅知道题对不对,也不仅给出答案,文心一言还给出了详细的解题步骤,很像真实的学生解题过程。李彦宏表示,在百度过去的内测中,虽然还不能百分百保证把题目做对,但能看到能力一直在进步。 4、中文理解 作为中文互联网界的搜索引擎大厂,百度对中文的理解远超其他互联网企业,李彦宏也表示:“文心一言对中文的理解应该超出世界上任何一个大模型。” 这一环节,李彦宏分别让文心一言对成语“洛阳纸贵”做出解释、告诉用户洛阳的纸到底有多贵,分析其经济学原理,并用“洛阳纸贵”写一首藏头诗。文心一言均做出了比较完美的回答。 5、多模态生成 在文心一言发布会的前一日GPT-4刚刚发布,并凭借对图片的多模态处理能力狠赚了一波眼球,好在,文心一言在发布之初就要具备这项能力了。 演示环节中分别让文心一言根据图片生成一张海报,一段视频,并将一段文字用四川话“读”了出来。 图片生成的能力虽不如GPT-4惊艳,但现阶段能做到如此程度已实属优秀。视频能力则是意外之喜,相信会解放很多视频内容工作者的生产力。 可惜的是,李彦宏表示生成视频因计算成本较高,暂未开放,但百家号的创作者,每天有几万篇的视频内容,其实已经在用这个技术在进行创作和分发。 对这五大能力,李彦宏强调:从对文心一言的体验看,其已经具备了一部分人类的理解能力,并在不断完善之中,在使用时会惊喜,会发生错误,但可以肯定的是,它的进步速度很快。 在介绍产品之后,李彦宏还解释了文心一言是怎么做出来的,以及百度在AI时代的独特优势。 李彦宏称,进入AI时代后,IT技术栈从三层变为四层,芯片层从CPU变为GPU,文心一言处于模型层,AI时代的应用,会基于大模型进行开发,之后不管是搜索、聊天还是其他,都会基于预训练大模型进行开发。百度每天有数十亿的问答,文心一言之后也会在这个量级,生成式AI非常耗费算力,费用相当昂贵,但四层架构之间相互进行协同,优化,可以使效率比别人高很多,并降低成本。框架层的协同已经让百度在过去几个月的测试期间享受到了效率的收益。 在全球范围内,在四个层级都拥有领先产品的,百度是世界唯一,这将大大支持文心一言的迭代速度。 02 中国需要有自己的GPT 很多人在发布会前会问一个问题:百度版的ChatGPT为什么现在发布?李彦宏的回答是:因为客户需要。百度深耕国内市场多年,积累了众多B端客户,据百度所说,其中相当多的客户希望百度能尽快发布文心一言。 在这之外,李彦宏也在发布会现场表示,文心一言其实在19年就发布了,每年也都会发布新版本,但现在因为ChatGPT和GPT-4的发布,用户心理预期是要对标GPT-4的,这直接拉高了技术门槛。百度是全世界大型互联网企业中第一个发布大语言模型的,微软是直接调用GPT,谷歌,Meta等并没有发布。 虽然能明显看出,发布会上的李彦宏希望尽量降低用户预期,并反复强调文心一言发布后会不断、快速的进步,但市场似乎并不买账,截至发稿时,百度的股价已闪崩9%,用户的关注度也并没有放在文心一言产品本身上,而是在关注李彦宏的紧张和颤音、全程没有实际体验,以及需要邀请码才能体验的机制上。 但正如李彦宏所说,文心一言不是中美对抗的工具,而是百度一代代技术人员追求的结果,是服务亿万客户的最新平台,更是创新驱动发展的证明。文心一言十月怀胎,一朝分娩,作为用户,可能也需要给文心一言、给百度,足够的时间。 彩蛋: 文心一言的英文名叫“Ernie”,取自美国公共广播协会制作播出的儿童教育电视节目《芝麻街》,之所以取这个名字,是因为百度老冤家谷歌的自然语言模型“Bert”同样来自于《芝麻街》,多少有些“相爱相杀”的味道。 作者:鹤山 排版:骆伟玲 图片源于Q仔互联网冲浪所得,若有侵权,后台联系,Q仔滑跪删除~ 清博智能旗下的产品大多数开放免费试用权限,想体验我们的产品,欢迎扫码咨询~ 当然,对咱们的文章有兴趣或者有意见的朋友也可以扫码勾搭Q仔哦~
《NLEP打破大模型推理难题:人工智能新视野》
AI与化学

《NLEP打破大模型推理难题:人工智能新视野》

这篇文章介绍了 NLEP 可以突破大模型推理瓶颈,由麻省理工学院的罗鸿胤博士后研究员撰写。文章指出,虽然大语言模型在处理非结构化信息和生成文本方面表现出色,但其推理能力仍存在局限性,尤其是对于需要执行准确、可控的复杂推理任务时。作者认为,符号主义 AI 有潜力替代经验主义,但在实现这一目标之前,仍需解决 AI 模型行为和规律的研究问题。
谷歌DeepMind创始人提出通用人工智能分级,ChatGPT只是初级澎湃新闻2023-11-09 08:21澎湃新闻2023-11-09 08:21
AI与化学

谷歌DeepMind创始人提出通用人工智能分级,ChatGPT只是初级澎湃新闻2023-11-09 08:21澎湃新闻2023-11-09 08:21

·“我们希望提供一个共通的语言,用于比较模型、评估风险,以及衡量我们在通往AGI的道路上行进到了什么阶段。” ·最高级别的超级智能AGI系统可能能够执行原本人类完全不可能执行的任务,如通过分析大脑信号来解码思想、通过分析大量数据来做出高质量预测,以及与动物交流。 谷歌DeepMind联合创始人谢恩·莱格(Shane Legg)带领的DeepMind研究团队发布论文。 当地时间11月4日,谷歌DeepMind联合创始人谢恩·莱格(Shane Legg)带领的DeepMind研究团队发布论文(Levels of AGI: Operationalizing Progress on the Path to AGI),提出了对通用人工智能(AGI)的更清晰定义,制定了类似于自动驾驶L1-L5级别的AGI分级分类框架。 长期以来,AGI都是一个含义模糊的概念,粗略可以将其理解为“和人类差不多聪明”。研究团队在论文中写道,“我们希望提供一个共通的语言,用于比较模型、评估风险,以及衡量我们在通往AGI的道路上行进到了什么阶段。” AGI六大定义原则 研究团队没有用一句话概括AGI,而是提出,任何对AGI的定义都应满足六条原则: 关注能力,而非过程。也就是说关注AGI可以完成什么,而不是完成任务的机制。这种将关注焦点放在能力上的方式,使我们能够将一些内容排除在对AGI的要求之外,比如实现AGI并不意味着智能体以类似人类的方式思考或理解,或实现AGI并不意味着智能体具备意识或感知(具有情感的能力),因为这些特质不仅侧重于过程,而且目前无法通过公认的科学方法来衡量。 关注通用性和性能。研究团队认为,通用性和性能是AGI的关键组成部分。 关注认知和元认知任务。大多数对AGI的定义侧重于认知任务,可以理解为非物理任务。尽管目前机器人技术取得了一些进展,但与非物理能力相比,AI系统的物理能力似乎滞后了。执行物理任务的能力确实增加了智能体的通用性,但我们认为这不应被视为实现AGI必要的先决条件。另一方面,元认知能力(例如学习新任务的能力或知道何时向人类请求澄清或协助的能力)是智能体实现通用性的关键先决条件。 关注潜力,而非部署。证明系统能够以一定性能水平执行一组必要任务,应该足以宣布该系统为AGI,在现实世界部署这样的系统,不应该成为AGI定义的固有要求。 关注生态效度(Ecological Validity)。我们希望强调,选择与人们在现实世界(即生态有效)所重视的任务相一致的任务非常重要。 关注通往AGI的路径,而不是单一的终点。研究团队提出AGI的五级分类,每个AGI级别都与一组明确的度量/基准相关联,以及每个级别都引入已识别的风险和人机交互范式的变化,比如OpenAI提出的劳动替代定义就更符合“大师AGI”。 AGI五级分类 基于能力深度(性能)和广度(通用性)将AGI分类为:非AI、初级、中级、专家、大师、超级智能。 基于能力深度(性能)和广度(通用性),该研究将AGI分类为:非AI、初级、中级、专家、大师、超级智能。单个系统可能横跨分类法中的不同级别,截至2023年9月,前沿语言模型如OpenAI的ChatGPT、谷歌的Bard、Meta的Llama 2在某些任务上(如短篇论文写作、简单编码)表现出能力娴熟的“中级”性能水平,但在大多数任务上(如数学能力、涉及事实性的任务)仍处于“初级”性能水平。 研究团队认为,总的来说,当前的前沿语言模型会被视为第1级通用AI,即“初级AGI”,直到其性能水平在更广泛的任务集上提高,满足第2级通用AI(“能力娴熟AGI”)的标准。 同时,研究团队提醒道,获得特定认知领域的更强技能,可能对AI安全产生严重影响,如在掌握强大的伦理推理技能之前获得强大的化学工程知识可能是一种危险的组合。还要注意,性能或通用性级别之间的进展速度可能是非线性的。获得学习新技能的能力可能会加速通往下一个级别的进程。 在性能和通用性的综合方面,分级中的最高级别是ASI(人工超级智能)。研究团队将“超级智能”性能定义为超过100%的人类。例如,研究团队假定AlphaFold是分类法中的第5级“限定领域超人AI”,因为它在一个任务(从氨基酸序列预测蛋白质的三维结构)上的表现高于全球顶级科学家的水平。这个定义意味着第5级通用AI(ASI)系统将能够以没有人类能够匹敌的水平执行各种任务。 此外,这个框架还意味着这样的“超人系统”可能能够执行比AGI低级别更广泛的任务,可以理解为其能够实现原本人类完全不可能执行的任务。ASI可能具有的非人类技能可能包括神经界面(通过分析大脑信号来解码思想的机制)、神谕能力(通过分析大量数据来做出高质量预测的机制),以及与动物交流的能力(通过分析它们的声音、脑电波或肢体语言的模式等机制)。 10月底,莱格在接受科技播客采访时表示,他仍然坚持2011年就曾公开发表的观点——研究人员有50%的可能在2028年实现AGI。那么这具体指的是哪一个级别?目前他还没有明确的阐释。 (本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP) 举报/反馈
超速走红的ChatGPT,为什么可能重构我们?
AI与化学

超速走红的ChatGPT,为什么可能重构我们?

最近的ChatGPT段子满天飞,以至于,不聊ChatGPT咱都不好意思在社交媒体上发言了。这种力度的出圈,各种长期离线好友,甚至我妈都来问我,这是啥玩意啊?“十年老友,不请自来”?这架势,着实让咱们科技圈的人小小得意了一波。给还不了解的人简单说一下,ChatGPT 表面上是OpenAI公司开发出来的一个平平无奇的问答机器人,类似一个文字版siri。但是当你和它深入聊天以后,就会发现它就是一个“终结者”!上知天文,下会做数学题,编程、分析、模仿老胡体。大家都说,ChatGPT要改变人工智能格局。而且当这把火在烧到才华横溢的中国网民身边时,ChatGPT 的段子也变得魔幻起来。。因为ChatGPT是不对大陆地区直接开放的,有些人就弄了个接口,直接做起了ChatGPT的二道贩子,把免费的ChatGPT回答搬到微信上,愣是能日入十几万,啥叫一本万利啊?与此同时,快人一步的资本市场更是群魔乱舞。像濒临破产的寺库、喜羊羊的IP公司奥飞娱乐、随便发个新闻股票起飞。前两天甚至连知乎也被炒了起来,真就分享ChatGPT新编的故事是吧。。短短两个月,ChatGPT,已经成为了互联网语境里的一次巨浪。实话实说,差评君两个月前第一次使用 ChatGPT,也被震撼到了。这是我让ChatGPT编写帮我写一个Excel的vba,干脆利索,比隔壁被誉为 Excel 神之手的托尼都快了不止一倍,它甚至帮我写了注释T_T。而类似的震撼带来的分享欲,让ChatGPT的出圈和各行各业的人形成了剧烈的化学反应。不出意外,ChatGPT迅速成为全球月活最快破亿的消费应用。不过,震撼过后,好奇与恐惧可能是大多数人更需要面对的东西。据外媒的报道,ChatGPT先是通过了年薪18W美金的谷歌L3级程序员岗位,又是通过了沃顿商学院MBA、美国执业医师资格考试。国内也有银行表示 ChatGPT 写代码又快又好,你要说这领导没点啥想法我是万万不信的。不少媒体已经开始渲染 ChatGPT 最有可能要取代的十类人。第一个就是技术类工作,譬如程序员,要是真的话,属实是我杀死我自己了,接下来的也没好哪儿去;第二个就是媒体类工作,好在 ChatGPT 不能做视频,否则我岂不是原地失业;后面还有什么律师、老师、金融分析师……客服、会计、平面设计师……好吧,再盘下去我只能回家卖煎饼果子了。一个似乎能全面代替人类的软件,还不要工资?这谁遇上,不怀疑人生啊?那么,ChatGPT 真的会取代我们工作么??作为普通人,又能不能抓住这样的风口呢?这一次,就让我们就来把ChatGPT给说清楚。首先,我们最应该搞清楚的就是,这个ChatGPT相对于以前的AI,最大的不同是什么?说白了,其实是ChatGPT远超过其他AI的表现。与大家在生活中用到的各类智能音箱和“人工智障“不同。对同样的问题,用谷歌搜、问AI语音助手,感觉好像只是在匹配带有关键词的图文。就像今天我们后期正在讨论的怎么画“正弦曲线”,我直接搜索 “在 After Effects 中如何让一条直线变成正弦曲线?”。谷歌这个答案不能说毫不相关,也得说费劲巴拉,Siri则直接给我推了网页,行吧,帮忙省了打字。但是同样的问题问ChatGPT,直接步骤都给你列出来。(看得我当场就把后期给开了)不过幸亏里面那个公式有问题。(后期大大的饭碗暂时还是稳的)不过,明眼人都能看出来,ChatGPT这种才真的是在进行“问答”,哪怕遇到了一些网上没有直接答案的问题,它也会通过消化各种其他有用的信息,来总结出一个相对靠谱方案。所以,总结一下,ChatGPT的优势至少有四点。第一、知道你在说啥(直达用户需求)第二,对话(能够同时满足多个、不同层次的需求)第三,回答真的对我有用(回答是整体、可操作性的,甚至能省去许多人工)第四,有趣(展现了一些偏人性的东西)这不就是搜索引擎巨头们发展了数十年,却一直求而不得的东西嘛。也不怪得谷歌、百度们火大,要不是因为 ChatGPT 还有不少缺点,这一代搜索引擎都该原地退休了。大家就看这几天谷歌、百度、阿里们这几天的新闻,就知道他们内部有多急了。所以问题来了,ChatGPT怎么就一跃成了这么聪明的AI呢?ChatGPT给了我一个答案。有点复杂,显然我的饭碗暂时保住了。我来概括补充一下:大意就是:现在的AI应用,包括ChatGPT,以及谷歌刚刚翻车的Bert,都是类似的。一来,都是基于自然语言模型,增加程度对于人类语言的学习翻译能力,帮助理解文字。二来,通过RLHF模型,一种从人类的反馈中强化学习的机制,使得ai说话变得好听(类似于大数据的猜你喜欢)据说 OpenAI 这一套其实很多大厂都研究过,原理大家都懂,只不过没往这个方向去实践。比如,谷歌的一位工程师曾表示:像 GPT 这样的大型语言模型是谷歌主要研究的领域之一。但是显然谷歌认为,在最大的产品( 如搜索、Gmail )中实际使用这些语言模型的经济性还不太成熟。说白了,就是谷歌感觉不太赚钱。所以,当非盈利性的公司OpenAI,在模型上壕无人性地投入之后,惊喜地发现,AI模型竟然发生了质变。研究表明:在学习效率和可靠性上,大约在 10 亿参数( 10^9 )之后的大模型都会出现飞跃式的提升。而此时OpenAI 的模型足足拥有 1750 亿个参数,吊打同时期,谷歌推出的语言模型的130 亿个参数。这个版本强化的优势,再加上ChatGPT 先发制人,OpenAI一跃成为AI圈最靓的仔。而且,据说这些人工智能还能持续优化,随着咱们问的越多,就能给出更受欢迎的答案,更智能。这么一想,让 ChatGPT 为代表的 AI 们继续修炼下去,会不会成精并且毁灭世界不好说。。。但咱们身边的不少玩意儿,多半是会发生些天翻地覆的变化的。不说别的,光它能给生产力工具附魔这一功能,就够顶的了。比如,被说烂了的搜索引擎,就能借着 AI 来一波“啵灵啵灵”的华丽升级。毕竟, ChatGPT 不是已经有了一定的资料整合能力吗?所以变身后的形态,大概就和必应今天的实例那样,把传统引擎的结果和AI生成的内容一同给你。之后呢,甚至还有可能让 AI 联动 Office 全家桶,让它根据搜索资料搞个...