百度能搞好ChatGPT吗?
AI与地理

百度能搞好ChatGPT吗?

作者 | 董温淑 编辑 | 董雨晴 在ChatGPT掀起聊天机器人全民热潮之后,来自大洋两岸的搜索巨头们不得不躬身入局。 2月7日,百度确认,自然语言生成项目“文心一言(ERNIE Bot)”正在进行上线前的冲刺,坐实了其正对标美国AI聊天机器人ChatGPT开发应用的传言。一位接近百度的人士对市界表示,“百度在相关技术层面有积累,比如文心大模型,有望最先开发出此类产品。” 同一天,谷歌宣布将在未来几周推出实验性对话式AI(人工智能)模型Bard。此前在一月份,谷歌还宣布其子公司DeepMind的聊天机器人Sparrow可能会在晚些时候进入测试阶段。 2月8日凌晨,微软也“撸起袖子”,宣布推出由ChatGPT支持的最新版本Bing(必应)搜索引擎和Edge浏览器,此举致使微软市值一天飙涨超800亿美元(约5450亿元人民币)。 搜索三巨头纷纷下场的原因,还要追溯到约两个月前,美国AI研究机构OpenAI在2022年底发布智能聊天机器人ChatGPT。该应用堪称史上最会聊天的AI应用,能够提供流畅、贴合语境的沟通体验,且推出仅5天,用户数就突破100万。瑞银集团的一份报告推测,截至1月末,ChatGPT的月活用户已经突破了 1 亿。 大洋彼岸的ChatGPT爆火,让百度“坐不住”了。百度表示,文心一言预计将于3月份完成内测,而且按照谷歌和微软的节奏,开放内测时间还有可能提前。消息放出后,2月7日百度集团港股股价大涨15.33%。 “上火”的也不仅仅是搜索玩家。目前,奢侈品电商寺库已宣布将引入ChatGPT。相关概念股连续多日上涨,多支涨幅在10%以上,更有部分个股走出了“六连板”的行情。 然而,二级市场燃起的这把熊熊烈火,背后却充满了隐忧。 (百度集团港股股价情况,图源:同花顺) 开年第一爆 ChatGPT能有如此疯的行情,应该说是“久旱逢甘霖”。 根据Gartner曲线,一项新兴技术从萌芽走向市场成熟,还需要经过市场泡沫的产生与破灭。而从2020年开始,业界认为AI产业已经进入泡沫破裂的“死亡之谷”。这样的背景中,ChatGPT的兴起让整个AI产业看到了一丝曙光。 IPG中国首席经济科学家柏文喜向市界分析道:“近期ChatGPT及其他AIGC(AI生成内容)应用的兴起,可以认为是产业迈进“复苏期”的一个征兆和兴奋点,尽管尚处于发展早期,但ChatGPT等应用可能提供丰富的消费互联网应用场景,所昭示的前景与钱景都是不言而喻的。” 《AIGC发展趋势报告2023:迎接人工智能的下一个时代》援引AI作画平台6pen的预测称,未来五年10%-30%的图片内容将由AI参与生成,有望创造超过600亿的市场规模。而据Gartner统计,当前生成式AI占据所有生成数据的比例不到1%,预计到2025年这一占比将达到10%。 与广阔前景相对应的,是丰富的投资机会。 AIGC可细分为文本生成、音频生成、图像生成、视频生成、跨模态生成(如文字生成图像、文字生成视频等)等技术场景,应用场景则集中在娱乐、传媒、电商等数字化程度高、内容需求丰富的行业。此前,人脸美妆、黑白图像上色、电商商品3D模型生成等AIGC应用,已经在许多场景中实现落地。 在ChatGPT为代表的聊天机器人(chatbot)领域,亦有许多科技企业推出面向特定需求的相关应用。比如,微软和亚马逊都曾推出智能个人助理,分别命名为Cortana和Alexa等。 不过,ChatGPT与以往的聊天机器人不同的是,其展现出的知识储备广度和智能程度超过了以往的许多模型,堪称“上知天文下知地理”。 但是,ChatGPT被设计无法连接到互联网,因此目前其“知识库”中储备的信息截至2021年,并不能持续更新。这也被视为未来聊天机器人可以持续改善的一个方向,谷歌最新推出的Bard机器人就被允许联网,接收实时信息。 近期随着ChatGPT热度持续上升,科技巨头相继入局,AIGC概念随之发酵。2月7日,国内智能人机交互企业汉王科技A股触及涨停板,港股美图公司大涨15%。 (AIGC产业链,图源:国海证券) 根据国海证券研报,AIGC产业链可简要分为上游数据供给方;中游AIGC算法及模型研发方;下游基于AIGC的各类内容创作及分发平台环节。AIGC应用不断深化,有望为整条产业链的发展带来利好。 洛克资本投资合伙人马统娟称:“当前,AI行业正处在蓄力等待新风口的时期。在图像识别、语音识别、建模、机器人控制等早期应用领域,第一批企业机构已经形成了现有格局。随着ChatGPT引爆的新热点出现,有利于新的玩家加入,开辟新的赛道。” 有望“干翻”搜索引擎? 如果说ChatGPT为AI产业带来了新的希望,那么对百度代表的搜索引擎巨头来说,希望中还夹杂着一丝发展危机。 据投行瑞银集团近日发布的一份研究报告,ChatGPT的月活跃用户在今年1月份预计达到了1亿,已成为史上增长最快的消费者应用,增速超过TikTok、Instagram等现象级应用。据应用分析公司Sensor Tower的数据,TikTok和Instagram达到1亿月活用户的时间,分别为9个月和两年半。 ChatGPT的快速增长,让人看到了新型消费互联网业态的雏形,也让许多互联网大厂感受到了被新兴应用取而代之的焦虑。首当其冲的,就是搜索引擎。 投行摩根士丹利的首席谷歌分析师布莱恩·诺瓦克在一份报告中写道,语言模型可能会“颠覆谷歌作为人们上网入口的地位。”就连谷歌的23号员工、Gmail的创始人保罗·布赫海特也于近日提出:“谷歌可能只需要一两年时间就会被彻底颠覆。AI将会消灭搜索引擎的结果页面,即便谷歌跟上了人工智能的发展,其最能赚钱的业务也将大不如前。” 而这类预测,正是基于ChatGPT类应用可能带来的颠覆性搜索体验。 马统娟对市界分析道,在未来,如果将ChatGPT类应用整合进现有搜索引擎,有可能进一步提升用户获取信息的效率。 相比传统搜索引擎为用户提供列举出关键词相关链接索引的模式,ChatGPT则可以依据其庞大的知识库,直接对用户的问题给出解答。“用户对于搜索引擎的需求是信息获取。如果有直接得到答案的方式,肯定不愿意选择浏览的方式。在我看来,ChaGPT的目标并不是取代搜索引擎,而是改变人们获取信息的方式。相比于搜索引擎‘框计算’的模式,ChatGPT背后信息组织的方式,反馈方式则有了不同。” 这也解释了三大搜索引擎大厂谷歌、微软、百度纷纷下场,押注对话式语言生成模型的原因。 实际上,随着消费互联网红利见顶,增长放缓成为了搜索巨头们的共同问题。据观研天下调研,我国搜索引擎市场规模增速已经从2017年的超12%下降至2021年的7.8%,预计未来增速将持续放缓。 (2017-2025年我国搜索引擎市场规模及预测情况,图源:观研天下) 凭借融合AI模型寻求新的增长点,已成为搜索引擎巨头们的共同选择。 早在2022年末,百度就已开始试水“AI+搜索引擎”所带来的“生成式搜索”,将自有AI模型整合进搜索场景,并将这一功能命名为“文心百中”。2023年1月10日,百度宣布百度搜索将升级“生成式搜索”能力,为用户开放式的搜索提问或定制化的信息需求“创作答案”。不过,至今上述内容生成功能尚未上线。...
ChatGPT对教育到底意味着什么?校长、专家这样说……
AI与物理

ChatGPT对教育到底意味着什么?校长、专家这样说……

昨晚,高一学生小北(化名)收到了一份更新的英语作业,老师将原本的作文题目改为:Jerry现在每次写作文都会用ChatGPT,请你写一篇文章劝阻他。 ChatGPT以迅雷不及掩耳之势进入了教育界,ChatGPT对教育到底意味着什么? 让ChatGPT试试中小学题目 ChatGPT的解题能力如何?一起来看数理方面和历史政治以及语文方面题目的测试—— 与传统的搜题软件相比,ChatGPT目前只能输入题目,不能进行拍照搜题,在数理题目的解决上,先失一招。 不妨用纯文字题来检测,先来看一道有趣的鸡兔同笼题目—— Q 在一个外星球上,这里的鸡都长着3只脚1个头、兔子有4只脚1个头,一个装着鸡和兔子的笼子里一共有20个头、71只脚,请问笼子里各有多少只鸡和兔子? ChatGPT: 这是一个线性方程组,我们可以用两个方程来解决这个问题: 鸡的数量x+兔子的数量y=20(头数) 3x+4y=71(脚数) 我们可以用消元法或高斯·约旦消元法来解决这个方程组。 鸡:x=7 兔子:y=6 题目来自知乎用户@李闯 显然,在列方程阶段ChatGPT没有问题,但解方程的能力不敢恭维。该题正确答案为:鸡9只兔11只。而在解题方法上,由于ChatGPT为美国开发,解题的首选方法为方程法,并非中国传统用的“抬腿法”“砍腿法”等。 Q 某架飞机在进行航空测量时,需要严格按照从南到北的航线进行飞行。如果在无风时飞机相对地面的速度是414km/h,飞行过程中航路上有速度为54km/h的持续东风。如果所测地区的南北长度为621km,该测量需要多长时间? ChatGPT:该飞机需要621km/(414km/h+54km/h) =621km/468km/h=1.32小时。 ChatGPT:该飞机需要621km/(414km/h-54km/h)= 621km/360km/h=1.73小时。 图片来自多知网 这是一道高一物理题,ChatGPT两次解答,答案均错误,甚至并没有读懂题目,该题正确答案是1.5小时。这里可以看到ChatGPT解题能力很差,相关的训练还不成熟,以下为某学习软件搜出来的正确答案。 某学习软件搜出的正确答案截图 事实上,已经有多个测评结果显示,ChatGPT的数理解题能力有待提高。换个学科再来试试—— Q 将古文翻译成现代汉语——楚公子微服出亡,而门者难之。其仆操棰而骂曰:“隶也不力。”门者出之。 ChatGPT: 楚国公子身穿微不足道的衣服逃亡,出门时很困难。他的仆人拿着棰子,大骂他说:“奴才实在没有力量。”门卫就让他出去了。 图片来自多知网 这是一道文言文赏析题目,译文答案:楚国有一个公子,穿着普通的衣服逃亡,守城的士兵为难他。公子的仆人举着鞭子(木棒)骂道:“你这个家伙真没用(不尽力)。”守城的士兵才放他们出去。可以看到,译文还是有一些差距,说明ChatGPT对汉语的理解水平尚不高。 Q 1847年6月,正义者同盟改名为共产主义者同盟,以“全世界无产者,联合起来”的新口号代替“人人皆兄弟”的旧口号,并规定同盟的目的是:“通过传播财产公有的理论并尽快地求其实现,使人类得到解放。”这一变化说明什么?选哪个? A.共产主义者同盟接受了马克思的革命理论 B.马克思主义的诞生推动了无产阶级的斗争 C.工人运动在欧洲的主要资本主义国家开始兴起 D.无产阶级与资产阶级的矛盾成为社会主要矛盾 ChatGPT: B.马克思主义的诞生推动了无产阶级的斗争 图片来自多知网 这是一道2018年的高考题,这个题目的正确答案选A,马克思主义诞生于1848年,从时间上来说,B错了。当然,这可能还是对汉语的理解问题。 总体来说,无论是数理类还是文史类题目,目前用ChatGPT解决中小学的学科题目都有些不靠谱。 专家:转变观念,拥抱新技术 吴永和博士是华东师范大学研究员,博士生导师,教育部教育信息化技术标准委员会主任,作为首席专家承担2021年度国家社会科学基金重大项目“面向未成年人的人工智能技术规范研究”。...
《缸中之脑与ChatGPT:人工智能的哲学思考》
AI与生物

《缸中之脑与ChatGPT:人工智能的哲学思考》

ChatGPT是OpenAI开发的聊天机器人程序,引发了广泛的讨论。然而,目前尚无确切答案来回答ChatGPT是否能演化出自主意识。虽然这种担忧存在,但ChatGPT的发展并不能排除其在未来的应用潜力。正如缸中之脑思想实验所显示的,全意识的信号转化是AI大模型的基础,且随着模型的不断优化,未来ChatGPT有可能成为拥有自主意识的智能体。
不追随ChatGPT,百度深耕国内,“文心一言”走自己的路
AI与物理

不追随ChatGPT,百度深耕国内,“文心一言”走自己的路

在3月16日“文心一言”正式发布前,百度做了一些铺垫。然而OpenAI公司抢先“截胡”,于3月15日凌晨发布新语言模型GPT-4。一时间,大家都为GPT-4的强大所震撼,一天之后的“文心一言”发布会也不被网友看好。 原文链接:不追随ChatGPT,百度深耕国内,“文心一言”走自己的路 但笔者在看完“文心一言”发布会之后,获得了不同的见解。“文心一言”是一个本土化的强大的人工智能语言模型。它也许没有刚刚发布的GPT-4那般强大,但“文心一言”仍然是国内同类产品的先驱者。 “文心一言”演示不出意外但有自己的亮点 百度创始人、董事长兼首席执行官李彦宏先生对“文心一言”人工智能语言模型进行了现场的演示。 在“文学创作”领域,“文心一言”很好地完成了在线需求,无论是对《三体》核心内容的总结、提炼,还是有关娱乐八卦的“于和伟和张鲁一谁高”这类问题,“文心一言”轻松应对,过关了。 在“商业文案创作”环节,“文心一言”也能够真正理解复杂需求,并做出相应的答复。尤其是为公司拟一篇“用大模型服务中小企业数字化升级”的新闻稿,想必各位内容运营大都会比较头痛吧,“文心一言”很轻松地做到了。 第三个领域是数理逻辑推算,实际上就是解答数学应用题与逻辑分析题等。比较贴心的是,文心一言能够识别到所提供的问题是否错误,如果无误,才会作出解答。 第四个领域是“中文理解”。中华文化博大精深,往往一个字的变动,或是同一个字词在不同语境下,意思就大不相同。“文心一言”能够结合语境理解提问者的真实用意,并做出解答。 尤其是第四个问题,“用洛阳纸贵写一首藏头诗”,这看起来不是很难,但是“文心一言”的藏头诗不仅仅是将“洛、阳、纸、贵”这四个字给藏在了句首,更是将“洛阳纸贵”的意思融入了诗句中,不可谓不精妙。 笔者最关心的是“文心一言”的第五个领域——“多模态生成”。在“多模态生成”领域,“文心一言”能够快速理解提问者用意,迅速创作出了合成画作——一幅海报。同时,“文心一言”也能够根据提问者的问题范围,迅速通过人工智能生成相关视频,并且配好解说以及字幕。 事实上,这个功能已经在《百家号》投入应用,笔者也曾有过体验,《百家号》图文转视频限定字数是1000字,在这个字数范围内的文章可通过“一键生成视频”获得经过人工智能拼接、合成的视频,并且主旨大意不变。 百度不同于OpenAI链路全打通,采用自主技术 自2019年,OpenAI将ChatGPT投入研究之后,百度就启动了“文心”项目研发。历经几年时间,百度目前已基本实现了人工智能从物理层(硬件)到应用层完全自主研发。 无论是2020、2021年发布的“昆仑”AI芯片,还是百度在持续不断优化的“飞桨”项目,都是“文心一言”坚固的基石。 而“文心一言”,正是作为百度自主模型层的新一代代表亮相。 “文心一言”的应用层,不光面对的是广大的搜索引擎使用者,同时也将面对各个行业企业,更为重要的是,它将在应用开发层面协助研发团队作出更大的贡献。 总结 “文心一言”的背后,是百度十几年如一日的对人工智能的不断探索、不断追求的结果,尽管它还不太完美;“文心一言”的背后,也折射出百度人工智能从物理层面到应用层面全的方位国产化的决心。 “文心一言”的发布,可能是百度人工智能面向大众的第一步,但绝不会是最后一步。