GPT-4撞上文心一言,百度压力骤增:多模态和中文能力受关注
AI与物理

GPT-4撞上文心一言,百度压力骤增:多模态和中文能力受关注

出品 | 搜狐科技 作者 | 梁昌均 赶在“国产版ChatGPT”文心一言发布前夕,OpenAI抢先发布了功能更为强大的多模态大模型GPT-4,巨大的压力给到了百度。 前后脚发布,高调宣传的百度难免会被拿来对比,或将面临发布即落后的尴尬。毫不夸张地讲,如果明日发布的文心一言达不到市场预期,百度很可能再次会让外界恨铁不成钢,甚至遭受新一轮舆论炮火。 在目前行业较为普遍的认知中,国内有实力能真正做出类似ChatGPT这样的语言大模型仅有百度等少数有长期技术积累,更为关键的是有强大现金流支撑的科技巨头。 百度则是国内打响这第一枪的大厂,在2月初率先宣布将推出类似产品,并持续进行预热宣传,广泛开展生态伙伴的合作,目前已有近500家企业宣布将接入文心一言。 在国内大模型发展进度落后且无法广泛体验ChatGPT的情况下,外界对百度的文心一言有所期待,但同时对在如此匆忙的时间下推出的产品效果保留质疑,毕竟连谷歌也在这个问题曾吃了大亏。 为了文心一言顺利上线,百度CTO王海峰领导的数百人团队加班加点工作,同时对智算中心也进行了升级。百度相关团队也在为明天的发布工作进行准备,今日已正式向参加发布会的投资人、合作伙伴及媒体等发送了参会信息。 现在,距文心一言发布已不到20小时。百度在迈向人工智能的路上将迎来一个重大节点,是成是败或在此一举。 发布即落后,未来或将多模态融合 随着GPT-4的发布,让文心一言难逃被对比的命运。此次GPT-4也实现了更为强大的性能和功能,在原来的文本生成基础之上新增了图像识别,根据OpenAI的演示,其“看图说话”的能力毫不逊色。在此前被诟病的真实性、准确性、不会做数学和物理题等方面,GPT-4也通过训练和调校得到了一定程度的改善。 即将发布的文心一言,基于百度拥有2600亿参数的文心大模型打造,其参数规模超过GPT-3.5(1750亿)。OpenAI并未透露GPT-4的参数规模,而该公司CEO此前称它不会比GPT-3大很多,市场分析称其参数规模可能会在1750-2800亿之间。 有科技博主提到,文心一言可能在推出之后,并不会是一个十全十美的产品,因为AI需要通过不断使用才能变的更智能,而多模态的能力可能会在合适的时机和文心一言结合,未来的文心一言更值得期待。 根据百度文心一言的名称和此前透露的情况来看,其大概率还处于文本处理阶段,也就是和早前版本的Chat-GPT一样仅能进行对话互动的任务,此次将不会是一个多模态大模型。 近些年,多模态已经成为人工智能发展的重要趋势,它包含文本、图像、音频和视频等多种形式,诸多应用场景往往都需要综合能力的加持。谷歌在上周也推出了参数量高达5620亿的具身多模态语言模型PaLM-E,是目前已知的最大的视觉-语言模型。从这个角度来看,百度已经落后于OpenAI和谷歌的进度。 同时,对于Chat-GPT此前暴露出的虚假、胡说八道等诸多问题,文心一言恐怕也难以避免。关键在于有了前车之鉴后,百度是否在一定程度上解决,但如此仓促的时间,改善的效果如何存疑。 OpenAI在GPT-4的这些方面则花了6个月的时间,使用对抗性测试程序和从ChatGPT得到的经验教训,对GPT-4进行迭代调整,从而实现真实性、可控制性等取得了有史以来最好的结果,但仍远非完美。 因此有互联网行业分析师认为,如果单从功能、效果上来对比,文心一言和GPT-4可能根本不在一个量级,被按在地上摩擦是大概率事件,认为文心一言能达到此前版本的ChatGPT的水平就算是超出预期。 文心一言背后的文心大模型定位于产业级知识增强大模型,最早推出在2019推出,目前具备跨模态、跨语言的深度语义理解和生成能力,是全球最大中文单体模型。其中的NLP大模型主要为ERNIE系列模型,其目前已迭代到3.0版本,是打造文心一言的关键。 此前,百度基于文心大模型已推出应用AI作画的文心一格和端到端搜索引擎文心百中,文心一言则具备相似定位。华泰证券认为,技术上来说,文心大模型已经具备了搜索、文图生成等功能,并成功得到应用,这些能力或将集成于文心一言,并增加预置作文生成、文案创作、情感分析等任务处理能力。 中文语言能力受关注,将采取多种落地方式 百度CEO李彦宏此前表示,百度的文心大模型是中国市场非常本土化的大语言模型,基于此而研发的文心一言将比国外开发的模型更适合中文和中国市场,其先进性不仅体现为对中文语言的理解,还体现为对中国文化的理解。 因此相较在中文能力方面表现较差的ChatGPT,百度在中文语言文本上的表现值得期待。公开信息显示,ERNIE 3.0作为文心一言的核心模型引擎,在英文版的测试中本身已经取得了优秀结果。 华泰证券认为,在中文NLP方面,ERNIE 3.0会比ChatGPT更具有天然的语言优势,或将更好的支持中文搜索问答、内容创作生成、虚拟人物、智能客服、智能写作等应用。 不过,前述互联网分析师认为,百度积累的整体数据规模和质量相对ChatGPT的训练数据要弱一个量级,同时在数据的处理上也要与国内具体实情相结合,需要比ChatGPT考虑更多的维度,因此处理难度也会更大,中文表现能力如何还要看百度如何处理。 数字经济专家高泽龙评论称,虽然百度文心大模型参数量已达到2600亿,但百度在这个领域处于第三梯队,落后于OpenAI和谷歌,技术能力相比ChatGPT约晚1-2年。从数据、算力、模型维度来看,主要是差在模型环节,包括清洗、标注、模型结构设计、训练推理的技术积累。 对于后续的落地情况,华泰证券认为,微软证明了搜索引擎+类GPT产品是可行路线,文心一言+百度搜索在国内具有较大优势,并或也将提供大模型API相关功能。同时,文心一言可能打造与文心一格、文心百中类似的产品级应用,通过直接的方式提供服务,类似ChatGPT通过网页即可实现访问。 此外在生态融合上,结合百度自身的自动驾驶、视频等已有生态,融合文心一言的新搜索形态,或可以接入Apollo自动驾驶平台、爱奇艺、小度等平台和终端,扩展使用场景。此外,文心一言还将通过智能云对外提供服务,目前已有近500家企业宣布接入文心一言生态圈,涵盖互联网、媒体、金融、汽车、企业软件等行业。 有观点认为,百度本身就具备数亿用户,如果能借助AIGC创新的浪潮,提供更好的服务,未来就不会被淘汰,甚至完全可以在应用层面碾压ChatGPT。 智算中心升级,加快推动文心一言应用 作为基于千亿大模型打造的文心一言,其背后也需要庞大的算力支持。为支持文心一言的超大规模计算需求,实现文心一言的产业化落地,百度智能云近期动作频频,除了去年12月发布AI大底座,今年2月又升级AI研发运营一体化能力,并在今年3月百度阳泉智算中心完成升级。 文心一言未来将依托AI大底座落地,其属于百度AI大底座的芯片、框架、模型、应用四层架构中的模型层。作为国内首个全栈自研的AI基础设施,AI大底座可以提供端到端、全要素AI解决方案,由百舸异构计算平台(整合百度自研的昆仑芯)、AI中台(飞桨深度学习框架、文心大模型)两大部分组成。 百度智能云云计算产品解决方案和运营部总经理宋飞表示, 大模型创造了一个AI开发的新范式,而百度AI大底座可基于实际业务数据进行不断调优,使得资源利用率提升至70%,企业开发效率提升100%。 与此同时,算力已经成为类似ChatGPT等大模型背后的核心。数据显示,ChatGPT的总算力消耗约为3640PF-days(即假如每秒计算一千万亿次,需要计算3640天)。微软为此花费数亿美元为 OpenAI 建造了一台巨大的超级计算机,使用了上万颗英伟达GPU计算芯片,并称愿意投入更多资金。 前述互联网分析师也提到,对文心一言等类似大模型来说,最重要的还是算力。“这次百度抢先在国内最早发布类ChatGPT应用,可以说是调动了公司内的最大算力资源,但和ChatGPT调用的高端芯片相比,估计不足十分之一。” 文心一言背后的算力基础设施则是由百度阳泉智算中心支持,它于2021年4月正式投入使用,并于2022年12月对外开放服务,后续百度多个智算中心也将为文心一言面向产业的规模化落地提供底层支撑。 阳泉智算中心是亚洲最大单体智算中心,算力规模达4EFLOPS(每秒400亿亿次浮点运算),可以支持各种AI应用场景,如语音识别、图像识别、自然语言处理、机器学习等。搜狐科技近日实地探访时了解到,为保证文心一言顺利上线,百度阳泉智算中心专门为其搭建了GPU集成的服务器中心,该地运维人员也在紧急进行压力测试。...
华策影视2022营收下滑,但年度大片收割荣誉与多项作品热度爆表,2023一季度成绩单亮眼,AI转型
AI与物理

华策影视2022营收下滑,但年度大片收割荣誉与多项作品热度爆表,2023一季度成绩单亮眼,AI转型

2022年,华策影视营收下滑35%,净利润增长1.15%;旗下多部作品获奖并创收佳绩,如《外交风云》等实现荣誉大满贯,《我们这十年》等剧集热度高。营业总收入下降源于外部不确定性影响,但一季度业绩预增10.55%-32.52%,主因是电影《流浪地球2》和《熊出没·伴我“熊芯”》的票房成功。公司还积极应对AI技术变革,加强AI工具应用并计划与百度等合作。
不追随ChatGPT,百度深耕国内,“文心一言”走自己的路
AI与物理

不追随ChatGPT,百度深耕国内,“文心一言”走自己的路

在3月16日“文心一言”正式发布前,百度做了一些铺垫。然而OpenAI公司抢先“截胡”,于3月15日凌晨发布新语言模型GPT-4。一时间,大家都为GPT-4的强大所震撼,一天之后的“文心一言”发布会也不被网友看好。 原文链接:不追随ChatGPT,百度深耕国内,“文心一言”走自己的路 但笔者在看完“文心一言”发布会之后,获得了不同的见解。“文心一言”是一个本土化的强大的人工智能语言模型。它也许没有刚刚发布的GPT-4那般强大,但“文心一言”仍然是国内同类产品的先驱者。 “文心一言”演示不出意外但有自己的亮点 百度创始人、董事长兼首席执行官李彦宏先生对“文心一言”人工智能语言模型进行了现场的演示。 在“文学创作”领域,“文心一言”很好地完成了在线需求,无论是对《三体》核心内容的总结、提炼,还是有关娱乐八卦的“于和伟和张鲁一谁高”这类问题,“文心一言”轻松应对,过关了。 在“商业文案创作”环节,“文心一言”也能够真正理解复杂需求,并做出相应的答复。尤其是为公司拟一篇“用大模型服务中小企业数字化升级”的新闻稿,想必各位内容运营大都会比较头痛吧,“文心一言”很轻松地做到了。 第三个领域是数理逻辑推算,实际上就是解答数学应用题与逻辑分析题等。比较贴心的是,文心一言能够识别到所提供的问题是否错误,如果无误,才会作出解答。 第四个领域是“中文理解”。中华文化博大精深,往往一个字的变动,或是同一个字词在不同语境下,意思就大不相同。“文心一言”能够结合语境理解提问者的真实用意,并做出解答。 尤其是第四个问题,“用洛阳纸贵写一首藏头诗”,这看起来不是很难,但是“文心一言”的藏头诗不仅仅是将“洛、阳、纸、贵”这四个字给藏在了句首,更是将“洛阳纸贵”的意思融入了诗句中,不可谓不精妙。 笔者最关心的是“文心一言”的第五个领域——“多模态生成”。在“多模态生成”领域,“文心一言”能够快速理解提问者用意,迅速创作出了合成画作——一幅海报。同时,“文心一言”也能够根据提问者的问题范围,迅速通过人工智能生成相关视频,并且配好解说以及字幕。 事实上,这个功能已经在《百家号》投入应用,笔者也曾有过体验,《百家号》图文转视频限定字数是1000字,在这个字数范围内的文章可通过“一键生成视频”获得经过人工智能拼接、合成的视频,并且主旨大意不变。 百度不同于OpenAI链路全打通,采用自主技术 自2019年,OpenAI将ChatGPT投入研究之后,百度就启动了“文心”项目研发。历经几年时间,百度目前已基本实现了人工智能从物理层(硬件)到应用层完全自主研发。 无论是2020、2021年发布的“昆仑”AI芯片,还是百度在持续不断优化的“飞桨”项目,都是“文心一言”坚固的基石。 而“文心一言”,正是作为百度自主模型层的新一代代表亮相。 “文心一言”的应用层,不光面对的是广大的搜索引擎使用者,同时也将面对各个行业企业,更为重要的是,它将在应用开发层面协助研发团队作出更大的贡献。 总结 “文心一言”的背后,是百度十几年如一日的对人工智能的不断探索、不断追求的结果,尽管它还不太完美;“文心一言”的背后,也折射出百度人工智能从物理层面到应用层面全的方位国产化的决心。 “文心一言”的发布,可能是百度人工智能面向大众的第一步,但绝不会是最后一步。
哲学与AI,交融的未来之路?
AI与物理

哲学与AI,交融的未来之路?

在《人工智能研究需哲学参与》一文中,作者探讨了AI领域如何受益于哲学的介入,强调哲学对于AI伦理、理解智能本质以及防止技术滥用等方面的积极作用,提倡将哲学理论融入AI研究,以促进该领域的全面发展。