文章主题:京东集团, 大模型, 产业实践, 技术突破
雷递网 乐天 7月13日
京东集团今日在2023京东全球科技探索者大会暨京东云峰会上推出京东言犀大模型。
京东集团首席执行官许冉明确指出:“我们致力于打造更先进的大模型技术,其发展遵循了京东一直秉持的技术理念:成本优化、效率提升、卓越用户体验、可靠性与可信度、普及与共赢以及技术创新的突破。这些理念源于京东的经营哲学,同时也是零售行业的核心原则。而可信、普及和突破则体现了我们对技术服务产业发展和社会公益事业的承诺。”
京东云事业部总裁曹鹏宣布,京东言犀AI开发计算平台将于8月上线。
曹鹏认为,虽然Chat类的大模型引发新一轮热潮,但对话、写诗、作画绝不是大模型的全部,作为一家新型实体企业,京东思考更多的是大模型如何与实体结合。与通用大模型相比,言犀大模型具备三大特性:更高产业属性、更强泛化能力和更多安全保障。
曹鹏表示,依托于京东复杂场景历练,言犀天然具有产业基因,更懂产业需求,可为千行百业输出更准确、更有价值信息和判断,与实体产业深度融合。
用产业数据和Know-how创造价值
大模型只有在产业应用中才能充分发挥其价值,这一点得到了许冉的强调。他认为,大模型的价值取决于算法、算力、数据以及产业厚度的平方。虽然算法、算力和数据是影响大模型价值的重要因素,但在实际应用中,技术能否在产业场景中落地并创造实际价值才是最关键的。只有当产业效率和产业边界的拓展达到了质的提升,大模型才能展现出更加重要的实际价值和意义,这甚至可以比作一次工业革命。因此,我们可以得出结论,大模型的真正价值在于其在产业应用中所能创造的实际价值,而技术能否在产业场景中得到有效应用则是决定大模型价值的关键所在。
许冉说, “从产业端切入大模型,如同从北坡攀登技术珠峰,道路虽然更加艰难,却有更波澜壮阔的风景。”
产业场景是京东的核心优势之一,这家新型实体企业的发展正是依赖于对这一领域的深刻理解。京东拥有包括零售、物流、科技、健康、工业、产发等多个产业的布局,这使得京东能够积累了大量的优质交互数据,为训练言犀大模型提供了强大的支持。这些数据的70%是通用的数据,而剩下的30%则是供应链原生数据,这使得京东在产业场景方面的实力更加突出。
京东表示,其在大模型布局上的优势源于丰富的产业数据积累和各行各业的Know-How,这使得训练出的模型天生带有“产业基因”。同时,言犀大模型还拥有卓越的行业泛化能力,可以确保客户在云上云下都能安全、稳定地使用。
京东集团技术委员会主席兼京东云事业部总裁曹鹏指出:“数智供应链的培训催生了产业大规模模型,而这个大规模模型则依赖于供应链深入到各个产业之中。”
京东集团技术委员会主席、京东云事业部总裁曹鹏演讲
对于大模型的应用实践,京东也有明确的“三步走”规划。
目前,京东云已成功构建了一款通用的巨大模型,该模型基于公司内部的实际操作经验。在未来几个月内,京东将会利用这款模型在高复杂场景中进行大量训练,以此不断完善并提高其产业服务质量。预计到2024年初,京东将正式将这款大模型的能力对外部商业场景开放,使其成为一项严肃的商业服务。在此过程中,京东已经完成了第一阶段的工作,并在内部实现了预期的成果。
京东探索研究院院长、京东科技智能服务与产品部总裁何晓冬博士演讲
在某种程度上,我们的大型人工智能模型不仅在完成通识教育,同时也在接受长达四年的专业本科教育。这种说法来自京东探索研究院院长兼京东科技智能服务与产品部总裁何晓冬博士的阐述。他进一步指出,大型模型的挑战并不在于技术的追逐,而是在于产业的突破。对于京东而言,其关键关注的领域就是京东言犀大模型的产业应用实践。
构建大模型“训练营”和“弹药库”
京东自早期便开始谋篇布局大型人工智能模型。早在2021年,京东就已经推出了十亿级模型K-PLUG;进入2022年,其又推出了百亿级模型Vega。而在此次大会上,京东更是展示了千亿级模型的实力。
京东称,正是提早布局,让京东形成一套大模型的完整工具链:言犀AI开发计算平台、向量数据库,及全新升级的基础设施云舰、云海和京刚。
京东的言犀AI开发计算平台,能够为客户的大模型开发和行业应用开发,提供定制化解决方案。它既具备行业知识库,沉淀了京东自己的零售、物流、健康、金融等行业Know-How,又具备100多种训练和推理优化工具,能将通用模型迅速转化为专业模型。
在大会现场,京东演示了将通用大模型转化为健康产业大模型的操作。通常,客户完成这套流程,从数据准备、模型训练到模型部署,需要10余名科学家花费一周时间。但利用言犀AI开发计算平台,只需要1-2名算法人员,在数分钟就能完成。通过平台模型加速工具的优化,京东称还能节省90%的推理成本。
京东健康发布的京医千询大模型,就是建立在京东言犀通用大模型基础之上,能快速完成在医疗健康领域各个场景的迁移和学习,从而实现产品和解决方案的全面AI化部署,能为远程医疗服务提供坚实的技术底座。
京东还展示了金融领域AI营销运营平台。使用者通过简单的对话,就能一站式生成营销活动,覆盖运营策略制定、营销人物调度编排、搭建活动页面、批量生成营销文案和素材、数字化投放等方面。过去这套流程需要产品、研发、算法、设计、分析师5类职能人员,如今减少到1人;过去流程需要2000次人机交互,也减少到少于50次。在大模型能力的加持下,营销方案的生产效率有了百倍提高。
京东称,在电商领域,京东云AIGC内容营销平台从一张商品图出发,能够理解商品特征,快速胜场电商运营需要的商品主图、营销海报图和商详图等,满足商家快速开店和营销的需求。有了人工智能的加持,每套图的制作成本能降低90%,制作周期也从7天缩短到半天。
京东称,如果说言犀AI开发计算平台是大模型的“训练营”,向量数据库则是大模型的“弹药库”,是大模型使用数据的桥梁。京东从2019年开始研发向量数据库,历经电商大促场景磨练,向量数据库Vearch已经能支撑百亿级高性能检索,延时降低到毫秒级,可用性达到99.99%,已经服务超过100家大中型企业用户。京东将向量数据库用于大模型预训练,将推理成本降低了80%。
对大模型所需的计算资源,京东也做出了充分的准备。在重庆太阳岛,京东全国首个超算中心——天琴α集群正日夜不停地运转,推理速度较过去提升6.2倍,推理成本节约90%,成为技术创新背后的算力支撑。
京东云三个核心产品也迎来升级。京东云称,全新升级的混合多云操作系统云舰,将GPU/NPU的资源成本降低50%,并提供行业最高的业务连续性承诺。高性能存储平台云海,将单集群每秒读写性能提升5倍,达到千万级;时延降低50%,达到百微秒级;使用成本降低30%。软硬一体的虚拟化引擎京刚,将虚拟化卸载到智能网卡中,虚拟化损耗降至0,网络性能提升高达4倍,并支持100Gb VPC网络,云硬盘单实例性能破百万IOPS。
京东集团副总裁、京东科技产品与解决方案总裁高礼强表示,“智能化优先在数字化领先的行业发生”。
在本次大会上,京东物流发布了一站式数智化供应链数据管理平台京慧3.0,在大模型的加持下,其销量预测、库存、供应及补货计划方面更具表现力,其交互式供应链控制塔能够帮助用户快速定位并解决供应链问题,实现降本增效。
———————————————
雷递由媒体人雷建平创办,若转载请写明来源。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!