《商汤“商量”大模型：AIGC产品与语言处理的卓越表现》

文章主题：苟日新，日日新，又日新。;商汤；语言大模型；商量；人工智能；自然语言处理；

机器之心原创

编辑：杜伟

「苟日新，日日新，又日新。」——《礼记・大学》。

这次，商汤给自己的语言大模型取了一个非常接地气的名字 ——「商量」。

4 月 10 日，在商汤技术交流日上，商汤科技正式宣布推出自己的全新大模型体系「日日新 SenseNova」。日日新一词出自于《礼记・大学》，汤之盘铭曰「苟日新，日日新，又日新。」取此名意在使大模型日日更新、能力日日增强。

在活动现场，商汤科技展示了日日新大模型体系在语言处理、图像生成以及自动化数据标注等多个领域的强大功能。商汤科技强调，该体系是一款专为B端市场设计的技术产品，目前已经向政企客户提供API接口和服务。客户可以轻松登录公司官网，体验日日新大模型体系的卓越性能。

https://techday.sensetime.com/list）申请。

在「日日新 SenseNova」大模型体系下，商汤发布了最新研发的语言大模型「商量 SenseChat」。这也是继百度文心一言、阿里通义千问之后，又一国内大厂的类 ChatGPT 产品。

商汤科技在本次展示中，向公众展示了其在大型模型体系下的一些创新成果。其中包括了「秒画 SenseMirage」AI 内容创作社区平台、「如影 SenseAvatar」AI 数字人视频生成平台以及「琼宇 SenseSpace 和格物 SenseThings」3D 内容生成平台。这些成果充分展示了商汤大模型在 AIGC 产品和服务上的应用潜力。

在评估商汤版ChatGPT的能力时，我们“机器之心”团队不仅通过Demo展示了其语言处理的实力，还在实际操作中亲身体验了一番。这次体验涵盖了中文与英文之间的互译、数学等多个领域，全方位地检验了商汤版ChatGPT在不同场景下的表现。

「商量」第一手体验，玩转中文对话

据商汤介绍，「商量」的背后是千亿级自然语言处理模型，它在大量数据训练的基础上充分考虑了中文语境，能够更好地理解和处理中文文本。

让「商量」做个简单的自我介绍。

首先值得一提的是，「商量」具备了出色的多轮对话理解和生成，能够进行流畅的人机共同创作。下面一人一句共同创作了关于「小猫咪小花钓鱼的故事」。

接着让「商量」写一首关于上海临港的诗。

对于中英互译，「商量」轻松应对。先将「今天我来到上海临港参加一场科技盛会，非常高兴，学到了很多东西」翻译成英文。对比谷歌翻译的结果，只有英文选词和标点符号上的差异。

在对「the woods are lovely, dark and deep, but I have promises to keep, and miles to go before I sleep」这句话进行翻译时，可以考虑使用“ Dark and deep woods, full of promises waiting to be kept, and miles to go before I sleep”这样的译文。与谷歌翻译相比，这个译本在词汇选择和句子结构上更为准确和专业。

对于著名的「林黛玉倒拔垂杨柳」梗，「商量」也能 get 到。

深奥的量子力学知识也搞得定，「商量」轻松回答出了「研究量子力学要学习的五个要点」

哲学问题也不在话下，「商量」列出了庄子无为而治思想与柏拉图哲人王理论的详细对比分析。

最后对于经典的「女朋友与妈妈同时落水，先救谁」的问题，「商量」给出了「有板有眼」的回答。

在众多体验案例中，我们发现「商量」在处理中文文本时展现出了惊人的理解和生成技巧，堪称卓越的聊天助手和创意丰富的创作者。

在数学方面，经典鸡兔同笼问题难倒过很多 AI 对话大模型。不过对于「商量」来说，小菜一碟，列方程步骤与结果都正确。

此外「商量」还能指出一些事实性错误，如下示例中「二战期间不可能用到 iPhone。」

唯一遗憾的是，「商量」目前没有提供面向 C 端的体验接口，只能期待未来的开放了。

不止于对话，「商量」及背后大模型能做更多

除了在通用对话领域的能力，商汤还展示了其利用「商量」背后的大模型开发的几项创新应用。

首先是 PDF 文件阅读助手，它具备了超长文本的理解能力，能够轻松从复杂文档中提取和概括信息。如下输入完整的《中华人民共和国专利法》，当你提问时，这个助手能够根据你的问题快速找出对应的条款规定并总结式地生成答案。这么看来，真是普通人的好帮手。

其次是健康咨询助手，通过导诊、问诊、健康咨询、辅助决策等多场景多轮会话，为用户提供个性化的医疗建议。目前已在问诊分诊、医疗知识科普、疾病鉴别诊断等领域表现出色，未来将继续拓展在药物治疗、手术方案等方面的问诊能力，帮助医生进一步提升诊疗效率。

最后是面向开发者的 AI 代码助手，它提供了代码补全、注释生成代码、测试代码生成、代码翻译、代码修正、代码重构、复杂度分析等多样化功能，使开发者更高效地编写和调试代码，减少枯燥的重复性工作。

在商汤科技的内部测试中，采用AI代码助手所带来的效益显著。经过数据分析，我们发现，应用AI代码助手能够有效提高代码编写效率，达到62%的提升幅度。此外，基于Humaneval测试集的数据显示，采用AI代码助手后的一次通过率高达40.2%，证明了其具有较强的实用性和可靠性。值得一提的是，AI代码助手目前兼容中英文以及众多编程语言，且能迅速适应不同开发者的个性化编码风格，这无疑大大提高了工作效率和编程体验。

日日新大模型体系带来更强的 AI 内容生成

大模型赋能AIGC已成为当前AI发展的重要趋势之一，这一技术的发展使得人们能够亲身感受到大模型的强大能力。商汤科技凭借其「秒画SenseMirage」、「如影SenseAvatar」以及「琼宇SenseSpace和格物SenseThings」等AIGC生成效果，成功吸引了现场观众的目光，让他们不禁为之惊叹。

在我们进一步探讨之前，让我们先来了解一下文生图平台「秒画 SenseMirage」。这个创新性的平台依赖于商汤科技自行研发的超过 10 亿参数的文生图生成大型模型，能够支持多种生成风格，包括二次元和三次元等，同时还能生成高达 6k 分辨率的图片。

除了生成风格多变之外，生成速度也很快，2 秒就能生成一张 512k 分辨率的图片。如下为两个文生图示例，图左「丹顶鹤、层山叠嶂、翱翔、水中、站立、不同颜色」和图右「池塘、白色荷花、荷叶、倒影、树木、黄叶」。

我们在现场也输入了两组提示词，一组是「铁路旁、夕阳下、背包旅客、摄影风格」，生成图片在内容和意境上都非常契合。

另一组是「一个可爱的小女孩、一间木头制作的房子、清晨、阳光、丁达尔效应和吉卜力风格」，同样效果很好。

你输入的提示词越细，生成的图片在内容和意境上就越契合，越不会跑偏。

再来看 AI 数字人生成平台「如影 SenseAvatar」，仅仅需一段 5 分钟的真人视频素材，就可以生成声音及动作自然、口型准确、多语种精通的数字人分身。告别僵硬的数字人形象变得更加简单，任何场景下都可以制作。如果不告诉你下面视频中的是数字人，你能猜出来吗？

该平台目前支持百余种语言。通过该平台的文字 AI 生成，用户只需输入视频创作的粗略想法就可以自动产生相应的视频文案。创作者可以利用平台快速打造各种短视频、直播等营销内容，教育培训、企业宣传、娱乐文化等领域也能找到相应的视频解决方案。

最后是 3D 内容生成平台「琼宇 SenseSpace」和「格物 SenseThings」，两者基于神经辐射场技术（NeRF），前者用于场景生成、复刻和还原真实空间，后者用于物体的 3D 内容生成。两者高效低成本地生成大规模 3D 场景和精细化的物件，在元宇宙、虚实融合应用中大显身手。

琼宇具备城市级大尺度的空间重建生成能力，能够高效还原城市场景细节。

格物能够实现各品类物体超细节的 3D 复刻还原，如下动图所示。

一次全部发布，发布即上线，商汤把自己「日日新 SenseNova」大模型体系下的全部能力进行了充分展示，不论是讲故事、代码编程、法律咨询、直播带货、三维建模，每项能力都有了足够的竞争力。

看起来，商汤已经走在了 AI 大模型应用的前列。

商汤通用人工智能（AGI）离不开大模型、大算力、大数据

自谷歌 BERT 和 OpenAI GPT 系列模型以来，大模型已经成为 AI 开发新范式。国内外科技大厂纷纷入局大模型，希望借此增强自身 AI 技术通用性，实现 AI 应用落地。商汤亦不例外，早在 2018 年就开始了大模型的研发，积累了超过 5 年的丰富技术和经验。

2019 年，商汤具备了千卡并行系统能力，使用上千张 GPU 卡进行单任务训练，推出了 10 亿参数量的视觉模型，实现了当时业界 SOTA 算法效果。2022 年发布了 320 亿参数的超大视觉大模型，成为全球最大通用视觉模型。同年还发布了 10 亿参数的 AIGC 模型，支持文生图和图生图各类功能。今年 3 月，商汤开源了 30 亿参数的多模态多任务通用大模型书生（INTERN）2.5。

商汤在 CV、NLP、AIGC 等领域的 AI 大模型汇聚成了如今「日日新 SenseNova」大模型体系，并促使其训练更强大的多模态大模型。同时将其 OpenDILab 下的决策智能模型融入并进一步丰富多模态大模型，最终构建通用人工智能大模型体系，未来将全方位覆盖视觉感知、语言理解、内容生成和推理决策四大板块。

我们知道，算力、算法和数据是 AI 发展三大要素。商汤的通用人工智能之路要解决算力问题，对此其前瞻性地打造了人工智能基础设施 SenseCore AI 大装置，其中商汤人工智能计算中心（AIDC）是重要的算力基座，为大模型研发提供充足算力。

AIDC 于 2020 年 7 月开工建设，投资 56 亿，并正式于 2022 年 1 月在上海启动运营，当时设计的峰值算力高达 3740 Petaflops，成为亚洲最大的人工智能计算中心之一。如今峰值算力已经超过 5000 Petaflops，支持 20 个千亿参数超大模型同时训练，并支持最大 4000 卡并行单任务训练，实现连续 7 天以上不间断稳定训练。

算力之外，SenseCore 商汤 AI 大装置还提供了一系列的大模型即服务（Model-as-a-Service），包括自动化数据标注、大模型推理部署、大模型并行训练、大模型增量训练以及致力于提升开发者效率的开源模型和 AI 开发工具。

可以说，整合了计算基础设施、深度学习平台和模型层的 SenseCore 商汤 AI 大装置成为了业内稀缺的大模型专用基础设施，并通过它使商汤成为大模型和 AGI 时代基础设施领导者。

至此，商汤利用大模型 + 大算力推进 AGI 的发展战略已经非常明显。在活动中，商汤提出了 AI 大模型时代算力、算法和数据三要素的全新公式 —— 大模型参数量与处理数据量的乘积，就是所需要的计算量。

一方面，近年来大模型参数量指数级增长，数据量也随多模态引入大规模增加，二者必然导致算力需求剧增。另一方面，就数据自身属性而言，高质量自然语言数据逐渐稀缺，而视觉数据在数量、质量、信息容量等方面较自然语言有多种优势，能更好地理解世界。因此，商汤将集成语言、视觉等信息和能力的多模态大模型视为通往 AGI 的重要基础。

从五年前研发大模型伊始，到如今日日新大模型体系初成，商汤将继续依托自身的算力优势以及源于产业实践的丰富高质量视觉信息和技术积累，发展更强大的多模态大模型，为最终实现 AGI 打好坚实的基础。

举报/反馈

苟日新，日日新，又日新。;商汤；语言大模型；商量；人工智能；自然语言处理；

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

相关文章

Leave a Reply Cancel reply