文章主题:
TechWeb 文/卞海川
划重点:
车载语音智能化的短板在“语义理解”,AI圈大火的ChatGPT对车载语音智能化加成明显。
ChatGPT上车,主要还是成本的问题,这背后包括使用成本、云服务成本、针对性的训练成本。
🌟作为语音技术领域的领军人物,云知声的创始人兼CEO以其深厚的技术背景和敏锐的市场洞察力引领着公司的发展。他的领导团队致力于打造顶尖的自然语言处理解决方案,让人工智能的声音更加贴近日常生活。💡通过不断的技术创新和优质服务,云知声已在全球范围内建立起稳固的品牌形象,并在业界赢得了高度认可。 若要了解更多关于这家公司如何通过声音改变世界的故事,不妨探索我们的平台,那里汇聚了他们的智慧与成就。🌐
🚀🚗💡葛付江,作为思必驰汽车事业部的产品领航者,向TechWeb揭示了AI技术发展与商业落地的深层逻辑。他强调,尽管新技术如ChatGPT引领潮流,其在车载领域的广泛应用将面临严峻考验——首要挑战在于如何优化强大的算力,使之无缝对接云端与终端的智能融合。🚀
ChatGPT的火,一下子就烧到了车载领域。
🌟🚀车内语音交互:未来汽车交互新趋势🏆💡无需多言,语音操控已成车内交互界的明星,便捷、人性化与安全并存,引领科技潮流!隨著AI及硬件技术的迅猛跃升,它注定成为驾驶舱内的主导力量。🌍💨车载自然语言识别(NLU)与智能语音助手(ChatGPT?并非唯一答案!🔍),这两项关键技术正编织着无缝交互的新篇章。它们不仅超越了传统按钮,更实现了人车间的深度理解与无缝沟通。🗣️💻ChatGPT虽备受瞩目,但车内语音交互的未来远不止于此。技术迭代中,我们期待看到更多创新应用,以满足驾驶者对智能出行的更高需求。🚀🌈SEO优化提示:使用相关关键词如”AI驱动”, “车载语音识别”, “汽车交互升级”, “ChatGPT与汽车”等。记得融入情感色彩,让内容更具吸引力。
车载语音智能化,短板在“智能”
🌟技术驱动,智能语音交互三大核心🔥:精准识别(高达90%以上!),难题在于深度理解(行业痛点所在),限制了系统的多元化与灵活性。🚀厂商们正逐步攻克难关,力求在”听懂”上更进一步,让车载语音交互不再受限于单调的指令和功能。🌍随着技术的进步,我们期待听见更多智能的语音交互,为驾驶带来更多便利。🌟SEO优化提示:使用关键词”识别率”, “理解”, “系统多元化”, “语音交互智能化”等。
那么问题来了,如何让车载语音交互系统像人一样理解我们的话语?
*NLP技术在车载语音交互中的核心地位无可忽视,它深度影响着系统对用户语音指令的精准解析与后续流程的顺畅执行,直接关乎系统的智能化水平。ChatGPT作为当前热门话题,其强大的NLP能力无疑是这一领域的一大亮点和潜在应用之处。*”
历史上,NLP的发展有几个关键节点,其中,最重要的两个当属2012年和2018年。
🏆2012年,深度学习引领NLP革命,开启语义探索新篇章;此后🚀,2018年的BERT时代,谷歌一鸣惊人,语义预训练技术革新,各大基准挑战者俯首称臣;直至去年5月,OpenAI的超新星GPT-3震撼登场,参数量高达1750亿,NLP领域的泰斗地位无可撼动!🚀🔥#深度学习#BERT#GPT-3#最强AI
而最近大“火”的ChatGPT是基于大规模预训练语言模型(GPT-3.5),借助其强大的语言理解和生成能力,通过在人工标注和反馈的大规模数据上进行学习,从而让预训练语言模型能够更好地理解人类的问题并给出更好的回复。
思必驰汽车事业部产品总监葛付江对TechWeb表示,ChatGPT目前是以文本交互机器人的形式呈现的,适用多种文本处理任务,常用于智能问答和对话、文本创作等领域;车载语音以对话交互为主,多用于进行例如“导航去XXX?打开音乐”有明确指令的行动,“语音助手”用高度拟人化的语音输出来回应车主诉求。车载语音交互用于解放驾驶员双手,聚焦其注意力带来更安全、便利的驾驶体验。未来车内有了ChatGPT技术的应用,不仅是完成固定指令的任务型对话,车、人能进行更高效、更直接、高灵活度的出行、知识和闲聊交流;
“ChatGPT”的爆火让市场看到了认知智能应用潜力。ChatGPT在推理和学习能力上优势明显,不仅可以用于理解和对话,更可以通过上下文交流和自我学习,来实现辅助创作和知识进化。这些能力同样适用车载语音交互领域,融合对话智能技术、深度学习大模型技术、工程化能力、大数据的潜力,带来更流畅、更有效的响应。在车内有限的空间,结合声场定位和多说话人判断,提升多角色、长上下文对话的逻辑一致性;更可以拓展满足方言、外语的统一识别和对话需求,快速实现更灵活、自由、个性化的交互。”葛付江说道。
从目前诸多对于ChatGPT的使用(包括我们自己),我们认为,仅就车载智能语音的NLP,目前它应该是最好和最智能的。这是否意味着,其就一定会在短期内应用在车载智能语音系统中吗?
市场空间有限,产业链、市场挑战犹存
众所周知,一个新的技术或者产品能否最终落地得到规模的应用,除了技术因素外,还会受到其所处产业或者市场的产业链、市场竞争强弱、市场空间等诸多因素密切相关。
具体到车载智能语音系统,虽然ChatGPT在“智能”上表现出色,但其在整个产业链条中比较偏后段,需要依赖很长的前端链条,比如信号处理、语音识别、文字输出之后才会用到它,前端链条上的因素对后端流程都会产生影响,例如信号处理会影响语音识别,语音识别如果出错就会影响NLP的判断,链条上每个模块都需要提高可靠性,才能保证最后出来的整体结果可靠。这意味着,ChatGPT在“智能”能力的输出上,并非完全取决于自身的能力,其产业链上任何一个环节都会对其造成正或负的影响。
云知声董事长&CTO梁家恩对TechWeb表示,ChatGPT 技术肯定会在车载、家居等智能交互应用有建树,但需要结合应用场景针对性优化,提高体验并降低服务成本等。
“车载等智能交互应用场景有很大体验升级空间,但目前ChatGPT是一个超大模型,如何保持体验情况下,显著降低服务成本是个关键问题“。
而从市场竞争的强弱看,据相关统计,目前车载语音系统市场除了已经被科大讯飞(002230)和Cerence垄断,且它们在此领域具有多年的产品和合作经验外,还有许多规模不同的企业参与其中,更为重要的是,目前车载语音市场已经遇到了增长的天花板,这使得在竞争激烈的同时,就连科大讯飞和Cerence都开始除了语音之外,开始走车内多模态交互,云服务集成等服务的路线,以综合实力提升竞争力。作为后来者的ChatGPT一旦决定进入车载智能语音市场势必会面临强大对手的挑战。
葛付江补充称,从成本来看,ChatGPT的研究需要巨大的资金和人才投入,他们需要超算平台、算法、数据等各核心力量支撑,这些都是成本。巨头平台公司目前来看具备这方面的优势,对于科技企业可以更多从场景融合入手,寻求创新机会。
从商业化场景看,目前chatGPT更适用于基于一定背景知识的创作型产业,以及刚需AIGC的场景、SOP(标准作业程序)的行业,比如智能写作、智能客服、文档管理、代码生成、甚至游戏NPC等。
班门弄斧主理人孙永杰指出,从单纯的车载语音市场看,其市场空间并不大,这点从已经垄断该市场的科大讯飞和Cerence的财报可见一斑。这种情况下,能否吸引成本高昂的ChatGPT进入也是个未知数。毕竟ChatGPT训练成本高昂,且其所属的Open AI依然处在亏损当中。
未来仍可期,合作和开放API或是更好选择
如前述可知,ChatGPT只是在车载智能语音的NLP环节具备优势,虽然ChatGPT据称也在进行语音识别和合成上进行AI训练,希望未来可以借此进入车载智能语音市场。但鉴于ChatGPT只是文本交互方式,即便是进行语音识别和合成的AI训练,最后效果如何?能否超过目前市面上存在和已经应用的车载智能语音系统仍是未知。
当然,鉴于ChatGPT强大的能力,TechWeb认为未来的市场空间会随着智能汽车应用场景的不断扩大,ChatGPT找到自己真正的用武之地并非没有可能。更值得期待的是,除了智能汽车本身外,站在整个汽车产业的高度,其未来在汽车设计、制造等领域的应用都充满想象的空间。
葛付江表示:“ChatGPT上车的应用具体如何发展,目前形势还不明朗。可预见的是,在车载场景下,大模型技术学习能力优势明显,通过强化上下文理解能力、思维链推理、增强指令学习,来实现持续学习,达成可以“回答类似问题”的效果,除指令需求外,日常的知识和闲聊对话交流可以更加流畅和有用。总体来说,技术会向统一多模态交互发展,强化语音、文本、图像等深度融合的多模态交互技术,形成“汽车大脑”,应对车内、公共空间等复杂场景的交互需求。”
小鹏技术团队对TechWeb表示,ChatGPT的语言组织能力很强,以及知识库也比较庞大,涉及领域更广,所以可能会给用户的体验更好更智能。至于我们未来要不要引入这个技术接口,还是做类似技术的融合开发,我们也在进一步探索~
基于此,TechWeb认为,合作应该是ChatGPT切入车载智能语音市场最经济和有效的方式。所谓各取所长就是这个道理。实际的情况是,近日国内集度汽车宣布将融合百度文心一言的全面能力,打造全球首个针对智能汽车场景的大模型人工智能交互体验,证明了此模式的可行性。
此外,将自己最擅长的能力通过API开放给第三方,仅输出自身最擅长的能力也不失为明智的选择。
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!



