文章主题:科技, 语音, 人工智能

666AI工具大全,助力做AI时代先行者!

TechWeb 文/卞海川

划重点:

车载语音智能化的短板在“语义理解”,AI圈大火的ChatGPT对车载语音智能化加成明显。

ChatGPT上车,主要还是成本的问题,这背后包括使用成本、云服务成本、针对性的训练成本。

作为云知声公司的董事长,他一直致力于推动公司的发展和创新。

葛付江,思必驰汽车事业部产品总监,近日在接受TechWeb采访时表示,新技术的发展必将面临商业化的挑战,而AI技术的创新必须与实际场景相结合。特别是在车载领域,类似ChatGPT的技术应用将在算力优化、云和端智能融合技术等方面带来新的挑战。

ChatGPT的火,一下子就烧到了车载领域。

语音交互作为汽车行业内最简洁、最人性化且最为安全的交互手段,已经逐渐成为未来汽车的主流交互方式。这一趋势受益于人工智能技术的进步以及硬件性能的提升,使得语音交互在未来汽车领域具有广泛的应用前景。具体而言,语音交互主要依赖于车载自然语言处理(NLP)和自然语言理解(NLU)技术,其中自然语言处理技术是近年来在人工智能领域备受关注的ChatGPT的技术之一。然而,事实真的像我们想象的那样吗?

车载语音智能化,短板在“智能”

在技术领域,智能语音交互的核心要素主要包括识别、理解和执行三个方面。当前市场上,识别技术的成熟度相对较高,其准确率已达到90%甚至95%以上。然而,在行业应用中,智能语音交互系统的痛点主要集中在理解环节。大部分车载语音交互系统在理解能力上表现欠佳,使得系统功能和命令词相对单一,无法满足用户多样化的需求。

那么问题来了,如何让车载语音交互系统像人一样理解我们的话语?

NLP(自然语言处理)技术在车载语音交互系统中扮演着至关重要的角色。它与系统中的场景策略和多轮对话密切相关,直接影响着系统的智能化水平。NLP技术的优劣,很大程度上决定了ChatGPT在语音识别领域的应用前景。

历史上,NLP的发展有几个关键节点,其中,最重要的两个当属2012年和2018年。

在2012年,深度学习技术开始被广泛应用在自然语言处理(NLP)领域。到了2018年,以谷歌的BERT模型为代表的语义表示预训练领域取得了显著的进步,其表现力强大到能够轻松击败其他NLP任务的基准。紧接着在2020年5月,由OpenAI投入巨资研发的GPT-3模型问世,引发了整个行业的广泛关注。这款模型的参数量高达1750亿,被誉为NLP领域中最强大的AI模型。

近期,ChatGPT成为了备受瞩目的焦点,这要归功于其基于大规模预训练语言模型(GPT-3.5)的卓越性能。借助GPT-3.5强大的语言理解和生成能力,ChatGPT得以在大量的人工标注和反馈数据上进行学习,进而使其预训练语言模型能更好地理解人类的问题,并给出更出色的回复。

葛付江,思必驰汽车事业部的产品总监,向TechWeb表达了关于ChatGPT的看法。他表示,ChatGPT目前以文本交互机器人的形态展现,具备处理各种文本任务的能力,尤其在智能问答和对话、文本创作等领域表现出色。而在车载语音领域,葛付江解释道,车载语音主要采用对话交互方式,主要用于执行诸如“导航去XXX”、“打开音乐”等具有明确指令的操作。这种语音助手能够用高度拟人化的语音回应车主的需求,从而实现更加安全、便捷的驾驶体验。展望未来,随着ChatGPT技术在车辆内的应用,车载语音交互将不再局限于执行固定指令的对话。车与人之间的交流将变得更加高效、直接和高灵活度,不仅可以进行出行指导和知识闲聊,还能实现更多元化的互动。

“ChatGPT”的爆火让市场看到了认知智能应用潜力。ChatGPT在推理和学习能力上优势明显,不仅可以用于理解和对话,更可以通过上下文交流和自我学习,来实现辅助创作和知识进化。这些能力同样适用车载语音交互领域,融合对话智能技术、深度学习大模型技术、工程化能力、大数据的潜力,带来更流畅、更有效的响应。在车内有限的空间,结合声场定位和多说话人判断,提升多角色、长上下文对话的逻辑一致性;更可以拓展满足方言、外语的统一识别和对话需求,快速实现更灵活、自由、个性化的交互。”葛付江说道。

从目前诸多对于ChatGPT的使用(包括我们自己),我们认为,仅就车载智能语音的NLP,目前它应该是最好和最智能的。这是否意味着,其就一定会在短期内应用在车载智能语音系统中吗?

市场空间有限,产业链、市场挑战犹存

众所周知,一个新的技术或者产品能否最终落地得到规模的应用,除了技术因素外,还会受到其所处产业或者市场的产业链、市场竞争强弱、市场空间等诸多因素密切相关。

具体到车载智能语音系统,虽然ChatGPT在“智能”上表现出色,但其在整个产业链条中比较偏后段,需要依赖很长的前端链条,比如信号处理、语音识别、文字输出之后才会用到它,前端链条上的因素对后端流程都会产生影响,例如信号处理会影响语音识别,语音识别如果出错就会影响NLP的判断,链条上每个模块都需要提高可靠性,才能保证最后出来的整体结果可靠。这意味着,ChatGPT在“智能”能力的输出上,并非完全取决于自身的能力,其产业链上任何一个环节都会对其造成正或负的影响。

云知声董事长&CTO梁家恩对TechWeb表示,ChatGPT 技术肯定会在车载、家居等智能交互应用有建树,但需要结合应用场景针对性优化,提高体验并降低服务成本等。

“车载等智能交互应用场景有很大体验升级空间,但目前ChatGPT是一个超大模型,如何保持体验情况下,显著降低服务成本是个关键问题“。

而从市场竞争的强弱看,据相关统计,目前车载语音系统市场除了已经被科大讯飞(002230)和Cerence垄断,且它们在此领域具有多年的产品和合作经验外,还有许多规模不同的企业参与其中,更为重要的是,目前车载语音市场已经遇到了增长的天花板,这使得在竞争激烈的同时,就连科大讯飞和Cerence都开始除了语音之外,开始走车内多模态交互,云服务集成等服务的路线,以综合实力提升竞争力。作为后来者的ChatGPT一旦决定进入车载智能语音市场势必会面临强大对手的挑战。

葛付江补充称,从成本来看,ChatGPT的研究需要巨大的资金和人才投入,他们需要超算平台、算法、数据等各核心力量支撑,这些都是成本。巨头平台公司目前来看具备这方面的优势,对于科技企业可以更多从场景融合入手,寻求创新机会。

从商业化场景看,目前chatGPT更适用于基于一定背景知识的创作型产业,以及刚需AIGC的场景、SOP(标准作业程序)的行业,比如智能写作、智能客服、文档管理、代码生成、甚至游戏NPC等。

班门弄斧主理人孙永杰指出,从单纯的车载语音市场看,其市场空间并不大,这点从已经垄断该市场的科大讯飞和Cerence的财报可见一斑。这种情况下,能否吸引成本高昂的ChatGPT进入也是个未知数。毕竟ChatGPT训练成本高昂,且其所属的Open AI依然处在亏损当中。

未来仍可期,合作和开放API或是更好选择

如前述可知,ChatGPT只是在车载智能语音的NLP环节具备优势,虽然ChatGPT据称也在进行语音识别和合成上进行AI训练,希望未来可以借此进入车载智能语音市场。但鉴于ChatGPT只是文本交互方式,即便是进行语音识别和合成的AI训练,最后效果如何?能否超过目前市面上存在和已经应用的车载智能语音系统仍是未知。

当然,鉴于ChatGPT强大的能力,TechWeb认为未来的市场空间会随着智能汽车应用场景的不断扩大,ChatGPT找到自己真正的用武之地并非没有可能。更值得期待的是,除了智能汽车本身外,站在整个汽车产业的高度,其未来在汽车设计、制造等领域的应用都充满想象的空间。

葛付江表示:“ChatGPT上车的应用具体如何发展,目前形势还不明朗。可预见的是,在车载场景下,大模型技术学习能力优势明显,通过强化上下文理解能力、思维链推理、增强指令学习,来实现持续学习,达成可以“回答类似问题”的效果,除指令需求外,日常的知识和闲聊对话交流可以更加流畅和有用。总体来说,技术会向统一多模态交互发展,强化语音、文本、图像等深度融合的多模态交互技术,形成“汽车大脑”,应对车内、公共空间等复杂场景的交互需求。”

小鹏技术团队对TechWeb表示,ChatGPT的语言组织能力很强,以及知识库也比较庞大,涉及领域更广,所以可能会给用户的体验更好更智能。至于我们未来要不要引入这个技术接口,还是做类似技术的融合开发,我们也在进一步探索~

基于此,TechWeb认为,合作应该是ChatGPT切入车载智能语音市场最经济和有效的方式。所谓各取所长就是这个道理。实际的情况是,近日国内集度汽车宣布将融合百度文心一言的全面能力,打造全球首个针对智能汽车场景的大模型人工智能交互体验,证明了此模式的可行性。

此外,将自己最擅长的能力通过API开放给第三方,仅输出自身最擅长的能力也不失为明智的选择。

科技, 语音, 人工智能

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply

Your email address will not be published. Required fields are marked *