加入高工智能汽车专业行业群(自动驾驶,车联座舱,商用车),加微信:17157613659出示名片,仅限智能网联软硬件供应商及OEM。
智能汽车的终极形态是什么?
关于这个问题,也许在漫威电影里就可以看到答案:它会搭载一个高度拟人化的“私人助理”,只要你用交谈式的语言说出命令,TA就可以迅速理解并帮你解决问题,像钢铁侠的“J.A.R.V.I.S”一样可靠。
车载语音技术现已从单纯的本地识别,过渡到云端交互,未来的趋势便是AI智能助理。近年来,车载语音交互平台的争夺战也正式进入白热化,搭载人工智能语音交互技术的车型在销量上表现不俗。
高工智能汽车研究院监测数据显示,2020年1月自主及合资品牌车型搭载语音识别及交互功能的实际上险量占当月全部车型上险量的58.62%。
其中,提供本地识别功能占搭载语音上险量的28.56%,基于本地+云端识别+语义理解占搭载语音上险量的26%。
一方面是前装市场空间仍然巨大,另一方面,市场需求升级也在加大。高工智能汽车研究院预计,到2022年,车载语音识别及交互功能搭载率预计将接近90%。到2025年,AI语音助理搭载率预计将超过50%。
不过,在汽车制造商加快推动语音上车的背景下,从消费者实际反馈来看却并不让人满意。下面是我们调查的一些用户的反馈:
我的普通话可能不是很标准,不过同事朋友都能听清楚,可是车机压根就识别不出来,甚至瞎给你回答问题,搞得我很尴尬。
语音识别功能非常非常的差,无论是叫名字还是说电话号码,多次尝试都有问题,有时很大声的回答是或者不是,都没有反应。
这车语音好用吗?会卡吗?语音控制也不尽人意,识别率有待提升。语音控制,狂喷噱头,没用。语音系统反应略迟钝,有时候要延迟1,2秒,偶而还没反应等等。。。
走向大连接,需要平衡
在《钢铁侠》电影有这样一个场景:托尼·史塔克在每次对战前都会向智能助理J.A.R.V.I.S询问盔甲的状况,它总能准确汇报盔甲的受损程度、弹药状况以及故障区域。
事实上这也是智能语音个人助理的一项基本“本领”。TA本身就是一位懂车懂人的专家,掌握车身内外的所有信息,并可根据实时车况向车主一一汇报。
目前,AI语音交互的价值也正逐步从单纯车身控制的狭隘理解向业内人眼中的“大连接”阶段过渡。
大众问问CEO张人杰提出,过去的智能语音助手倾向于将移动互联生态的应用放到车里作为辅助功能,这是远远不够的。“未来将会更多与车控及通信功能结合。”
但实现这种交互的问题之一,便是语音厂商拿不到主机厂的数据。“很多语音厂商作为第三方是不可能得到与车直接相关的关键数据。而这些数据如果不能和语音结合起来,就无法完成整个场景的闭环交互。”
另外,如果想让语音发挥最大的优势,就得让语音与车控部分,以及V2X部分结合在一起。但是这里仍然存在限制:首先主机厂可能不愿意让语音公司去做这部分的连接。其次这种连接也增加了未经授权车控操作的风险。
“从这个方面来讲,主机厂就要做一些平衡:哪一些与车相关的场景可以让语音去做渗透,哪一些要做相应的限制。而未来在语音认证方面也需要有相关的管理。”张人杰认为,语音与V2X、车身应用结合起来的场景有无限的想象空间。
比如前方50米有红灯。车身会通过传感器自行识别并判断车速应降到什么水平,到红绿灯的地方才可以不用刹车,并通过语音主动通知车主采取措施。这样就可以降低车对于电量与油量的损耗,也有利于环保。
车载语音功能依旧“难用”
然而,目前智能语音也有死穴——“体验鸡肋”。
有业内人士认为,当前技术的最大瓶颈是如何让语音人性化,更懂人。“而现阶段的语音功能对于消费者来说其实是可有可无的。将被动智能转化为主动智能,还需要时间。”
根据相关主机厂反馈,车载语音仍然问题频出。比如无法唤醒、延迟卡顿、自激活/触发现象、自然语言理解不到位。“这和软硬件的质量以及网络的稳定性都有关系。”
虽然目前的软硬件技术普遍都可实现诸如设定导航、控制空调及车窗等最基本的功能,但一些子虚乌有的功能只能再次迷惑厂商的造车初心,也令消费者望而却步。
张人杰认为,如果厂商对于人机交互的逻辑没有很深的理解,并在技术上做相应适配的话,语音便达不到复杂云交互的能力,只能是鸡肋。“目前每个厂商的语音交互水平无非就是五十步与六十步的差别。对于用户来讲是基本感受不到的。这是一个很可悲的地方,我们作为从业者要想办法去改变这个状态。”
也有主流语音厂商认为,目前语音技术已抵达平台期,而真正的车载语音智能只有在车联网AI的发达阶段才能具备进化条件。其中涉及大数据,车路协同,5G等大的基础设施完备。
张人杰也提出,随着自动驾驶的商业化,语音主动播报和信息主动推送的应用场景将随之增加,相关技术也会逐步推进落地。只有当业务场景出现,语音才能真正成为人机交互的主要入口。
原因是,目前用户对于车载语音的使用需求和频率并没有跟上来。低频的语音使用习惯会使其价值大打折扣。
张人杰认为,消费者目前还是习惯通过物理或触摸按键来实现各种功能的实现。另外,很多人机交互场景是比较私密的,而语音很容易暴露隐私。“不过此次的疫情也推动了无接触式交互的应用。有机会让普通消费者养成使用语音的习惯。”
商业模式思维需转变
尽管汽车智能网联的发展已有十年,但其在商业价值实现的路上却有不少挑战:近年车市下行的冲击、车载硬件性能不高、用户体验不够、产业链庞杂等。
而许多智能语音交互公司商业模式也一直在变化,从软件公司再到人工智能或数据公司,算不上“专一”。而多数语音厂商一味地用低价抢滩布局,也让市场陷入了不良竞争的恶性循环。
因此如果想让智能网联产业获得商业价值,必须重构认知,探寻新应用、新场景,最终产生新的商业模式。
张人杰认为,盈利并不可以只看业务本身,任何行业和场景,依靠单一的业务已经越来越难赚钱了。任何一个方向都会有很多实力相当的竞争对手,所以只能比别人想的多,看的多,掌握延伸场景,这样才可能找到商机。
坦率来讲,在AI行业盈利并不是一件容易的事,能赚钱的都是在做AI的垂直领域延伸服务。
比如,通过语音服务掌握相应数据,研究用户画像,同时也可以做一些智能推送,包括广告服务,车联网续费服务等。这些东西本身可能与语音并不是强相关的。但最终是通过语音促使消费者买单的。
在谈及语音收费模式上,张人杰提出,从消费心理学的角度来讲,当一件东西可以无限次使用的话,这样的服务才有价值。“语音交互的数据量其实并不大,如果按次收费的模式是很难被消费者接受的,而应参考类似宽带包月的方式,合理的价格,无限次地使用语音服务。”
大众问问希望站在消费者的角度,让语音实现方便,快捷,低成本。在研发和实施技术架构时也在想办法降低成本。
据了解,目前多数车企已将语音的云端与离线分割授权,以集各家之长。
而除了云端交互,大众问问在离线方面也在努力。比如,在车机计算资源非常有限的情况下,不通过云端就可以直接完成大部分基本的交互。这种交互对于服务端不会产生任何负担,只是利用车机的计算能力就可以完成服务的闭环。
“在基本对话的使用感受方面,在线与离线并不会产生很大的差别,但是离线可以降低服务端维护的成本,最后体现在主机厂的角度就是实施语音服务的成本大大降低。”张人杰表示。
据行业调研了解,目前结合云端和离线语音的单台车Licence成本约为40-50RMB。但云端还要另外算上服务器租赁成本。甚至车厂要求使用私有云的话,服务器的搭建成本可能高达千万级别。
然而根据其他语音厂商反映,本地识别由于受到数据等资源限制,在功能的实现上容易大打折扣。而且想要脱离开网络数据实现本地语音识别,从技术角度看似难度非常大。多数车企目前还是倾向于可以提供范围更大,内容更广的云端语音服务。
这也是为什么近年来,不少厂商开始推出车规级语音AI芯片来强化本地处理能力,这意味着未来语音离线处理能力将得到提升。
比如,思必驰在2018年与中芯聚源共同注资成立上海深聪,开始定制芯片。相比通用芯片,可进行低功耗唤醒,实现AI关键字和指令识别。
此外,该公司还在规划车规级AI芯片,未来车载语音交互体验尤其是本地化功能的体验将会得到提升。
目前,绝大多数车辆配备的车机系统都需要连接网络,对实时语音信息识别与处理。而云端目前存在的延迟对获取、处理实时数据并作出快速反应仍然存在技术瓶颈,要达到快速反应,车载产品依靠云端的算力是远远不够的。
而车规级智能AI在车机系统中增加边缘侧计算的能力,如汽车行驶在网络信号不佳的道路区域并不少见,所以提升边缘侧的计算能力可以让一些深度学习引擎在本地进行操作。
同时,芯片处理能力的提升,也可以解决车载网络的延时性,提升了语音识别的准确性、导航地图的清晰度与反应速度、车载娱乐信息也可以更加快速的读取。
而在小鹏汽车北京团队负责人赵恒艺看来,“论产品化能力和工程创新能力,国内企业比国外强。”这意味着语音本地化开发能力将是核心竞争力。


继续阅读
阅读原文