2016年6月2日,有“互联网女皇”之称的玛丽·米克尔在美国Code大会上第21次公布了年度《互联网趋势》报告,阐述了2016年最为重要的全球互联网现象、判断以及发展趋势。根据报告,在技术终端和平台方面,持续近十年的以智能手机为核心的移动互联网模式正逐步增速放缓,而在家居、车载和移动场景中,新的以语音为核心的交互模式渐成风口,巨头和创新者纷纷涌入。
新平台已经出现!
根据报告数据,全球智能手机用户数量和出货量在2015年增速大幅放缓,作为智能手机典型代表的iPhone的销量在2015年也已经接近天花板,而亚马逊智能音箱Echo销量正在大幅增长,现在销量已超过400万台。

这些数据都与近期众多科技界的其他动向相关。例如,最近英国媒体BBC就曾报道,微软宣布了针对于移动事业部门的裁员,并且除此之外,微软很有可能将智能手机业务从公司主体业务中剥离。而《金融时报》在采访复苏后的诺基亚时,其技术部门总裁也表示诺基亚1.7亿欧元收购法国Withings后,将开发一系列主打健康和健身追踪的消费类电子设备,并不会重返手机市场。
正如“女皇报告”所指出的,在过去的75年中,基本的人机交互每隔十年就会出现创新变革。换句话说,在2016年我们极有可能看到以Siri和亚马逊Echo为代表的语音智能时代到来。而从“键盘模式”进入到“键盘+麦克风模式”,可能并不只是软件的变化,还意味着终端工具的变革。

语音爆发?传统巨头撬动的杠杆

根据报告,在过去数年间,包括谷歌、百度和SoundHound在内的巨头语音软体技术提供商的性能和用户使用数量都呈几何级增长。
而女皇眼中,语音交互的用户普及率也大幅上升最主要取决于技术性能的显著提高,以及语音界面随时访问、容易操作、成本低且便携等特点。而传统巨头的语音技术在低噪音环境语音识别和搜索,单词识别准确率已达90%,甚至达到人类级别,从而使得语音界面渐渐流行。


然而正如报告本身所指出的,百度、谷歌和Sound Hound等巨头的识别准确率仍然与颠覆性的99%存在差距。这意味着巨头本身的技术可能仍不能令用户完全满意。
一个被忽略的数据是,在用户使用语音技术的原因方面,2014年到2015年最明显的变化是用户对于语音技术的意识和知晓度原因占比有明显提高,和技术改善并驾齐驱。
而这与各大巨头自2016年蜂拥入语音交互领域,造成的强大宣传攻势可以说不无关系。
报告中引以为典例的亚马逊Echo,代表了语音硬件发展模式的两大核心方向。通过Echo硬件平台载体,以Alexa语音服务为核心,越来越多的第三方硬件OEM和软件服务开始出现,一方面,不断针对用户在家居、车载和移动场景下的需求痛点,完善语音服务的技能,另一方面,增强不同设备之间的连接性。而其今年连发两款分支产品,迅速让Alexa成为科技界明星。


在前不久的谷歌I/O大会上,谷歌大力推出了其语音交互软体核心Google Assistant以及以此为基础的Google Home智能家居体系。同时,据传言,苹果也正基于Siri SDK体系研发自己的智能音响,从而在语音硬件领域抢滩登陆。
如此之多的巨头动向,确实很大程度上撬动了消费者认知,同时反观巨头们在某些专门技术上存在的局限,可能它们是更大意义上的技术普及者。

创新者的历史突破
语音崛起的时代除了巨头参与,实际上也不乏越来越多的创新者加入游戏,而且实际上一些语音交互创新者在专门领域的积累远早于巨头。语音交互时代来临实际远非“后知后觉”的拐点。
据美国《连线》杂志报道,1979年,年轻的乔布斯参观了Xerox PARC一个位于加利福尼亚的传奇研发实验室,亲眼见证了“图形用户界面”,这就是如今PC和手机硬件的主要交互基础。而也恰恰是在此次访问的同时,PARC的另一个团队正在研究另一项完全不同的人机交互模型,即我们今天看到的“语音对话式交互界面”。
当时这个团队中一个名叫Ron Kaplan的矮胖科学家,如今则是Nuance Communications的副总裁和首席科学家。“40年后,”2016年,Kaplan在接受媒体采访时说,“我们准备好了”。Nuance成立于2005年,时间早于包括亚马逊、谷歌、苹果和百度等巨头的大多数语音研发团队立项,并且是Siri最主要的技术供应商。
同样是在泛场景的软件技术层面,除了谷歌、百度和SoundHound,诸如科大讯飞、云之声等国内语音技术供应商也正在建立完整的软件体系,提供中文语音和方言识别、声纹识别等技术,以及教育、会议、家居、车载、医疗等特殊场景。在这些具体的垂直领域中,它们的语音识别正确率甚至达到了95%以上,远超诸如百度、谷歌和SoundHound平均正确率约90%的水平。正如报告所指出的,语音识别率和延迟一直是语音识别的技术难点,在这个层面上,创业团队似乎已经取得了优于一些传统巨头的先机。
国内已有公司将语音智能产品投放到消费市场。近期,出门问问开始通过“开车问问”App涉足语音车载系统,它能够提供语音查询天气、语音导航、语音接打电话、语音车内娱乐等服务。出门问问于2015年10月获得谷歌C轮融资,估值约3亿美元,而在“开车问问”之前,其研发的智能语音手表TicWatch也是较早搭载语音控制的智能手表之一。

在移动场景中,包括VINCI智能头机和Bragi Dash等在内的语音智能硬件,则更深入地将场景细分,让用户能够真正地在通勤、旅行、逛街等具体场景下解放双手和双眼,而如此完整且独立的户外听音语音识别体系。其功能类似于户外场景下的耳机版亚马逊Echo,实际上,以耳机为基础的语音硬件仍然是传统巨头的空白领域。

观察整个语音技术行业,巨头虽然在把握大趋势、体验完整性和市场占领方法上尚领先于创新者,但是如果针对某项特定技术或某个特定场景,创新者却有着更多的深入探索。
不过共识是,巨头和创新者们的竞争与合作正在催生一个新的智能平台,然而这一次,没有人后知后觉。
------------------
关注如下我的微信公众号“董老师在硅谷”,关注硅谷趋势,一起学习成长。
继续阅读
阅读原文