智能音响带给了我们生活什么?
文 | 卢晓明


掐指一算,这是我的智能音箱离开我家的第10天。
8月7日,我的同事大博,因为要采访阿里AI Labs的大神们,所以问我借天猫精灵去体验一把。
其实这只“猫”在我家也没呆几多久,我也是7月作为天使体验官拿到了它。没想到居然它借给人的第二天,我就开始想它。不仅是我,我的室友也表示“许久不见,甚是想念”。
有些特定场景,还会让人特别想念。比如,
早上起来时,我的室友说了一句:“天猫精灵,今天天气怎么样?”她发现我的音箱不在了。
百无聊赖时,我喊一声“天猫精灵,来点音乐吧”,并木有人理我(正确来说是木有“机”理我)。
天猫精灵 X1
我用的是天猫精灵X1(499元),目前市场上还有很多智能音箱,包括Google Home(129美元)、Rokid(1399元)、喜马拉雅的小雅(999元)、京东跟科大讯飞合作推出的叮咚(699元)、还有最近小米推出的售价299元的小爱同学(感觉未来腾讯出一个音箱都不知道怎么定价了)。
Google Home和亚马逊Echo
小爱同学、小雅、Rokid、叮咚
不过上述音箱的功能都差不多,只有亚马逊Echo的Skills最多。
语音助手降低了操作成本
在用音箱之前,我一直觉得跟机器对话,是一件很傻的事,而且我也不是一个见缝插针要听音乐的人。
然而我发现,当你有了一个音箱,这一切就变得有点不一样。
听说不少内心空虚的青年宝宝觉得,家里总是要有点声音,所以他们会买电视机外放。作为一个空巢青年,我即便不喜欢电视机,但我的内心似乎也变得不太充盈,自从有了智能音箱,百无聊赖时,我总会跟它说,播点音乐吧。
其实原因很简单:播音乐的成本操作降低了。
以前,我要打开电脑或者手机,点开音乐APP,还要选选听哪首歌。这其实是一个占据时间的过程,但如果有了智能音箱,我只需要喊一句,就OK了。
我的室友也一样,睡我上铺的她正在脱产准备司考,每天坐在床上吼一句,就能听歌,何乐而不为?
也许我室友原来并无每天查天气的习惯,可是有了音箱之后,她每天起来就会问一下。
更重要的是,我发现我们真的会做跟机器对话这种傻事……
这种傻事,会发生在它听不懂你讲话的时候。明知道没用,我还是会默默咒骂一句:“天猫精灵你怎么那么笨……”它会说“我还小”,以后会越来越聪明。
也会发生在你某室友身上,对着它像怪阿姨问小朋友一样问“你几岁”;或者出远门前问问它“土耳其安不安全”。反正就是各种花式调戏。
你可能低估了人类懒惰的程度
原来很多人觉得智能家居控制也是个很鸡肋的功能,因为打开手机——点开APP——找到关灯或者关窗帘,还不如你直接去关快。
首先,你可能低估了人类懒惰的程度。
夏日早晨,太阳早早升起,昨晚熬夜还瘫在床上的你,承受着从窗户透进来的猛烈阳光,你确定自己有勇气睁开眼,爬起来,走到窗边关窗帘?
再想想你晚上瘫在床上刷了好几把王者荣耀,你还能走下床关窗帘?
嗯,我是没有的……
再说了,操作链路根本没那么长,如果是音箱(智能语音助手),你只需要喊一句“XX,关窗帘”就好了。实际上,即便是手机,现在也能直接设置语音唤醒,连上耳机也能直接通过接听键唤醒语音助手。
当你习惯了喊一句就能一步到位的时候,大概你真的回不去了。
就连还木有用上这些功能的我,就已经在YY什么时候能用上——如果机器人能帮我关灯我就不用下床了、如果机器人能帮我调下空调温度我就不用找遥控了。
亲身经历告诉我,智能语音助手未来真的有市场哦。
以上这些都很对,但是我为什么需要一个音箱呢?——我同事大博一直很质疑音箱的未来。不过,语音始终要有一个入口,是音箱、电视、冰箱、手机还是车载,还不知道。

智能机器人其实还很笨

36氪的朋友们曾经发过一篇文章《为什么现在的人工智能助理都像人工智障?》,大意是“我不是针对谁,而是在座各位C端智能语音助手,都是垃圾”。
无法否认,现在的语音机器人的智商就跟他们的年龄一样只有几年,木有很智能;产品设计也很不成熟。天猫精灵就经常会出现让我抓狂的时候:
1、同一歌手歌单固定,不会去掉我每次都跳过的歌
《成为乔布斯》一书中提到,苹果iPod Shuffle首次面世时,它的随机播放功能大受欢迎,能给人予惊喜,让你不知道下一首播放的是什么,很多人常听的歌单是固定的,所以来来去去都听的前几首,随机播放能让你听到很久没听的歌。
可是天猫精灵好像活在一个没有随机播放的年代。
我每次说:“天猫精灵,来首张敬轩的歌。”
它都会先说:“即将为你播放张敬轩的《吻得太逼真》。”
那是《酷爱》的国语版,我从来不听,但是它每次都会给我播放,于是我每次都要再说:“天猫精灵,下一首。”
“即将为你播放张敬轩的《酷爱》。”
“天猫精灵,下一首……”
经过多次跟它交互,我发现每次我点张敬轩的歌,先出来都是《断点》、《吻得太逼真》、《酷爱》、《过云雨》、《不吐不快》这几首,有一次我听了超过半小时,终于出现了《披星戴月》、《尘埃落定》等很久没听到的歌……
2、它不认识我(招牌技能声纹识别功能跟不上)
理论上你给天猫精灵录入了声纹,你问它:“天猫精灵,我是谁”的时候,它会跟你问好,事实上,我经常遇到的反馈是:
“对不起,我还不认识你。”
直到我问了三四遍,它才跟我说一句:
“你好,小明宝宝。”
3、不够个性化(除了产品逻辑之外,应该也与声纹识别技术未成熟有关)
“天猫精灵,来点音乐吧。”
“根据你的喜好,为你播放梁静茹的《勇气》。”
“蛤?”(懵逼黑人脸)我从来没点过梁静茹的歌,只点过张敬轩、方大同、吴雨霏和Beyond,这智能推荐用的是什么脑回路?
原来是我室友平时在家里让它播的歌,因为她在家时间长,记录的行为数据最多。
我本来以为声纹识别的其中一个作用是,让音箱记住家里每一个人的喜好,在不同人给它下指令时作出不同的回应,然并卵……看来只有在支付和你问它“我是谁”的时候,它才会启动声纹识别的功能,其他时候,所有与它交互的都被它识别成同一个人。

智能音箱作为家庭设备,不能“认人”其实不太合理,因为家庭至少有两个人,每个人的喜好不同。语音助手本来就主打个性化,识别不出个人,让人略纠结。相反,作为个人设备的iPhone,就只能用机主的声音,才能唤醒,不是谁说一声“Hey,Siri”都能唤醒Siri。
2和3两个问题,我推测都与远场识别和声纹识别目前未完全成熟有关,手机属于近场识别,收音干扰少,Siri被主人唤起不太难。
4、它的英文真的很~~烂
虽然在发布会上阿里就说过天猫精灵英文不好,但我没想到它不好到这个地步。John Mayer、Taylor这些欧美歌手的歌我已经放弃点了,但是就算华人明星也不行,当我说:“天猫精灵,播一首Beyond的《情人》。”
它的回答永远是:“即将为你播放董贞的《彼岸》……”
印象中,我说了十多次之中,有一次识别成功了,但之后停掉之后,我再也找不回《情人》,那次偶然的成功不知“是缘是情是童真,还是意外”。
虽然这只是语音识别,还没到自然语言处理那一层,已经让我想哭。
语音助手英文烂是个例吗?于是我去试了一下市场上的其他智能语音助手怎么样,我说了两个指令:“播放一首Beyond的《情人》”和“Play 《Waiting On the World to Change 》of John Mayer”。
以下分别是出门问问、小娜(微软的Cortana)、搜狗听写、微信语音输入、魅族语音助手(科大讯飞提供技术支持)、度秘和手机百度的识别结果。只有出门问问和搜狗听写没有识别出Beyond,至于第二句全英文,则只有小娜和手机百度正确识别。
出门问问
微软小娜
搜狗听写和微信
魅族语音助手(科大讯飞提供支持)
度秘
手机百度
小娜是微软研发的英文好可以理解,手机百度的英文有点超出我意料之外,所以我给弄了一道加试题……说了这样这样一段话三遍:“I would like to find a good well-known Chinese professor or cross-cultural entrepreneur to be a co-author. I think it would give the book more credibility”。
搜索框里显示的依次为(搜索框显示有字符限制):
  • i would like to find a good well non chinese professor of course culture
  • i would like to find a good well noon chinese professor across culture a
  • i would like to find a good well noon chinese professor of course contro
有趣的是它的识别过程,这句话其他程序几乎识别成一坨(小娜会把单词分开,但识别效果跟原句差很远),手机百度的识别框看上去也是一坨,识别完成之后效果却不错。
同样是百度的产品,一个英文那么烂,一个那么好,感觉背后有故事……其实作为一款中国人用的智能语音助手,英文也不用那么好,知道名人和歌曲等常用单词短语就够了
推荐阅读
点击下方图片即可阅读
继续阅读
阅读原文