像触控屏颠覆软键盘一样,新交互技术的出现和实用也将改变智能手机市场。
一个常见的科幻大片场景:主角只要动动嘴,所有设备就可以立即按照指令行动。这无疑也是语音交互技术发展的最终形态。而作为大众生活中最为常用的移动终端,智能手机的语音交互研发也已成为各手机厂商的“必争之地”。而相比摄像头的数量、全面屏的面积,开发一个智能语音助手显得有想像力多了。
“语音助手”+专属唤醒按键已成标配
10月31日,预热两个月之久的荣耀Magic 2正式发布,与同为滑盖全面屏的小米MIX 3可谓“前后脚”。但无论是从发布会本身在功能介绍上的时间分配,还是此后的媒体报道,比起滑盖全面屏,荣耀Magic 2都将更重要的位置留给了智能语音系统YOYO。
事实上,在手机外观设计达到瓶颈、硬件升级趋于常规提升的大环境下,智能手机的“内在”成为升级的潜在可能。首当其冲的,或许就是智能语音助手。
2011年,被视为核心功能的Siri在iPhone 4S上惊艳亮相。语音功能与当时“最受欢迎”的手机相呼应。当时,与Siri之间的对话、调侃也一度成为用户的一大乐趣。在苹果尚未被唱衰创新能力的时间里,Siri也被寄予了厚望。
7年后的今天,Siri已不是手机语音助手市场里的“独苗”。作为如今智能手机的标配,语音助手已占据各手机厂商的旗舰机型。三星的Bixby,小米的小爱同学,联想的乐语音等,各种名字层出不穷。即便在对YOYO的介绍上,荣耀手机将其定义为“智慧生命体”,并特别希望避开手机语音助手这一概念,但其本质上也是在同一逻辑下演变而来,即在语音交互功能之上,赋予系统更多的主动触发行为。
根据市场研究机构Strategy Analytics的报告,截至2018 年8月,在全球在售的智能手机中,47.7%配备了语音助手,预计到2023 年,语音助手的渗透率将达到90%。
为了让用户更好地体验语音助手功能,实体按键在如今“去按键化”的手机设计上被重启,专属语音助手按键越来越多的出现在各手机品牌旗舰机型的设计中。从S9的Bixby按键,到vivo NEX的Jovi AI按键,在语音唤醒略显“尴尬”的情景下,实体按键显得更为方便。而相比触屏触发,按键的唤醒也更为快捷。
理想和现实之差,语音交互“瘦身”行动
在电影《她》中,主角因与操作系统中的人工智能语音聊天而找到了心灵慰藉,虽然电影中双方的交互仍是你问我答的简单形式,但科幻性的处理方法让语音助手的反馈显得格外具备“人性”。
如果将这一场景放到手机语音助手领域,这种强理解性与交互性之下的语音系统自然是一个完美的“助手”。只是就目前来说,语音助手的境地十分尴尬。
试想下,当你想发送一条微信时,你会选择手动点开APP,还是会在唤醒语音助手后,大声说出“打开微信”来进入APP主界面?抛开语音识别能力的问题,在用户使用习惯上,手动打开APP仍是第一选择。语音的出现,也只是弥补了特殊情况下的需求,如驾驶、双手不便拿手机等情况。
而现实是,打开或关闭APP几乎成为多数手机语音助手的功能极限。我们可以将手机语音助手的很多问题归结于目前语音识别、语意理解等人工智能技术瓶颈,在这一前提之下,为了更好的交互体验,手机厂商纷纷选择给语音助手进行触发行为方面的“瘦身”。
在今年6月的苹果全球开发者大会上,苹果推出Siri Shortcuts快捷功能。在这一功能之下,用户可以自定义操作行为和触发关键词,即当你说出预设的关键词后,手机将依照此前被编辑的行为自动操作。
在当时的大会上,苹果也现场展示了如“回家”这样的快捷功能。当说出“回家”这一指令,Siri则会按照事先的设置打开地图导航回家、设置好家里的温度。Siri也不再是此前“呆板”的对话模式,在实用性上,无疑更好。只是这种类似编程的逻辑推算模式,对于初次接触的用户并不友好。苹果似乎也意识到这一点,在最新的系统更新中,Shortcuts APP内已为用户预设了多个使用场景,基本已经可以满足常用需要。
这样做的不单苹果一家。三星的Bixby快捷指令、Jovi的自定义增添指令等,都是在语音识别的范围内,通过识别上“瘦身”,最大程度保证使用效果。就目前来看,这种方式也的确更实用,也更为多元化。
相比理想中对答无障碍的语音助手场景,高效、简单的语音操作似乎也更适合手机语音在“助手”功能上的实现。唯一美中不足的,这种方式的延伸性并不强。
手机品牌 语音助手 配合手机发布时间
苹果 Siri 2011.10
三星 Bixby(中文版) 2017.11
华为 小E 2017.10
OPPO 小欧助手 2018.3
Vivo Vivoice 2017.9
小米 小爱同学 2018.3
LG Google assistant 2017.9
联想 乐语音 2016.5
从识别到听懂,打通APP生态成关键
“其实单从语音的识别功能上,目前主流手机厂商采用的语音助手都可以完成,在普通话这个标准下,准确率还是比较高的。但是语音识别让人觉得‘鸡肋’的点主要是系统与手机APP功能之间没有很好的合作。”一位从事语音识别的工程师如此说道。
从用户使用和体验角度来看,手机厂商在语音助手领域上的竞争,比的是谁家的语音助手做到的事情更多。除了语言理解,还有对手机内所能触及的APP的覆盖。手机厂商自然也理解这一点,在发布语音助手的同时,其所支持的软件开发方也越来越被看重。
去年11月,三星正式发布旗下语音助手Bixby中文版。在发布会上,三星负责人表示Bixby中文版已支持超过30款原生应用。同时,还支持数个第三方主流应用,如爱奇艺、百度地图、摩拜单车、支付宝等,所覆盖的应用数量也在持续增加。而在今年小米8的发布会上,语音助手“小爱同学”也已与30余款APP开放商达成合作,涵盖视频、导航、音乐等领域。两个月后,VIVO NEX的发布也为旗下语音助手Jovi“捆绑”上了微信、百度地图、淘宝、滴滴出行等常用APP。
业内人士表示,由于智能手机的很多功能是通过各类APP软件实现,所以很难抛开软件的支持看语音助手的发展。“越来越多的手机厂商开始看重手机的语音交互,在技术存在瓶颈的前提下,和各软件方的合作会显得越来越重要。因为功能越广,更容易培养用户使用习惯。从目前的实用性来看,其实各家手机品牌跑的距离并不远。”
与此同时,语音助手市场的竞争也并不只限于手机厂商,包括语音识别、人工智能领域的巨头也早已进入。
来自Strategy Analytics的数据显示,截至2018年8月,手机语音市场份额的前三名分别是Google Assistant,Siri以及百度 DuerOS。在安卓、iOS两大手机系统之外,人工智能技术正在给语音助手的发展提供足够的支持。
包括在VIVO NEX、OPPO FIND X、华为P20/P20 Pro等机型的语音助手基于百度DuerOS开发,而小米的小爱同学则是基于微软的语音识别引擎。2017年底,百度DuerOS更是与高通达成战略合作,DuerOS正式成为骁龙845移动平台默认参考的AI语音解决方案。
在语音助手这一层面,已经不单单是手机一家的事。