Sonos王汉华:智能音箱乃AI之争 未来应开放平台

[导读] 2014年12月,亚马逊Echo发布后,通过语音交互的智能音箱便逐渐流行起来。Echo面世仅4个月后,京东第一款叮咚音箱立项。今年4月,腾讯推出“腾讯叮当”入局智能语音,之后三天,百度和小鱼在家联合发布新款人工智能视频通话机器人“分身鱼”。

2014年12月,亚马逊Echo发布后,通过语音交互的智能音箱便逐渐流行起来。Echo面世仅4个月后,京东第一款叮咚音箱立项。今年4月,腾讯推出“腾讯叮当”入局智能语音,之后三天,百度和小鱼在家联合发布新款人工智能视频通话机器人“分身鱼”。7月5日,百度AI开发者大会,DuerOS开放平台正式亮相。同日,阿里发布了自主研发的AliGenie平台及智能音箱“天猫精灵X1”。

如今,BATJ各大阵营都已聚齐智能音箱领域。同时,联想、小米等也都悉数到场,发布会一个接着一个,目前国内在做智能音箱的企业已经超过百家,众多厂商以及相关的硬件企业或技术提供商也都跃跃欲试,不断冲击着这个市场,智能音箱俨然已成下一个风口。而智能音箱为何在今年如此火爆?背后有什么利益因素?国内外相比有何差距?未来的智能音箱应该如何发展?关于这些问题,媒体采访了Sonos大中华区总裁王汉华先生。

sonos72501

语音交互促使智能音箱成为智能家居入口

科技在过去20年发生了巨变,逐渐影响到个人、影响到办公,但是对于家庭的影响却不是太大。不像智能机和功能机翻天覆地的变化,也不像特斯拉与传统汽车一样发生本质上的变化,家用电器几乎没有发生什么变化,有的只是电视机更大一些,屏幕更薄一些,色彩更鲜艳一些,但是体验几乎没有创新。随着语音交互的出现,智能家居的入口逐渐来到。

虽然对于智能家居的入口产品的看法存在着很多假设,从最初的网关、到后来的电视、还有可能是全新的电器平台,比如国内厂商海尔的U+平台等等,都有厂商进行过尝试。但是当国外以Amazon Alexa Echo代表的产品冲出来之后,越来越多人认为这个会是将来的入口,其中一个主要的原因是人机交互技术的变化。技术发展的最终目的仍然是提供更多的方便性给人类,从最初的键盘交互,到后来移动时代逐渐流行的触摸交互,方式正在变得更加简单化。然而进入智能时代后,人机交互最方便的仍然是声音。

智能音箱背后是一个巨大的生态系统

以语音的交互为主要内容,但智能音箱的背后其实是一个巨大的生态系统,包括端、云以及服务。主要四个方面,即是语音识别、语义分析、内容反馈、声音模拟。从听得见到听得懂、到提供内容到后通过智能音箱发出来,四个环节都有核心技术。

对于Sonos而言,重点集中在声音识别,以及播放音质上面。王汉华表示,Sonos有着15年累计下来的技术性积累,比如在麦克风阵列上,市场上也有提供标准的麦克风阵列的方案,但是现在的很多方案都会是标量的麦克风阵列,一个是多少的问题,两组的、四组的、六组的,还有大小的指标,但是提供不了方向。而Sonos做的是矢量的麦克风阵列,不光能知道声音从哪儿发出来,麦克风阵列会调整搜集声音的方向,这个是核心的技术。同时对于所有的智能音箱,核心的功能应用依旧是听音乐,而在这一点,Sonos无疑是有着15年特别是家庭音响上面有积累的公司。

同时,下半年Sonos也会推出带有语音交互的智能音箱,目前是与亚马逊合作,在声控方面用亚马逊的Alexa,整合Alexa整合的内容。而在国内,目前仍在和科大讯飞、百度等进行商讨。

智能音箱乃AI之争,未来应该是开放平台

智能音箱之争背后实质是人工智能之争,大数据的支持与训练和调用频率对于一个人工智能产品的进化有着非常重要的作用。在国内,毋庸置疑,各类数据依旧掌握在BAT三大巨头的手中,百度掌握着大量的搜索数据,腾讯掌握着社交与内容是数据,阿里则掌握了大量的电商与生活服务数据。这是巨头的优势,但也是巨头极力想要争夺的,最近BAT等纷纷推出智能音箱,就是因为把它当作了诸多服务和获取用户数据的最佳入口。

同时从这个角度来看,Echo模式是有局限性的,尽管Echo产品销售了千万台,并且亚马逊Alexa本身正在成为开放平台,但只是基于亚马逊自己的生态。

王汉华表示,未来的智能音箱应该是一个操作平台,一个开放性的HomeOS。智能音箱上面会有不同的application,就像手机上有不同的APP一样,通过SDK接入和协议接入,可以有更多的硬件产品连接。在提高自家的语音系统使用范围的同时,也可以积累更多的数据。

中外相比有差距,但不应低估智能音箱的发展

王汉华表示目前国内的智能音箱与国外仍有很大差距,首先是在反应时间上,亚马逊杰夫·贝佐斯曾说如果一个产品的response time高于3秒钟的话,这个产品就失败了。人和人对话的时候,一个问题问过去,可能思考3秒钟对方是可以接受的,如果超过3秒钟觉会很不自然。其次在回答准确率上,国内的智能音箱普遍不好。王汉华认为,识别的准确率在80%以上才算是合格。在核心技术方面,国内也有差距,目前很多人仍然是在做标量的麦克风阵列,导致识别率不高,同时由于汉语的特殊性以及方言的多种多样,导致算法上对于语言的理解仍然有很大问题。

一个产品的周期很难预测,没有任何人能够知道这个产品现在很火,明年会怎么样。在语音交互的发展中,智能音箱也许不是唯一的终端,但想必也不可缺少。比尔·盖茨说过一句很经典的话,“任何技术短期之内都是高估它的,长期都是低估它的”。王汉华认为我们不要犯这个错误,长期不要低估它,智能音箱也许就会变成智能家居入口级的产品。

未经允许不得转载:数智网 » Sonos王汉华:智能音箱乃AI之争 未来应开放平台

分享到: 更多