一盏台灯开启AI的端智能时代

[导读] 近年来,由于机器学习以及大数据的迅猛发展,让图像识别、语音交互、生物医疗、交通运输等领域发展迅速,机器也逐步朝着真正能够理解人、帮助人的愿望发展,功能单一的家电设备甚至不联网也可以听懂命令、自动操控,比如小编近期了解到的一盏台灯,它只需要用关闭、打开、调暗、调亮等简短的语音命令,就可对其进行控制,甚至无需唤醒词、不用经过云端的大数据汇集。

近年来,由于机器学习以及大数据的迅猛发展,让图像识别、语音交互、生物医疗、交通运输等领域发展迅速,机器也逐步朝着真正能够理解人、帮助人的愿望发展,功能单一的家电设备甚至不联网也可以听懂命令、自动操控,比如小编近期了解到的一盏台灯,它只需要用关闭、打开、调暗、调亮等简短的语音命令,就可对其进行控制,甚至无需唤醒词、不用经过云端的大数据汇集。

语音交互的云平台和本地端应用

语音交互技术作为人工智能重要的一个分支领域,从最初由声控虚拟助手来补充云端的语音信息库,到大量的误听、误解命令的服务机器人、智能音箱等产品的出现,发展到现在的,一盏台灯、一个晾衣架、一台风扇,更多本地端的语音交互应用也逐渐被细分出来,但是否这样的端智能就会是机器智能交互的最终形态呢?

(欢迎补充,数据持续更新…)

(欢迎补充,数据持续更新…)

就目前来讲,做语音交互云平台的数量是要多于做端智能的企业,两者的区别在技术本身除了联网之外,并没有太大的差别,可是反馈到终端产品以及应用场景中,就会带来一些不同的体验感,其一是功能性,端智能的功能更加明确,错误理解率会小于云智能,命令反应时间也会快于云智能,但端智能能够满足的产品功能种类会比较单一,目前还只适用于简单的家电控制,像台灯、风扇、空调等。

其二是趣味性,这也是功能性的延伸,由于云端不受资源的限制,可以有更大的数据库,更强大的语义理解功能,除了可以增添家电控制、天气、交通、时势信息的查询等硬性功能外,陪伴聊天、娱乐也成为了云端智能的新颖噱头以及未来可能的发展方向。简单点来说就是在端智能和云智能的优缺点中做一些取舍,假如我们需要更多种类的软性趣味功能,就势必会有一些硬性的功能方面的小瑕疵。

AI201806222

互问以AM1032作为分布式家居中的智能节点,和现在形态还不确定的家庭中控实现分布式智能家居平台

 处理语音数据的技术赶不上其增长的速度

目前很大一部分选择发展云智能的原因都不外乎两点,一是技术上还不能够满足明确的应用场景,这里的技术具体是指前端的语音处理,如远距离拾音、降噪、回声消除、去混响、声纹识别、音源定位、音源跟踪,小size算法模型,麦克风阵列等,据小编了解目前市面上存在的智能音响,只有相对安静的环境下使用一般说话的声音大小(大概60分贝左右),能够达到3到5米的拾音距离。

前端语音的处理或许在比较安静稳定的环境里面体现不出来太大的差别,但是如果在汽车、室外等并不稳定的环境里,设备的“听力”就会变得格外重要,毕竟听不到又怎么能听懂,何况就现实来看,不稳定的环境因素是必然存在的,所以无论是云智能还是端智能,想要有更多的应用场景、更好的智能体验效果,都是需要不断提升前端语音处理技术的。

目前市面上有提出两种解决方案,都是利用高性能数字信号处理芯片DSP(Digital Signal Process)技术来实时进行语音识别,互问的圆形麦克阵列板是其中之一,这是一个将软硬件结合的方案,它的拾音距离是10米范围内(连续可调),具备回声抵消、声源测向、混响消除、噪声抑制、可调拾音方向、可调拾音距离等一系列功能。还有一种解决方案是美国的Synaptics公司提出,是可以通过软件的方式来处理,目前可达到在噪音较大的环境下进行远至5米的无缝语音控制。

Synaptics的官网图片

Synaptics的官网图片

选择云智能的第二个原因,是布局大数据。数据的价值已经被等同于能源,而当前我国90%的数据是来源于近两年的积累,毕竟大数据的发展是依靠互联网以及移动互联网的应用推动。而语音交互云平台只有积累更多的语音信息数据,才能运行更大更多的深度学习神经网络。

百度在15年开发出的“深度语音识别系统”(Deep Speech 2),它就是在拥有一个非常大的、“深”的神经网络的同时,不断的学习、引入数以万计的转录语音,目前Deep Speech 2在口语识别的准确度方面十分惊人,有时在识别汉语语音片段方面比人为识别还要准确。但还是有部分人认为目前的深度学习更倾向于蛮力计算,处理语音数据的技术是赶不上数据增长速度的。

从中心化过渡到去中心化,是否任意端都可以成为中心?

由于上面的两个原因,BAT企业大都会首先选择发展云智能,提供云平台服务,尽管应用领域的侧重点不同,但并不影响他们建立自己的云端数据中心,最终这些数据细分输入到不同的领域的应用场景中,成为一个个能够进行语音交互的机器设备,可能是会像文章一开头所讲的台灯、风扇一样,也有可能是某个类似智能音响一样的中央控制器。

从现在发展的趋势来看,从中心化过渡到去中心化,似乎是必然的发展规律,但如果想要构建一个像科幻电影里面一样:可以掌握听、说、读等多种能力、适应更多可变化的场景和环境、能自我完成多数任务的机器人管家,一个真正的人工智能集合体,就一定是建立在大数据共享的条件之下。

这就需要每个端智能都成为一个中心,或者说是将端智能和云智能的方式相结合,这目前是一个尝试,毕竟目前的技术已经解决了部分的简单任务,像单一的家电控制,这些清晰而简明的数据信号。但是如果有那么一天我们需要面对更为复杂智能化,以及其背后更具生命性的特征时,我们是否就会有取舍和决断。毕竟有些观点是说,如果我们想要绝对的智能我们也将不再会有隐私。

未经允许不得转载:数智网 » 一盏台灯开启AI的端智能时代

分享到: 更多