迈上新台阶 加强版四、五、六麦克风阵列即将上线

[导读] 麦克风阵列作为语音交互的重要枢纽,对人机交互的效果起着至关重要的作用。为了让机器耳朵更灵敏、让人机交互更畅通,智能硬件业务部麦克风阵列小组进行了为期数月的研究开发,终于让加强版的四、五、六麦克风阵列(以下统称为多麦)于本月与大家见面了。

麦克风阵列作为语音交互的重要枢纽,对人机交互的效果起着至关重要的作用。为了让机器耳朵更灵敏、让人机交互更畅通,智能硬件业务部麦克风阵列小组进行了为期数月的研究开发,终于让加强版的四、五、六麦克风阵列(以下统称为多麦)于本月与大家见面了。

本次升级侧重点在软件层面,硬件不涉及任何的调整。全新升级之后的多麦无论是在功能还是在性能方面,较之前都有了显著的提升,会让大家拥有更完美的语音交互体验。

软件层面的全新升级

麦克风阵列的应用场景在人工智能时代的催化下,日益丰富,为了满足这些场景需求,多麦进行了以下功能拓展:

1三种拾音模式

目前多麦已经支持唤醒拾音模式、定向试音模式和全向拾音模式(也称之为通话模式)三种拾音模式,后两种拾音模式为本次新增模式。唤醒拾音模式即目前常规的麦克风阵列唤醒模式,麦克风阵列在开启拾音功能之前,必须处于唤醒状态;定向拾音模式主要是为了适应声源的动态变换,使设备可以跟踪声源进行拾音,该模式常用于机器人等场景;全向拾音模式主要是应用于通话和会议场景,准确拾取空间内所有有效声源发出来的声音。

2中英文唤醒词

升级之后的多麦支持双语唤醒词,既可以支持中文唤醒词,也可以支持英文唤醒词。不过需要注意的是一个唤醒词资源中最多可同时存在五个同语种唤醒词,开发者使用时请注意。除此之外开发者还可以利用讯飞开放平台给出的“唤醒词质量评估小工具”评估自定义唤醒词质量,选取最合适的唤醒词。

3唤醒效果监测

新算法还可以针对唤醒结果及时给出有效评分,开发者可参照相应结果,有针对性的调整门限参数,以实现理想的唤醒效果。

多方性能优化

除了在功能上实现全面升级之外,多麦在性能优化方面也取得了明显成效。无论是识别率、唤醒率还是角度准确率,测试结果显示都要优于之前的效果。四、五、六麦在安静环境下识别率、唤醒率和角度准确率基本都在95%以上,在噪音环境下三项指标基本也都在90%以上。详细数据请参考表一、表二、表三。其中安静环境是指45dB风噪条件,噪音环境指55dB家庭环境噪音条件。而在三项指标中,唤醒率优化效果最为明显,升级后的多麦将采用全新的唤醒资源,相信会给大家带来全新的唤醒体验。

m1 m2 m3

本次在功能和性能方面的双重提升,使麦克风阵列的应用将迈上新的台阶。麦克风阵列升级版本预计在本周正式上线,上线之后四、五、六麦的购买信息统一在讯飞开放平台上的“六麦环形阵列”页面内展现,敬请期待。

最后,如果麦克风阵列的老朋友们有升级的需求,现在就可以直接联系我们的技术支持进行版本升级哦。

未经允许不得转载:数智网 » 迈上新台阶 加强版四、五、六麦克风阵列即将上线

分享到: