半岛·综合体育官网入口:【硅麦应用】敏芯I2S MEMS麦克风芯片在智能音箱中的应用
作者:半岛bob发布时间:2025-01-01
1.引言
智能音响是众多胜任智能家庭管家设备中最具有潜力的,即作为未来家庭人工智能(AI)的入口,作用至关重要。目前,美国的亚马逊、中国的京东等科技公司,已经朝着这个方向不断努力,并且初步显露成效。亚马逊在2015年推出智能音箱Echo,京东在2016年推出智能音箱叮咚(DingDong),谷歌的Google Home也正在后来者居上。这些产品,主要在三个方面将声音的人机交互的作用加以发挥:智能家居中心;家庭购物入口;大数据获取。
Amazon Echo GoogleHome 京东的DingDong
未来,预计会有更多形式的智能声音获取终端进入家庭,作为利用人机声音交互的软、硬件通道。
无论在何种方案中,用户非常看重的一项功能,就是语音识别。如果这项功能缺失,那么人机通过声音交互的方式就不能完全自主,必须依赖其它途径开始、结束交互过程,用户体验必会大打折扣。因此,目前各个主流产品中,都具有语音识别功能。
然而,我们知道如果要想识别用户说出的命令,麦克风必须一直在录音状态,并且语音识别算法也要一直在工作,这就是连续语音识别的基本前提。因此,设法降低这部分系统设计的功耗和复杂度,是整个智能音箱软、硬件设计的核心之一。
2.目前的麦克风信号处理的主流方案
智能音箱采用N个(目前多见7个或8个)麦克风芯片构成麦克风阵列拾取周边的声音信号。市面上见到的智能音箱通常采用“模拟输出MEMS麦克风+ 音频ADC + 处理器”的音频信号通路形式,如下图所示:
Amazon Echo的音频处理板实物拆解图
*橙色:德州仪器TLV320ADC310192分贝SNR低功耗立体声ADC(X4)
*绿色:S10530090 V6麦克风(X7)
以亚马逊的Echo为例,典型的信号通路形式如下图,其中两路模拟麦克风输出共用一颗双通道音频ADC,ADC将信号转换为I2S/PCM音频格式传送给应用处理器,应用处理器需要具有足够多通道的串行数据接口来接收I2S/PCM信号。
例如图中7颗麦克风,后续即需要4颗独立的音频ADC同时输出4路I2S/PCM信号,DM3725CUS100处理器具有多达5路的串行数据接口(MCBSP)兼容I2S/PCM 格式的音频信号。当然亦可采用通道数更多的音频ADC。
3.用I2S输出的数字麦克风形成的代替优化方案
相对于现在智能音箱“模拟麦克风+ 音频ADC + 处理器”的方案,敏芯可提供直接I2S数字输出的硅麦克风芯片,集成了上述“模拟麦克风+ 音频ADC”的功能半岛·BOB官方网站。I2S麦克风芯片在芯片内部先将模拟信号数字化后再转化为标准的I2S信号,由于省去了音频ADC,节省BOM,节省PCB空间,使设计更简单化。优化过的信号通路如下图所示,采用多路I2S信号转1路TDM格式的IC(Lattice Semiconductor 公司的iCE40 Ultra 的iCE5LP4K),将不必要求主控IC具有同样数量的I2S音频接口,节省IO端口数量。或者可以采用Rockchip新推出的RK3229芯片,其本身具有4ch I2S接口,如果需要更多I2S接口,将多个RK3229进行级联即可实现。
4.未来智能音箱的发展趋势— 低功耗语音唤醒
目前的智能音箱解决方案为了保持声音识别功能,麦克风阵列、ADC以及后续处理算法始终保持在工作状态,因此功耗较大,这就造成了例如亚马逊的Echo必须插电工作。然而智能音箱是一类移动互联网时代的智能硬件,方便携带是其作为智能硬件的重要因素,插电工作必将严重影响产品的用户体验。
将来的新一代智能音箱,预期会借鉴智能手机中(例如中兴天机手机)的语音唤醒功能,即在低功耗模式下,只有麦克风以及专用语音芯片处于工作状态,而其他电路部分则处于休眠状态半岛·综合体育官网入口。只有麦克风侦测到用户设定的“特定语音信号”时,整个系统才被激活。通过语音唤醒功能,极大的降低了整个系统的整体功耗,才使用电池供电的智能音箱系统成为可能。
Lattice半导体公司的FPGA芯片iCE5LP4K支持语音唤醒功能的应用,并且可支持连续发出唤醒和指令,使语音交互更加自然。