2019-03-21 14:21

机器也有“顺风耳”

“远场识别”是什么?神奇的“麦克风阵列”又是什么?本文来自微信公众号:KnowingAI知智(ID:Knowing_AI),作者:虞喵喵。



对着手机讲话识别效果很好,可是距离远一点,再离远一点呢?



距离一旦拉远,收音效果就不理想。



如果是在封闭的环境中,还会形成混响。



周围有噪音,或是设备自己正在播放音乐,还要解决噪声问题……


在这样的中远距离环境中发生的语音识别,被称为远场识别(Far-field Speech Recognition)



通常我们会使用“麦克风阵列”解决远场识别问题。


“麦克风阵列”由两个以上的麦克风组成,直线、环形或是球状,布置方法各不相同。



通过彼此之间的距离差所造成的接收到的声波差异,可以了解声源的位置定向增强,从而提升收音效果;



同时抑制其他方向的“声音”,来解决房间混响和噪声问题。



除了硬件,语音识别模型往往使用近场语音数据训练而成。如果替换成远场数据重新训练,也能提升识别效果。



除了依靠麦克风阵列,也有纯粹依靠深度学习算法解决问题的流派,不过目前大部分智能音箱都在使用麦克风阵列。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定