竞争性语音识别系统

如何在强本底噪声与多方向竞争性语音噪声同时存在的场景下,增强目标信号?   

>正常人在嘈杂会议中

>飞机高铁嘈杂环境中

>带助听器和电子耳蜗的人

以上四种环境都需要干净的语音信号,从而得到高的言语识别率。

市面上语音识别产品在语音转写的功能上已经十分完善,对于语言的识别有很好的准确性,但是常规的麦克风阵列,主要还是去除环境的噪声, 对于竞争性语音的去除并没有做太多的设计,因此市场上的语音识别,会对能量较大的信号进行拾取并转写,若竞争性语音的能量较弱,则不能很好的提取转换。


图片1.png


运动时的结果

2.png3.png


如上图所示,在使用我们算法之后,实时保留了想听的正确的目标语音信号,并进行了实时翻译。对比没有使用我们算法之前,各种竞争性噪声一起进入,转换的语音混乱,也夹杂噪音。