1.本发明涉及通信技术领域,尤其涉及一种单麦克风噪声抑制方法和装置。
背景技术:2.会议通信系统运行的环境异常繁多、复杂,客户端麦克风拾取的语音信号通常含有环境噪声干扰,这些噪声干扰的存在严重地影响了会议通话质量。为此,需要对这些噪声干扰进行抑制处理,以提升会议通信系统的通话质量。
3.目前,基于单麦克风的含噪语音信号增强技术中,最为著名的单麦克风降噪技术有谱减法、wiener(维纳)滤波法和mmse(minimum mean squared error,最小均方误差)法,它们均利用语音的间歇性和噪声的平稳性之假设来估计噪声的功率谱,进而估计含噪语音信号的信噪比,并据此来进行噪声抑制。然而,上述方案在实际应用中会产生音乐噪声,特别是在非平稳和强干扰电平的噪声场景下。于是基于麦克风阵列的降噪技术便应运而生,其中最为代表性的是波束赋性技术。波束赋型技术是利用目标声源的方位信息,让麦克风阵列在目标声源方向上形成空间选择性,来选通目标声源而滤除噪声。众多的波束赋型算法中,gsc(generalized sidelobe canceller,广义旁瓣相消器)算法和frost算法展现出可靠的性能。尽管基于麦克风阵列的多声道降噪算法的性能可以通过增加阵列的麦克风数目来进一步地加以改善,但大量的麦克风数目意味着波束赋型算法的计算复杂度剧烈增大,从而难以在现有的商用dsp(digital signal processor,数字信号处理器)芯片上实现。此外,波束赋型算法对麦克风阵列运行环境中的相干方向性噪声源具有良好的滤波或抑制能力,但对非相干噪声的抑制通常较差,因此波束赋型器对噪声的抑制量受限于其中的非相干噪声。
技术实现要素:4.为了解决上述问题,本发明提供了一种单麦克风噪声抑制方法和装置,能够有效抑制运行环境的相干与不相干噪声以及散射噪声,实现单麦克风接收的观察信号中语音信号的增强。
5.本发明的第一方面涉及一种单麦克风噪声抑制方法,包括:根据单麦克风接收的观测信号的奇偶序列谱信号,得到噪声抑制增益函数;利用所述噪声抑制增益函数,对所述观测信号的谱信号进行降噪滤波,得到目标语音谱信号;将所述目标语音谱信号进行时域变换,得到目标语音信号。
6.可选地,所述根据单麦克风接收的观测信号的奇偶序列谱信号,得到噪声抑制增益函数,包括:根据单麦克风接收的观测信号的谱信号,得到所述观测信号的奇序列谱信号和偶序列谱信号;根据所述奇序列谱信号和偶序列谱信号,估计所述观测信号的奇偶序列互功率
谱;估计所述观测信号中噪声信号的奇偶序列互功率谱幅度;根据所述观测信号的奇偶序列互功率谱的幅度和所述噪声信号的奇偶序列互功率谱幅度,计算语音信号的奇偶序列互功率谱幅度;根据所述语音信号的奇偶序列互功率谱幅度、所述观测信号的奇序列自功率谱,以及所述观测信号的偶序列自功率谱,估计噪声抑制增益函数。
7.可选地,所述根据单麦克风接收的观测信号的谱信号,得到所述观测信号的奇序列谱信号和偶序列谱信号,包括:根据如下公式(1)、公式(2),将单麦克风接收的观测信号的谱信号进行分解,得到所述观测信号的奇序列谱信号和偶序列谱信号:(1)(2)其中,,k = 0, 1, 2,
ꢀ…
, 2l
‑
1为频点的索引,t为信号帧索引,短时频域变换中使用的窗函数的窗长为2l, 信号帧长为l。
8.可选地,所述根据所述奇序列谱信号和偶序列谱信号,估计所述观测信号的奇偶序列互功率谱,包括:根据如下公式(3)估计所述观测信号的奇偶序列互功率谱:(3)其中,为所述观测信号的奇序列谱信号,*为复共轭运算符,为所述观测信号的偶序列谱信号,α为预设的平滑因子常数,。
9.可选地,根据如下公式(4)估计所述观测信号的奇偶序列互功率谱:(4)其中,为所述观测信号的奇序列谱信号,为所述观测信号的偶序列谱信号,为根据如下公式(5)计算得到的平滑参数:
(5)其中,为t
‑
1帧时刻的噪声抑制增益函数。
10.可选地,所述估计观测信号中噪声信号的奇偶序列互功率谱幅度,包括:根据如下公式(6),对观测信号中的噪声信号的奇偶序列互功率谱幅度进行估计:(6)其中,med{
·
}为中值滤波的运算符,,为中值滤波器窗口长度、并定义为奇数。
11.可选地,所述估计观测信号中噪声信号的奇偶序列互功率谱幅度,包括:将中值滤波器窗口划分为q个子窗口,每个子窗口的窗口长度为,且,为中值滤波器窗口长度;根据如下公式(7)计算每个子窗口中的观测信号的奇偶序列互功率谱幅度的算数平均值:(7)根据如下公式(8),对观测信号中的噪声信号的奇偶序列互功率谱幅度进行估计:(8)其中,med{
·
}为中值滤波的运算符。
12.可选地,所述根据所述观测信号的奇偶序列互功率谱的幅度和所述噪声信号的奇偶序列互功率谱幅度,计算语音信号的奇偶序列互功率谱幅度,包括:根据如下公式(9),估计后验信噪比:(9)根据如下公式(10)、(11),估计先验信噪比;(10)(11)
根据如下公式(12),进行维纳滤波器函数估计:(12)根据如下公式(13),计算语音信号的奇偶序列互功率谱幅度:(13)其中,为所述观测信号的奇序列谱信号、为偶序列谱信号;为所述噪声信号的奇偶序列互功率谱幅度;根据如下公式计算得到;为t
‑
1帧时刻的噪声抑制增益函数,为t
‑
1帧时刻的维纳滤波器函数。
13.可选地,所述根据所述语音信号的奇偶序列互功率谱幅度、所述观测信号的奇序列自功率谱,以及所述观测信号的偶序列自功率谱,估计噪声抑制增益函数,包括:根据如下公式(14),估计噪声抑制增益函数:(14)其中,为所述观测信号的奇序列自功率谱,为观测信号的偶序列自功率谱;和根据如下公式(15)、(16)估计得到:(15)(16)为所述语音信号的奇偶序列互功率谱幅度。
14.本发明的第二方面涉及一种单麦克风噪声抑制装置,包括:噪声抑制估计模块,用于根据单麦克风接收的观测信号的奇偶序列谱信号,得到噪声抑制增益函数;噪声频域滤波模块,用于利用所述噪声抑制增益函数,对所述观测信号的谱信号进行降噪滤波,得到目标语音谱信号;时域变换模块,用于将所述目标语音谱信号进行时域变换,得到目标语音信号。
15.可选地,所述噪声抑制估计模块包括:奇偶分解单元,用于根据单麦克风接收的观测信号的谱信号,得到所述观测信号的奇序列谱信号和偶序列谱信号;
第一功率谱估计单元,用于根据所述奇序列谱信号和偶序列谱信号,估计所述观测信号的奇偶序列互功率谱;第二功率谱估计单元,用于估计所述观测信号中噪声信号的奇偶序列互功率谱幅度;第三功率谱估计单元,用于根据所述观测信号的奇偶序列互功率谱的幅度和所述噪声信号的奇偶序列互功率谱幅度,计算语音信号的奇偶序列互功率谱幅度;噪声抑制估计单元,用于根据所述语音信号的奇偶序列互功率谱幅度、所述观测信号的奇序列自功率谱,以及所述观测信号的偶序列自功率谱,估计噪声抑制增益函数。
16.可选地,所述奇偶分解单元用于根据如下公式(1)、公式(2),将单麦克风接收的观测信号的谱信号进行分解,得到所述观测信号的奇序列谱信号和偶序列谱信号:(1)(2)其中,,k = 0, 1, 2,
ꢀ…
, 2l
‑
1为频点的索引,t为信号帧索引,短时频域变换中使用的窗函数的窗长为2l, 信号帧长为l。
17.可选地,所述第一功率谱估计单元用于根据如下公式(3)估计所述观测信号的奇偶序列互功率谱:(3)其中,为所述观测信号的奇序列谱信号,为所述观测信号的偶序列谱信号,α为预设的平滑因子常数,。
18.可选地,所述第一功率谱估计单元用于根据如下公式(4)估计所述观测信号的奇偶序列互功率谱:(4)其中,为所述观测信号的奇序列谱信号,为所述观测信号的偶序列谱信号,为根据如下公式(5)计算得到的平滑参数:
(5)其中,为t
‑
1帧时刻的噪声抑制增益函数。
19.可选地,所述第二功率谱估计单元用于根据如下公式(6),对观测信号中的噪声信号的奇偶序列互功率谱幅度进行估计:(6)其中,med{
·
}为中值滤波的运算符,,为中值滤波器窗口长度、并定义为奇数。
20.可选地,所述第二功率谱估计单元用于将中值滤波器窗口划分为q个子窗口,每个子窗口的窗口长度为,且,为中值滤波器窗口长度;根据如下公式(7)计算每个子窗口中的观测信号的奇偶序列互功率谱幅度的算数平均值:(7)根据如下公式(8),对观测信号中的噪声信号的奇偶序列互功率谱幅度进行估计:(8)其中,med{
·
}为中值滤波的运算符。
21.可选地,所述第三功率谱估计单元用于根据如下公式(9),估计后验信噪比:(9)根据如下公式(10)、(11),估计先验信噪比;(10)(11)根据如下公式(12),进行维纳滤波器函数估计:
(12)根据如下公式(13),计算语音信号的奇偶序列互功率谱幅度:(13)其中,为所述观测信号的奇序列谱信号、为偶序列谱信号;为所述噪声信号的奇偶序列互功率谱幅度;根据公式计算得到;为t
‑
1帧时刻的噪声抑制增益函数,为t
‑
1帧时刻的维纳滤波器函数。
22.可选地,所述噪声抑制估计单元用于根据如下公式(14),估计噪声抑制增益函数:(14)其中,为所述观测信号的奇序列自功率谱,为观测信号的偶序列自功率谱;和根据如下公式(15)、(16)估计得到:(15)(16)为所述语音信号的奇偶序列互功率谱幅度。
23.本发明的第三方面涉及一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如第一方面所述的方法。
24.本发明的第四方面涉及一种电子设备,包括存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如第一方面所述的方法。
25.本发明通过单麦克风接收的观测信号的奇偶序列谱信号来设计一个降噪滤波器的噪声抑制增益函数,用之对含噪的观察信号的谱信号进行滤波处理,以自适应抑制运行环境的相干与不相干噪声以及散射噪声,实现单麦克风接收的观察信号中语音信号的增强。
附图说明
26.图1为根据本发明一实施例的单麦克风噪声抑制方法的流程示意图;图2为根据本发明一实施例的噪声抑制增益函数估计方法的流程示意图;图3为根据本发明一实施例的单麦克风噪声抑制装置的结构示意图;
图4为根据本发明一实施例的噪声抑制估计模块的结构示意图;图5为根据本发明另一实施例的单麦克风噪声抑制方法的流程示意图;图6为根据本发明一实施例的单麦克风噪声抑制器的原理系统框图;图7为能够实施本发明实施例的示例性电子设备的方框示意图。
具体实施方式
27.为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案做详细的说明。
28.参考图1,其示出了根据本发明一实施例的单麦克风噪声抑制方法的流程示意图。如图1所示,本发明一实施例提供了一种单麦克风噪声抑制方法,包括:s101、根据单麦克风接收的观测信号的奇偶序列谱信号,得到噪声抑制增益函数;s102、利用所述噪声抑制增益函数,对所述观测信号的谱信号进行降噪滤波,得到目标语音谱信号;s103、将所述目标语音谱信号进行时域变换,得到目标语音信号。实际应用中,目标语音信号为增强的语音信号。本发明实施例提供的单麦克风噪声抑制,通过单麦克风接收的观测信号的奇偶序列谱信号来设计一个降噪滤波器的噪声抑制增益函数,用之对含噪的观察信号的谱信号进行滤波处理,以自适应抑制运行环境的相干与不相干噪声以及散射噪声,从而实现单麦克风接收的观察信号中语音信号的增强。
29.参考图2,其示出了根据本发明一实施例的噪声抑制增益函数估计方法的流程示意图。如图2所示,本发明一实施例提供了一种噪声抑制增益函数估计方法,包括:s201、根据单麦克风接收的观测信号的谱信号,得到所述观测信号的奇序列谱信号和偶序列谱信号。
30.可以理解的是,单麦克风接收到的含噪语音观测信号y(n)在数学上可表示为:,其中s(n)和v(n)分别为语音信号和噪声信号,不失一般性,假设它们之间不相关;n为时域离散的样本点索引。那么在采样率不变的条件下,可将y(n)分解成奇序列和偶序列。
31.可以理解的是,;,其中,m为非负整数,和分别为序列x(n)按上述方法分解的奇偶序列,这里x(n)可分别表示信号y(n)、s(n)和 v(n)。
32.因而有如下关系式:;;;;。
33.对上述关系式的两边进行stft(short
‑
time fourier tansform,短时傅里叶变换),可得下述的关系式:;;
;;。
34.其中, x(k,t) 表示信号x(n)的stft频谱信号,x(n)可分别表示信号y(n)、s(n)、v(n)、、、、、、,k = 0, 1, 2,
ꢀ…
, 2l
‑
1为频点的索引,t为信号帧索引;stft中使用的窗函数的窗长为2l, 信号帧长为l。
35.本发明的一些实施例中,可以将单麦克风接收的观测信号y(n)视作两个麦克风分别拾取的2路观测信号和,应用互功率谱差降噪技术来抑制和中的噪声信号和。
36.本发明的一些实施例中,可以对单麦克风接收的观测信号进行奇偶分解;分别对分解得到的奇序列时域信号和偶序列时域信号进行频域变换,得到所述观测信号的奇序列谱信号和偶序列谱信号。
37.本发明的一些实施例中,可以采用stft进行短时频域变换。相应地,本发明的一些实施例中,在通过步骤s103对目标语音谱信号进行时域变换过程中,可以采用逆stft把目标语音谱信号变换回时域。进一步地,本发明的一些实施例中,可以应用逆stft和重叠相加技术把目标语音谱信号变换回时域。可以理解的是,stft、逆stft和重叠相加技术均为本领域技术人员常用的时频间的变换技术,此处不再详述。
38.本发明的一些实施例中,在采样率保持不变的条件下,可将观测信号的谱信号y(k, t)直接分解成其奇序列和偶序列时域信号对应的两个短时频域的谱信号。具体地,可以根据如下公式(1)、公式(2),将单麦克风接收的观测信号的谱信号进行分解,得到所述观测信号的奇序列谱信号和偶序列谱信号:(1)(2)其中,,k = 0, 1, 2,
ꢀ…
, 2l
‑
1为频点的索引,t为信号帧索引,短时频域变换中使用的窗函数的窗长为2l, 信号帧长为l。这样,可以降低在时域分解并对其分解的时域子信号分别进行频域变换的方法复杂度。
39.s202、根据所述奇序列谱信号和偶序列谱信号,估计所述观测信号的奇偶序列互功率谱。
40.本发明的一些实施例中,可以根据如下公式(3)估计所述观测信号的奇偶序列互功率谱:(3)
其中,为所述观测信号的奇序列谱信号,为所述观测信号的偶序列谱信号,*为复共轭运算符,α为预设的平滑因子常数,。实际应用中,通常。
41.可选地,本发明的一些实施例中,可以根据如下公式(4)估计所述观测信号的奇偶序列互功率谱:(4)其中,为所述观测信号的奇序列谱信号,为所述观测信号的偶序列谱信号,为根据如下公式(5)计算得到的平滑参数:(5)其中,为t
‑
1帧时刻的噪声抑制增益函数。
42.s203、估计所述观测信号中噪声信号的奇偶序列互功率谱幅度。
43.本发明的一些实施例中,可以根据如下关系式来估计所述观测信号中噪声信号的奇偶序列互功率谱:。
44.其中,为所述观测信号的奇序列谱信号,为所述观测信号的偶序列谱信号,为预设的另一平滑因子常数,。实际应用中,通常。继而,根据估计的奇偶序列互功率谱,获得观测信号中噪声信号的奇偶序列互功率谱幅度。
45.实际应用中,通过上述方式估计观测信号中噪声信号的奇偶序列互功率谱,需要在vad(voice activity detection,语音活性检测器)的协助下进行。由于vad的误检存在,使得估计的精度有限;此外,实际运行环境中噪声的频谱特征可能一直在变化,这便要求无论存在语音信号与否,噪声互功率谱的估计都必须可持续地进行。虽然应用r. martin提出的最小统计量技术可持续地估计噪声互功率谱而无需vad,但在环境噪声能量发生突增的情况下,最小统计量方法无法及时地跟踪这一变化;另外,最小统计量技术获得的噪声互功率谱估计通常为亚估计(under
‑
estimation),需要一个补偿因子对之进行修正;而精确计算这一补偿因子通常较为困难。因此,本发明的一些实施例中,可以选用基于分位数的噪声估计(qne)技术来估计噪声的互功率谱,特别是分位数估计器中的中值估计技术,具有更好的鲁棒特性。
46.具体地,可以根据如下公式(6),对观测信号中的噪声信号的奇偶序列互功率谱幅度进行估计:(6)其中,med{
·
}为中值滤波的运算符,,为中值滤波器窗口长度、并定义为奇数。
47.考虑中值滤波技术中排序运算涉及大量计算量,不利于实时在线实现。可选地,为降低长窗口的中值滤波运算量,从而可实时在线实现,可以采用线性滤波与小窗口中值滤波的级联方式来近似实现长窗口中值滤波。
48.具体地,本发明的一些实施例中,可将中值滤波器窗口划分为q个子窗口,每个子窗口的窗口长度为,且,为中值滤波器窗口长度;继而,根据如下公式(7)计算每个子窗口中的观测信号的奇偶序列互功率谱幅度的算数平均值:(7)进而,根据如下公式(8),对观测信号中的噪声信号的奇偶序列互功率谱幅度进行估计:(8)其中,med{
·
}为中值滤波的运算符。
49.本发明的一些实施例中,可以划分为3个子窗口,采用3阶中值滤波器的方式来估计噪声信号的奇偶序列互功率谱幅度。
50.通过本发明实施例提供的噪声信号的奇偶序列互功率谱幅度方法,无需vad的协助而可持续地进行估计,并能快速跟踪噪声统计特性的变化,因而不仅适合平稳的环境噪声场景,还适合非平稳的环境噪声场景。
51.s204、根据所述观测信号的奇偶序列互功率谱的幅度和所述噪声信号的奇偶序列互功率谱幅度,计算语音信号的奇偶序列互功率谱幅度。
52.本发明的一些实施例中,可以将噪声信号的奇偶序列互功率谱估计的幅度从观测信号的奇偶序列互功率谱估计的幅度中减去,可得语音信号和之间互功率谱幅度估计。
53.具体地,根据关系式估计语音信号的
奇偶序列互功率谱幅度。
54.为缓解音乐噪声问题,可选地,本发明的一些实施例中,可以应用决策引导技术预先进行先验信噪比估计,并由此构造一个维纳滤波器来从观测信号的奇偶序列互功率谱中提取语音信号的奇偶序列互功率谱。具体地,可以根据如下公式(9),先估计后验信噪比:(9)继而,根据如下公式(10)、(11),估计先验信噪比;(10)(11)这样,可以基于估计的先验信噪比,根据如下公式(12),进行维纳滤波器函数估计:(12)继而,根据如下公式(13),计算语音信号的奇偶序列互功率谱幅度:(13)其中,为所述观测信号的奇序列谱信号、为偶序列谱信号;为所述噪声信号的奇偶序列互功率谱幅度;根据如下公式计算得到;为t
‑
1帧时刻的噪声抑制增益函数,为t
‑
1帧时刻的维纳滤波器函数。通过本发明实施例提供的上述方式来估计先验信噪比,可以克服决策引导技术中存在的估计滞后一帧的缺陷。
55.s205、根据所述语音信号的奇偶序列互功率谱幅度、所述观测信号的奇序列自功率谱,以及所述观测信号的偶序列自功率谱,估计噪声抑制增益函数。
56.本发明的一些实施例中,通过步骤s204获取语音信号的奇偶序列互功率谱幅度之后,可以考虑用语音信号的奇偶序列互功率谱估计替换掉用于估计两路观测信号和之间的相干系数函数计算公式中观测信号的奇偶序列互功率谱估计这一分子项(即),从而获得一个修订的相干系数函数估计值为:
这样,将修订的相干系数函数幅值用作降噪滤波器的噪声抑制增益函数。具体地,可以根据如下公式(14),估计噪声抑制增益函数:(14)其中,为所述语音信号的奇偶序列互功率谱幅度;为所述观测信号的奇序列自功率谱,为观测信号的偶序列自功率谱。
57.本发明的一些实施例中,可以根据如下公式(15)、(16)来估计观测信号的奇序列信号的自功率谱以及观测信号的偶序列自功率谱:(15)(16)其中,平滑参数根据公式计算得到。
58.这样,后续可以利用噪声抑制增益函数,对所述观测信号的谱信号进行降噪滤波,可以自适应抑制运行环境的相干与不相干噪声以及散射噪声,实现单麦克风接收的观察信号中语音信号的增强。本发明实施例提供的噪声抑制增益函数计算方法,利用提取的语音信号的奇偶互功率谱来计算噪声抑制增益函数,极大地减小了增强后的语音信号中残留的音乐噪声。
59.参考图3,其示出了根据本发明一实施例的单麦克风噪声抑制装置的结构示意图;如图3所示,本发明一实施例提供了一种单麦克风噪声抑制装置,包括:噪声抑制估计模块301、噪声频域滤波模块302和时域变换模块303。
60.其中,噪声抑制估计模块301用于根据单麦克风接收的观测信号的奇偶序列谱信号,得到噪声抑制增益函数。
61.噪声频域滤波模块302用于利用所述噪声抑制增益函数,对所述观测信号的谱信号进行降噪滤波,得到目标语音谱信号。
62.时域变换模块303用于将所述目标语音谱信号进行时域变换,得到目标语音信号。
63.参考图4,其示出了根据本发明一实施例的噪声抑制估计模块的结构示意图;如图4所示,本发明一实施例提供了一种噪声抑制估计模块,包括:奇偶分解单元401、第一功率谱估计单元402、第二功率谱估计单元403、第三功率谱估计单元404和噪声抑制估计单元405。
64.奇偶分解单元401用于根据单麦克风接收的观测信号的谱信号,得到所述观测信
号的奇序列谱信号和偶序列谱信号。
65.第一功率谱估计单元402用于根据所述奇序列谱信号和偶序列谱信号,估计所述观测信号的奇偶序列互功率谱。
66.第二功率谱估计单元403用于估计所述观测信号中噪声信号的奇偶序列互功率谱幅度。
67.第三功率谱估计单元404用于根据所述观测信号的奇偶序列互功率谱的幅度和所述噪声信号的奇偶序列互功率谱幅度,计算语音信号的奇偶序列互功率谱幅度。
68.噪声抑制估计单元405用于根据所述语音信号的奇偶序列互功率谱幅度、所述观测信号的奇序列自功率谱,以及所述观测信号的偶序列自功率谱,估计噪声抑制增益函数。
69.本发明一些实施例中,所述奇偶分解单元401可以根据如下公式(1)、公式(2),将单麦克风接收的观测信号的谱信号进行分解,得到所述观测信号的奇序列谱信号和偶序列谱信号:(1)(2)其中,,k = 0, 1, 2,
ꢀ…
, 2l
‑
1为频点的索引,t为信号帧索引,短时频域变换中使用的窗函数的窗长为2l, 信号帧长为l。
70.本发明一些实施例中,所述第一功率谱估计单元402可以根据如下公式(3)估计所述观测信号的奇偶序列互功率谱:(3)其中,为所述观测信号的奇序列谱信号,为所述观测信号的偶序列谱信号,*为复共轭运算符,α为预设的平滑因子常数,。
71.可选地,本发明一些实施例中,所述第一功率谱估计单元402可以根据如下公式(4)估计所述观测信号的奇偶序列互功率谱:(4)其中,为所述观测信号的奇序列谱信号,为所述观测信号的偶序列谱信号,为根据如下公式(5)计算得到的平滑参数:
(5)其中,为t
‑
1帧时刻的噪声抑制增益函数。
72.本发明的一些实施例中,所述第二功率谱估计单元403可以根据如下公式(6),对观测信号中的噪声信号的奇偶序列互功率谱幅度进行估计:(6)其中,med{
·
}为中值滤波的运算符,,为中值滤波器窗口长度、并定义为奇数。
73.可选地,本发明的一些实施例中,所述第二功率谱估计单元403可以将中值滤波器窗口划分为q个子窗口,每个子窗口的窗口长度为,且,为中值滤波器窗口长度;根据如下公式(7)计算每个子窗口中的观测信号的奇偶序列互功率谱幅度的算数平均值:(7)根据如下公式(8),对观测信号中的噪声信号的奇偶序列互功率谱幅度进行估计:(8)其中,med{
·
}为中值滤波的运算符。
74.本发明的一些实施例中,所述第三功率谱估计单元404可以根据如下公式(9),估计后验信噪比:(9)根据如下公式(10)、(11),估计先验信噪比;(10)(11)根据如下公式(12),进行维纳滤波器函数估计:
(12)根据如下公式(13),计算语音信号的奇偶序列互功率谱幅度:(13)其中,为所述观测信号的奇序列谱信号、为偶序列谱信号;为所述噪声信号的奇偶序列互功率谱幅度;根据如下公式计算得到;为t
‑
1帧时刻的噪声抑制增益函数,为t
‑
1帧时刻的维纳滤波器函数。
75.本发明的一些实施例中,所述噪声抑制估计405可以根据如下公式(14),估计噪声抑制增益函数:(14)其中,为所述观测信号的奇序列自功率谱,为观测信号的偶序列自功率谱;和根据如下公式(15)、(16)估计得到:(15)(16)为所述语音信号的奇偶序列互功率谱幅度。
76.可以理解的是,本发明的上述实施例提供的单麦克风噪声抑制装置的各模块,以及各模块的各单元用于对应地实现上述单麦克风噪声抑制方法中的各步骤,具体内容在此不再赘述。
77.基于上述实施例提供的单麦克风噪声抑制方法,参考图5,其示出了根据本发明另一实施例的单麦克风噪声抑制方法的流程示意图。如图5所示,本发明一实施例提供了另一种单麦克风噪声抑制方法,包括:s501、初始化信号帧索引t=0;s502、更新信号帧索引t:t=t+1;s503、对第t帧观测信号进行stft变换获得对应的谱信号,根据公式(1)、(2)对获得谱信号进行分解获得奇序列谱信号和偶序列谱信号;s504、根据公式(5)计算自适应平滑参数,根据公式(4)估计观测信号的奇偶序列互功率谱,以及根据公式(15)、(16)估计观测信号的奇序列自功率谱以及偶序列自功率谱;s505、根据公式(7)、(8)估计噪声信号的奇偶序列互功率谱幅度;
s506、根据公式(9)
‑
(14)计算噪声抑制增益函数;s507、利用噪声抑制增益函数,对观测信号的谱信号进行降噪滤波,得到目标语音谱信号,并应用istft变换和重叠相加技术获取第t帧的增强语音信号;s508、判断处理过程是否结束,如是,则结束处理,如否,则执行步骤s502。
78.本发明实施例提供的单麦克风抑制方案,在采样率保持不变的条件下,用观测信号的谱信号分解的奇序列谱信号和偶序列谱信号来设计一个降噪滤波器的短时频域抑制增益函数,用之对含噪信号的谱信号进行增强处理,以自适应地抑制其中运行环境的相干和不相干噪声以及散射噪声。
79.基于上述实施例提供的单麦克风噪声抑制方法,参考图6,其示出了根据本发明一实施例的单麦克风噪声抑制器的结构示意图。如图6所示,本发明一实施例提供了另种单麦克风噪声抑制器,包括:stft变换器601、频谱奇偶分解器602、观测信号奇偶序列互功率谱估计器603、噪声奇偶序列互功率谱估计器604、观测信号奇偶序列自功率谱估计器605、噪声抑制增益计算器606和逆stft变换器加重叠相加处理单元607。
80.其中,stft变换器601用于对观测信号进行stft变换获得对应的谱信号,并输出。
81.频谱奇偶分解器602用于对stft变换器601输出的观测信号的谱信号进行分解,并输出。
82.观测信号奇偶序列互功率谱估计器603用于根据频谱奇偶分解器602输出的观测信号的奇序列谱信号和偶序列谱信号,估计所述观测信号的奇偶序列互功率谱,并输出。
83.噪声奇偶序列互功率谱估计器604用于根据观测信号奇偶序列互功率谱估计器603输出的观测信号的奇偶序列互功率谱,估计所述观测信号中噪声信号的奇偶序列互功率谱幅度,并输出。
84.观测信号奇偶序列自功率谱估计器605用于根据频谱奇偶分解器602输出的观测信号的奇序列谱信号和偶序列谱信号,估计观测信号的奇序列自功率谱以及偶序列自功率谱,并输出。
85.噪声抑制增益计算器606用于根据观测信号奇偶序列互功率谱估计器603输出的观测信号的奇偶序列互功率谱、噪声奇偶序列互功率谱估计器604输出的噪声信号的奇偶序列互功率谱幅度和观测信号奇偶序列自功率谱估计器605输出的观测信号的奇序列自功率谱以及偶序列自功率谱,估计噪声抑制增益函数。
86.在利用输出的噪声抑制增益函数对stft变换器601输出的观测信号的谱信号进行降噪滤波得到增强语音谱信号后,逆stft变换器加重叠相加处理单元607用于对增强语音谱信号应用逆stft变换以及重叠相加技术,得到增强的语音信号。
87.可以理解的是,本发明实施例提供的单麦克风噪声抑制器的各部分的具体实现可参考上述实施例提供的单麦克风噪声抑制方法的各步骤,具体内容在此不再赘述。
88.本发明的一些实施例中,还提供了一种电子设备。该电子设备包括:存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如上所述的单麦克风噪声抑制方法。进一步地,还提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上所述的单麦克风噪声抑制方法。图7示出了可以用来实施本公开的实施例的电子设备700的示意性框图。如图7所示,电子设备700包括中央处理单元(cpu)701,其可以根据存储在只读存储器(rom)702中的计算机程序指令或者从存储单元
708加载到随机访问存储器(ram)703中的计算机程序指令,来执行各种适当的动作和处理。在ram 703中,还可以存储电子设备700操作所需的各种程序和数据。cpu 701、rom 702以及ram 703通过总线704彼此相连。输入/输出(i/o)接口705也连接至总线704。
89.电子设备700中的多个部件连接至i/o接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许电子设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
90.处理单元701执行上文所描述的各个方法和处理。例如,在一些实施例中,方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由rom702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到ram 703并由cpu 701执行时,可以执行上文描述的方法的一个或多个步骤。备选地,在其他实施例中,cpu 701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法。
91.本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)等等。
92.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
93.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd
‑
rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
94.此外,虽然采用特定次序描绘了各操作,但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行,或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地,在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。
95.尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。