首页 > 乐器声学 专利正文
一种空域滤波语音增强系统及方法与流程

时间:2022-02-20 阅读: 作者:专利查询

一种空域滤波语音增强系统及方法与流程

1.本发明涉及信号处理技术领域,特别是涉及一种空域滤波语音增强系统及方法。


背景技术:

2.语音信号在获取的过程中,在无环境噪声、无房间混响,距离声源很近的情况下,单麦克风可以获取高质量的语音信号。但事实上声源位置、声音环境等多种因素的不固定,影响麦克风对语音信号拾取的质量,进而降低了语音可懂度。基于单麦克风拾音的局限性,所以引入了麦克风阵列进行语音处理的方法,此方法提高了拾音质量,促进了语音增强技术的发展。与单麦克风不同,阵列麦克风具有空间选择性,通过电子控制的方法,捕获特定方向的目标信号,同时对周围噪声起到抑制作用,但麦克风阵列受制于半波长理论限制,麦克风数量越多其孔径就越大,以及具有空域混叠与运算复杂度高的问题,从而极大限制了麦克风阵列的设计自由性与应用场景。


技术实现要素:

3.本发明提供了一种基于质点振速传感器微阵列的空域滤波语音增强系统及方法,以解决现有技术中麦克风阵列设计和应用场景受限的问题。
4.第一方面,本发明提供了一种基于质点振速传感器微阵列的空域滤波语音增强系统,其特征在于,包括:一个声压敏感单元、两个二维的质点振速敏感单元以及处理器,所述质点振速敏感单元正交设于所述声压敏感单元的两侧;
5.所述声压敏感单元,用于测量声场中声压分量;
6.所述质点振速敏感单元,用于测量空间质点振速分量;
7.所述处理器,用于根据所述声压分量以及所述空间质点振速分量进行目标语音方向估计,并将目标语音频域之外的频点能量置零,得到目标语音方位对应的时频点数据,根据该时频点数据得到目标语音信号。
8.可选地,所述声压敏感单元还用于,采集一通道的声压信号p(t);
9.所述质点振速敏感单元还用于,采集两通道的质点振速信号的时频数据v
x
(t)和v
y
(t);
[0010][0011]
其中,x1(t),x2(t)分别为目标语音与干扰语音的声压信号,θ1,θ2分别为目标语音与干扰语音的水平方位角,以x轴正方向为0
°
,n
p
(t),n
x
(t)和n
y
(t)分别为声压与质点振速敏感单元接收的噪声信号。
[0012]
可选地,所述处理器还用于,对声压信号和所述时频数据进行预处理,以得到对应通道时频谱数据。
[0013]
可选地,所述处理器还用于,对声压信号和所述时频数据分帧加窗,得到对应的单帧时域信号p
win
(l)、v
xwin
(l)、v
ywin
(l),l=1,2

,l,l为单帧时域信号长度,再进行短时傅里叶变换,把单帧时域信号变换为频域信号;
[0014]
p
win
(l,k)=fft(p
win
(l))、v
xwin
(l,k)=fft(v
xwin
(l))、v
ywin
(l,k)=fft(v
ywin
(l))。
[0015]
可选地,所述处理器还用于,估计出单帧语音信号中方向性声源的角度区间,并得到能量的角度分布,基于时频谱数据间的三角函数关系求得任意时频点的声源到达角度估计。
[0016]
可选地,所述处理器还用于,通过预设窗函数处理,将目标语音频域之外的频点能量置零,得到目标语音方位对应的时频点数据。
[0017]
可选地,所述处理器还用于,利用矩形窗函数、高斯窗、汉宁窗或海明窗与获取得到的全角度空间的能量分布进行卷积运算,以将目标语音频率区域之外的频点能量置零,获取得到目标语音方位对应的时频点数据;
[0018][0019]
其中θ为目标方位,δθ为矩形窗的宽度。
[0020]
可选地,所述处理器还用于,对目标语音方位对应的时频点数据进行ifft,到对应的时域信号,并采用叠接相加法拼接出空域滤波后的目标语音信号。
[0021]
第二方面,本发明提供了一种应用上述任意一项所述的系统进行空域滤波语音增强的方法,所述方法包括:
[0022]
基于测得的目标语音与干扰语音方位信息,对质点振速传感器微阵列各通道的时频谱数据进行空域滤波,获取得到目标语音方位对应的时频点数据,对目标语音方位对应的时频点数据进行ifft,到对应的时域信号,并采用叠接相加法拼接出空域滤波后的目标语音信号。
[0023]
第三方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质存储有信号映射的计算机程序,所述计算机程序被至少一个处理器执行时,以实现上述任一种所述的空域滤波语音增强的方法。
[0024]
本发明有益效果如下:
[0025]
本发明是由一个声压敏感单元和两个二维的质点振速敏感单元构成。在声压敏感单元测量声场中声压分量的同时,正交放置的二维质点振速敏感单元可同步独立地测量空间质点振速分量。实践证明,该结构声源定向精度高,且指向性不受阵列孔径影响,阵列结构紧凑,孔径可做到毫米级,且能够适应多种环境、多种噪声,并对房间混响有一定抑制效果,实现语音增强效果,从而有效解决了现有麦克风阵列设计和应用场景受限的问题。
[0026]
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
[0027]
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通
技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0028]
图1是本发明实施例提供的一种基于质点振速传感器微阵列的空域滤波语音增强系统的结构示意图;
[0029]
图2是本发明实施例提供的一种基于质点振速传感器微阵列的空域滤波语音增强方法的流程示意图。
具体实施方式
[0030]
本发明实施例针对现有麦克风阵列受制于半波长理论限制,麦克风数量越多其孔径就越大,以及具有空域混叠与运算复杂度高的问题,而设计了一种基于质点振速传感器微阵列的空域滤波语音增强系统,该系统由一个声压敏感单元和两个二维的质点振速敏感单元构成,在声压敏感单元测量声场中声压分量的同时,正交放置的二维质点振速敏感单元可同步独立地测量空间质点振速分量。实践证明,该结构声源定向精度高,且指向性不受阵列孔径影响,阵列结构紧凑,孔径可做到毫米级,且能够适应多种环境、多种噪声,并对房间混响有一定抑制效果。以下结合附图以及实施例,对本发明进行进一步详细说明。应当理解此处所描述的具体实施例仅仅用以解释本发明,并不限定本发明。
[0031]
本发明第一实施例提供了一种基于质点振速传感器微阵列的空域滤波语音增强系统,参见图1,该系统包括:一个声压敏感单元、两个二维的质点振速敏感单元以及处理器,所述质点振速敏感单元正交设于所述声压敏感单元的两侧;
[0032]
所述声压敏感单元,用于测量声场中声压分量;
[0033]
所述质点振速敏感单元,用于测量空间质点振速分量;
[0034]
所述处理器,用于根据所述声压分量以及所述空间质点振速分量进行目标语音方向估计,并将目标语音频域之外的频点能量置零,得到目标语音方位对应的时频点数据,根据该时频点数据得到目标语音信号。
[0035]
也就是说,本发明实施例是针对现有麦克风阵列受制于半波长理论限制,麦克风数量越多其孔径就越大,以及具有空域混叠与运算复杂度高的问题,而设计了一种基于质点振速传感器微阵列的空域滤波语音增强系统,该系统由一个声压敏感单元和两个二维的质点振速敏感单元构成,在声压敏感单元测量声场中声压分量的同时,正交放置的二维质点振速敏感单元可同步独立地测量空间质点振速分量。从而保证稿精度声源定向,且指向性不受阵列孔径影响,阵列结构紧凑,且能够适应多种环境、多种噪声,并对房间混响有一定抑制效果。
[0036]
具体实施时,本发明实施例中的所述声压敏感单元还用于,采集一通道的声压信号p(t);所述质点振速敏感单元还用于,采集两通道的质点振速信号的时频数据v
x
(t)和v
y
(t);
[0037]
[0038]
其中,x1(t),x2(t)分别为目标语音与干扰语音的声压信号,θ1,θ2分别为目标语音与干扰语音的水平方位角,以x轴正方向为0
°
,n
p
(t),n
x
(t)和n
y
(t)分别为声压与质点振速敏感单元接收的噪声信号。
[0039]
所述处理器通过对声压信号和所述时频数据进行预处理,以得到对应通道时频谱数据。
[0040]
具体来说,本发明实施例中的所述处理器是对声压信号和所述时频数据分帧加窗,得到对应的单帧时域信号p
win
(l)、v
xwin
(l)、v
ywin
(l),l=1,2

,l,l为单帧时域信号长度,再进行短时傅里叶变换,把单帧时域信号变换为频域信号;p
win
(l,k)=fft(p
win
(l))、v
xwin
(l,k)=fft(v
xwin
(l))、v
ywin
(l,k)=fft(v
ywin
(l))。
[0041]
进一步地,本发明实施例中的所述处理器还用于,估计出单帧语音信号中方向性声源的角度区间,并得到能量的角度分布,基于时频谱数据间的三角函数关系求得任意时频点的声源到达角度估计。以及通过预设窗函数处理,将目标语音频域之外的频点能量置零,得到目标语音方位对应的时频点数据。
[0042]
具体所述处理器是利用矩形窗函数、高斯窗、汉宁窗或海明窗与获取得到的全角度空间的能量分布进行卷积运算,以将目标语音频率区域之外的频点能量置零,获取得到目标语音方位对应的时频点数据;
[0043][0044]
其中θ为目标方位,δθ为矩形窗的宽度。
[0045]
最后通过所述处理器对目标语音方位对应的时频点数据进行ifft,到对应的时域信号,并采用叠接相加法拼接出空域滤波后的目标语音信号。
[0046]
相应地,本发明实施例还提供了一种应用上述任一种所述的系统进行空域滤波语音增强的方法,所述方法包括:
[0047]
基于测得的目标语音与干扰语音方位信息,对质点振速传感器微阵列各通道的时频谱数据进行空域滤波,获取得到目标语音方位对应的时频点数据,对目标语音方位对应的时频点数据进行ifft,到对应的时域信号,并采用叠接相加法拼接出空域滤波后的目标语音信号。
[0048]
为了更好地对本发明所述的方法进行说明,下面将通过一个具体的例子来对本发明所述的方法进行详细说明:
[0049]
本发明实施例是利用质点振速传感器微阵列的各接收分量间的三角函数关系与语音信号的时频稀疏特性,研究基于空域滤波的语音增强算法,如图2所示,本发明所述的方法具体工作流程包括:
[0050]
步骤一、质点振速传感器微阵列布置与语音信号采集;
[0051]
具体实施时,该步骤具体包括:质点振速传感器微阵列布置如图1所示,采样率16khz,可获取得到一通道声压信号p与两通道质点振速信号的时频数据v
x
、v
y

[0052][0053]
式中x1(t),x2(t)分别为目标语音与干扰语音的声压信号,θ1,θ2分别为目标语音与干扰语音的水平方位角,以x轴正方向为0
°
,n
p
(t),n
x
(t)和n
y
(t)分别为声压与二维质点振速敏感单元接收的噪声信号。
[0054]
步骤二、对质点振速传感器微阵列输出数据进行分帧加窗处理,经短时傅里叶变换,得到一通道声压信号与两通道质点振速信号的时频数据;
[0055]
为了得到近似平稳的语音信号,对上一步骤中的p、v
x
、v
y
信号分帧加窗,得到相应的单帧时域信号p
win
(l)、v
xwin
(l)、v
ywin
(l)(l=1,2

,l,l为单帧时域信号长度)。然后对其短时傅里叶变换,把单帧时域信号变换为频域信号。具体参数选择如下:窗函数:汉宁窗,窗长k=1024采样点;帧移50%;傅里叶变换点k;得到对应通道时频谱数据。
[0056]
p
win
(l,k)=fft(p
win
(l))
[0057]
v
xwin
(l,k)=fft(v
xwin
(l))
[0058]
v
ywin
(l,k)=fft(v
ywin
(l))
[0059]
步骤三、利用质点振速传感器微阵列一通道声压信号与两通道质点振速信号之间的三角函数关系,求得任意时频点的高信噪比角度估计,得到全角度空间能量分布;
[0060]
该步骤的目的是估计出单帧语音信号中方向性声源的角度区间,并得到能量的角度分布。根据步骤1,步骤2得到的单帧频域带噪语音信号p
win
(k,l)、v
xwin
(k,l)、v
ywin
(k,l)。
[0061]
利用质点振速传感器微阵列各通道时频谱数据间的三角函数关系求得任意时频点的声源到达角度估计。
[0062]
已知语音信号在时频域具有良好的稀疏特性,在多个不同方位语音存在时,不同语音信号在时频域具有离散分布性,根据任意时频点的声源到达角度估计,得到语音信号的全角度空间能量分布。
[0063]
也即,本发明步骤三是在方向性环境干扰语音存在时,基于语音信号的时频域稀疏特性,利用质点振速传感器微阵列各通道间的三角函数关系,求得任意时频点的高信噪比角度估计,可进一步得到全角度空间能量分布。
[0064]
步骤四、利用矩形窗函数(也可选择高斯窗、汉宁窗,海明窗等窗函数)对质点振速传感器微阵列当前帧信号的全角度空间能量分布进行卷积运算,获取得到目标语音方位对应的时频点数据;
[0065]
通过上述步骤得到当前帧信号在全角度空间的能量分布。利用矩形窗函数(也可选择高斯窗、汉宁窗,海明窗等窗函数)与获取得到的全角度空间的能量分布进行卷积运算,从而将目标语音频率区域之外的频点能量置零,获取得到目标语音方位对应的时频点数据。
[0066][0067]
其中θ为目标方位,δθ为矩形窗的宽度,一般取δθ=5
°
[0068]
本发明的步骤四是基于矩形窗空域滤波(也可选择高斯窗、汉宁窗,海明窗等窗函数),将目标语音频率区域之外的频点能量置零,获取得到目标语音方位对应的时频点数据。
[0069]
步骤五、将获取得到目标语音方位对应的时频点数据,经反傅里叶变换后,采用叠接相加法拼接出空域滤波后的目标语音信号。
[0070]
通过上述步骤得到最终滤波数据,对其进行ifft,可得到对应的时域信号,并采用叠接相加法拼接出空域滤波后的目标语音信号。
[0071]
总体来说,本发明实施例所述一种质点振速传感器微阵列的空域滤波语音增强算法,是基于一种特殊的质点振速传感器微阵列,由一个声压敏感单元和两个二维的质点振速敏感单元组成。质点振速敏感单元正交放置于声压敏感单元两侧具体见图1,此结构声源定向精度高,且指向性不受阵列孔径影响,阵列结构紧凑,孔径可做到毫米级。
[0072]
并且,本发明实施例是基于一通道的声压信号和两通道的质点振速信号之间的三角函数关系,实现目标语音与干扰语音定向。然后,基于矩形窗滤波的空域滤波语音增强算法,解决了在空间声源数量和声源方位不可知的情况下,对各方向干扰及噪声起到抑制作用,实现目标语音增强。实践证明,本发明所述方法具有鲁棒性高、可靠性好、实用性强等优势。
[0073]
本发明第二实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有信号映射的计算机程序,所述计算机程序被至少一个处理器执行时,以实现本发明第一实施例中任一种所述的空域滤波语音增强的方法。
[0074]
本发明实施例的相关内容可参见本发明第一实施例进行理解,在此不做详细论述。
[0075]
尽管为示例目的,已经公开了本发明的优选实施例,本领域的技术人员将意识到各种改进、增加和取代也是可能的,因此,本发明的范围应当不限于上述实施例。