1.本公开涉及通信技术领域,特别涉及一种信噪比确定方法、装置、电子设备和存储介质。
背景技术:2.信噪比(signal
‑
noise ratio,snr),是指正常声音信号与噪声信号的比例,是通信中的重要参数之一。在测量处理系统对于噪声的影响、测试语音降噪模块的性能等过程中都需要计算snr。
3.相关技术中,通过对参考信号在时域上划分出语音段和非语音段,并将划分的语音段作为匹配的带噪信号的语音段,将划分的非语音段作为该带噪信号的非语音段;根据带噪信号中语音段的能量值和非语音段的能量值,确定出snr。
4.然而,带噪信号中出现非平稳噪声时,难以通过上述方式精准地确定出snr。
技术实现要素:5.本公开提供了一种信噪比确定方法、装置、电子设备和存储介质,用以精准地确定出snr。
6.第一方面,本公开实施例提供一种信噪比确定方法,所述方法包括:
7.在将第一音频帧的参考时域信号转为第二音频帧的参考频域信号后,确定所述参考频域信号中各频点的语音类别;其中,所述语音类别表征语音或者非语音;所述参考时域信号是基于预设分帧方式对无噪音的参考信号进行分帧处理得到的;所述第一音频帧表征时域类型的音频帧,所述第二音频帧表征频域类型的音频帧;
8.在将第一音频帧的带噪时域信号转为第二音频帧的带噪频域信号后,基于对应帧的参考频域信号中各频点的所述语音类别,确定所述带噪频域信号的语音能量信息以及非语音能量信息;其中,所述带噪时域信号是基于所述预设分帧方式对与所述参考信号匹配的有噪音的带噪信号进行分帧处理得到的;
9.基于所述带噪频域信号的语音能量信息以及非语音能量信息,确定所述带噪频域信号的信噪比。
10.在一些可选的实施方式中,确定所述参考频域信号中各频点的语音类别,包括:
11.针对所述参考频域信号的任一频点,确定对应频点的能量值;
12.若所述对应频点的能量值小于预设能量,则确定所述对应频点的语音类别表征非语音;否则确定所述对应频点的语音类别表征语音。
13.在一些可选的实施方式中,基于对应帧的参考频域信号中各频点的所述语音类别,确定所述带噪频域信号的语音能量信息以及非语音能量信息,包括:
14.将所述对应帧的参考频域信号中表征语音的所有频点,在所述带噪频域信号中的能量信息之和,确定为所述带噪频域信号的语音能量信息;以及
15.将所述对应帧的参考频域信号中表征非语音的所有频点,在所述带噪频域信号中
的能量信息之和,确定为所述带噪频域信号的非语音能量信息。
16.在一些可选的实施方式中,基于所述带噪频域信号的语音能量信息以及非语音能量信息,确定所述带噪频域信号的信噪比,包括:
17.从所述带噪频域信号的语音能量信息以及预设能量信息中选择较大的第一能量信息,并从所述带噪频域信号的非语音能量信息以及所述预设能量信息中选择较大的第二能量信息;
18.基于所述第一能量信息与所述第二能量信息的比值,确定所述带噪频域信号的信噪比。
19.在一些可选的实施方式中,将第一音频帧的参考时域信号转为第二音频帧的参考频域信号,包括:
20.将所述参考时域信号进行加窗处理,得到在时域上的加窗参考信号;
21.将所述加窗参考信号进行傅里叶变换,得到在频域上的参考频域信号。
22.在一些可选的实施方式中,还包括:
23.将所述带噪信号与所述参考信号在时域上对齐。
24.在一些可选的实施方式中,将所述带噪信号与所述参考信号在时域上对齐,包括:
25.基于信号互相关性,确定所述带噪信号与所述参考信号的时间差值;
26.基于所述时间差值,将所述带噪信号移动到与所述参考信号在时域上对齐。
27.第二方面,本公开实施例提供一种信噪比确定装置,所述装置包括:语音类别确定模块、信号转化模块、能量信息确定模块以及信噪比确定模块;
28.所述语音类别确定模块,用于在所述信号转化模块将第一音频帧的参考时域信号转为第二音频帧的参考频域信号后,确定所述参考频域信号中各频点的语音类别;其中,所述语音类别表征语音或者非语音;所述参考时域信号是基于预设分帧方式对无噪音的参考信号进行分帧处理得到的;所述第一音频帧表征时域类型的音频帧,所述第二音频帧表征频域类型的音频帧;
29.所述能量信息确定模块,用于在所述信号转化模块将第一音频帧的带噪时域信号转为第二音频帧的带噪频域信号后,基于对应帧的参考频域信号中各频点的所述语音类别,确定所述带噪频域信号的语音能量信息以及非语音能量信息;其中,所述带噪时域信号是基于所述预设分帧方式对与所述参考信号匹配的有噪音的带噪信号进行分帧处理得到的;
30.所述信噪比确定模块,用于基于所述带噪频域信号的语音能量信息以及非语音能量信息,确定所述带噪频域信号的信噪比。
31.在一些可选的实施方式中,所述语音类别确定模块,具体用于:
32.针对所述参考频域信号的任一频点,确定对应频点的能量值;
33.若所述对应频点的能量值小于预设能量,则确定所述对应频点的语音类别表征非语音;否则确定所述对应频点的语音类别表征语音。
34.在一些可选的实施方式中,所述能量信息确定模块,具体用于:
35.将所述对应帧的参考频域信号中表征语音的所有频点,在所述带噪频域信号中的能量信息之和,确定为所述带噪频域信号的语音能量信息;以及
36.将所述对应帧的参考频域信号中表征非语音的所有频点,在所述带噪频域信号中
的能量信息之和,确定为所述带噪频域信号的非语音能量信息。
37.在一些可选的实施方式中,所述信噪比确定模块,具体用于:
38.从所述带噪频域信号的语音能量信息以及预设能量信息中选择较大的第一能量信息,并从所述带噪频域信号的非语音能量信息以及所述预设能量信息中选择较大的第二能量信息;
39.基于所述第一能量信息与所述第二能量信息的比值,确定所述带噪频域信号的信噪比。
40.在一些可选的实施方式中,所述信号转化模块,具体用于:
41.将所述参考时域信号进行加窗处理,得到在时域上的加窗参考信号;
42.将所述加窗参考信号进行傅里叶变换,得到在频域上的参考频域信号。
43.在一些可选的实施方式中,还包括分帧处理模块,用于:
44.将所述带噪信号与所述参考信号在时域上对齐。
45.在一些可选的实施方式中,所述分帧处理模块,具体用于:
46.基于信号互相关性,确定所述带噪信号与所述参考信号的时间差值;
47.基于所述时间差值,将所述带噪信号移动到与所述参考信号在时域上对齐。
48.第三方面,本公开实施例提供一种电子设备,包括至少一个处理器以及至少一个存储器,其中,所述存储器存储有计算机程序,当所述程序被所述处理器执行时,使得所述处理器执行如上述第一方面任一项所述的信噪比确定方法。
49.第四方面,本公开实施例提供一种存储介质,其存储有可由电子设备执行的计算机程序,当所述程序在所述电子设备上运行时,使得所述电子设备执行如上述第一方面任一项所述的信噪比确定方法。
50.本公开实施例提供的信噪比确定方法、装置、电子设备和存储介质,具有以下有益效果:
51.本公开实施例是将参考信号分帧处理后转为频域上的参考频域信号,并将带噪信号分帧处理后转为频域上的带噪频域信号;通过确定上述参考频域信号中各频点的语音类别表征语音还是非语音,基于对应帧的带噪频域信号中各频点的上述语音类别,将带噪频域信号中非语音与语音区分出来,即使在时域上的带噪信号的语音中叠加了非平稳噪声,也能在频域上基于频点的语音类别将带噪频域信号中非平稳噪声与语音进行区分,较为准确地确定带噪频域信号的语音能量信息以及非语音能量信息;从而精准地确定每帧带噪频域信号的信噪比。
附图说明
52.为了更清楚地说明本公开实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
53.图1是本公开实施例提供的语音段和非语音段的示意图;
54.图2是本公开实施例提供的第一种信噪比确定方法流程示意图;
55.图3是本公开实施例提供的第二种信噪比确定方法流程示意图;
56.图4a是本公开实施例提供的带噪信号的示意图;
57.图4b是本公开实施例提供的带噪信号的帧界别的信噪比示意图;
58.图5是本公开实施例提供的信噪比确定装置示意图;
59.图6是本公开实施例提供的电子设备结构示意图;
60.图7是本公开实施例提供的程序产品示意图。
具体实施方式
61.为了使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开作进一步地详细描述,显然,所描述的实施例仅仅是本公开的一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本公开保护的范围。
62.本公开中的术语“第一”、“第二”等是用于区别类似的对象,而不是用于描述特定的顺序或先后次序。如:“第一音频帧”并不指代参考时域信号在参考信号中的次序,或者带噪时域信号在带噪信号中的次序,而是指代参考时域信号以及带噪时域信号的类型为在时域上的音频帧;同样的,“第二音频帧”指代参考频域信号以及带噪频域信号的类型为在频域上的音频帧。
63.在本公开的描述中,除非另有说明,“多个”的含义是两个或两个以上。
64.本公开中的术语“参考信号”,是指没有噪音的干净语音信号;
[0065]“带噪信号”为在匹配的“参考信号”中叠加噪声后的信号。
[0066]
在测量处理系统对于噪声的影响、测试语音降噪模块的性能等过程中都需要计算snr。相关技术中,通过对参考信号在时域上划分出语音段和非语音段,并将划分的语音段作为匹配的带噪信号的语音段,将划分的非语音段作为该带噪信号的非语音段;根据带噪信号中语音段的能量值和非语音段(噪声段)的能量值,确定出snr。参阅图1所示,参考信号中a1、a3以及a5为语音段,a2、a4以及a6为非语音段;对应的,带噪信号中a1
#
、a3
#
以及a5
#
为语音段,a2
#
、a4
#
以及a6
#
为非语音段。a1
#
的能量值记作v1
#
,a2
#
的能量值记作v2
#
,a3
#
的能量值记作v3
#
,a4
#
的能量值记作v4
#
,a5
#
的能量值记作v5
#
,a6
#
的能量值记作v6
#
。带噪信号中语音段的能量值v
s
=v1
#
+v3
#
+v5
#
;带噪信号中非语音段的能量值v
n
=v2
#
+v4
#
+v6
#
。
[0067]
然而,带噪信号中可能会出现非平稳噪声,例如:语音段a3
#
中叠加了非平稳噪声,这部分非平稳噪声的能量值不但没有加到非语音段(噪声段)的能量值中,还被误加到语音段的能量值(v3
#
)中,计算得到的语音段的能量值(v
s
)偏大,非语音段的能量值(v
n
)偏小,导致得到的snr偏大。因此,难以通过上述方式精准地确定出snr。
[0068]
鉴于此,本公开实施例提供了一种信噪比确定方法、装置、电子设备和存储介质,本公开实施例是将参考信号分帧处理后转为频域上的参考频域信号,并将带噪信号分帧处理后转为频域上的带噪频域信号;通过确定上述参考频域信号中各频点的语音类别表征语音还是非语音,基于对应帧的带噪频域信号中各频点的上述语音类别,将带噪频域信号中非语音与语音区分出来,即使在时域上的带噪信号的语音中叠加了非平稳噪声,也能在频域上基于频点的语音类别将带噪频域信号中非平稳噪声与语音进行区分,较为准确地确定带噪频域信号的语音能量信息以及非语音能量信息;从而精准地确定每帧带噪频域信号的信噪比。
[0069]
在介绍了本公开的基本原理之后,下面将结合附图及具体实施例,对本公开的技术方案以及本公开的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
[0070]
本公开实施例提供第一种信噪比确定方法的流程示意图,如图2所示,包括以下步骤:
[0071]
步骤s201:在将第一音频帧的参考时域信号转为第二音频帧的参考频域信号后,确定所述参考频域信号中各频点的语音类别。
[0072]
其中,所述语音类别表征语音或者非语音;所述参考时域信号是基于预设分帧方式对无噪音的参考信号进行分帧处理得到的;所述第一音频帧表征时域类型的音频帧,所述第二音频帧表征频域类型的音频帧。
[0073]
如上所述,当带噪信号中出现非平稳噪声时,在时域上进行分析无法精准地确定出snr。基于此,本实施例将带噪信号以及参考信号转到频域上进行分析。
[0074]
由于音频信号在短时间内较为平稳,因此,先基于预设分帧方式将参考信号分帧得到m帧参考时域信号,并采用相同的预设分帧方式将带噪信号分帧得到m帧带噪时域信号。本公开对预设分帧方式不做具体限定,如帧长为10ms,帧长为20ms,或者帧长为30ms等等。
[0075]
分帧得到的每一帧参考时域信号以及每一帧带噪时域信号均是较为平稳的时域上的信号,因此可以转为频域上的信号。
[0076]
步骤s202:在将第一音频帧的带噪时域信号转为第二音频帧的带噪频域信号后,基于对应帧的参考频域信号中各频点的所述语音类别,确定所述带噪频域信号的语音能量信息以及非语音能量信息。
[0077]
其中,所述带噪时域信号是基于所述预设分帧方式对与所述参考信号匹配的有噪音的带噪信号进行分帧处理得到的。
[0078]
本实施例中,带噪时域信号在带噪信号中的次序(即帧次序),与对应帧的参考时域信号在参考信号中的次序相同;例如:第k帧带噪时域信号(这里的第k帧是指该带噪时域信号在带噪信号中的次序为k)的对应帧的参考时域信号,为第k帧参考时域信号(这里的第k帧是指该参考时域信号在参考信号中的次序为k),即第k帧带噪频域信号的对应帧的参考频域信号,为第k帧参考频域信号。
[0079]
通过上述步骤已经确定了参考频域信号中各频点的语音类别,因此,可将对应帧的带噪频域信号的语音频点以及非语音频点(非语音频点包括非平稳噪声的频点)区分出来,进而确定该带噪频域信号的语音能量信息以及非语音能量信息。
[0080]
步骤s203:基于所述带噪频域信号的语音能量信息以及非语音能量信息,确定所述带噪频域信号的信噪比。
[0081]
上述方案,通过将参考信号分帧处理后转为频域上的参考频域信号,并将带噪信号分帧处理后转为频域上的带噪频域信号;通过确定上述参考频域信号中各频点的语音类别表征语音还是非语音,基于对应帧的带噪频域信号中各频点的上述语音类别,将带噪频域信号中非语音与语音区分出来,即使在时域上的带噪信号的语音中叠加了非平稳噪声,也能在频域上基于频点的语音类别将带噪频域信号中非平稳噪声与语音进行区分,较为准确地确定带噪频域信号的语音能量信息以及非语音能量信息;从而精准地确定每帧带噪频
域信号的信噪比。
[0082]
本实施例对上述步骤s201中将时域上的信号转为频域上的信号的具体实现方式不做限定,示例性的,将任一参考时域信号转为参考频域信号,可通过以下方式实现:
[0083]
将所述参考时域信号进行加窗处理,得到在时域上的加窗参考信号;
[0084]
将所述加窗参考信号进行傅里叶变换(如短时傅里叶变换),得到在频域上的参考频域信号。
[0085]
以第k帧参考时域信号为例:
[0086]
其中,x(k,n)为第k帧参考时域信号;为第k帧加窗参考信号;h(l)为窗函数,l表示窗长;
[0087]
其中,stft为短时傅里叶变换,x(k,ω
i
)为第k帧参考频域信号;i=1,2,
……
n,n为第k帧参考频域信号包含的频点总数。
[0088]
同样的,上述步骤s202中将任一带噪时域信号转为带噪频域信号,也可通过以下方式实现:
[0089]
将所述带噪时域信号进行加窗处理,得到在时域上的加窗带噪信号;
[0090]
将所述加窗带噪信号进行傅里叶变换(如短时傅里叶变换),得到在频域上的带噪频域信号。
[0091]
由于参考信号不包含噪音,只包含语音和静音,表征语音的频点的能量值较大,表征非语音(静音)的频点能量值较小。基于此,上述步骤s201中确定参考频域信号中各频点的语音类别,可通过但不限于如下方式实现:
[0092]
针对所述参考频域信号的任一频点,确定对应频点的能量值;
[0093]
若所述对应频点的能量值小于预设能量,则确定所述对应频点的语音类别表征非语音;否则确定所述对应频点的语音类别表征语音。
[0094]
实施中,可采用声压级的信噪比,即20*lg(s/n),更接近人耳。因此,可通过以下方式确定各频点的能量值:
[0095]
x
e
(k,ω
i
)=20*lg(|x(k,ω
i
)|),其中,x(k,ω
i
)为第k帧参考频域信号,x
e
(k,ω
i
)为第k帧参考频域信号中频点ω
i
的能量值。
[0096]
如果x
e
(k,ω
i
)<β,确定上述频点ω
i
的语音类别表征非语音;如果x
e
(k,ω
i
)≥β,确定上述频点ω
i
的语音类别表征语音;其中,β为预设能量,具体数值可以根据实际应用场景设定。
[0097]
上述确定各频点的能量值的实现方式只是示例性说明,本公开并不以此为限。
[0098]
如上所述,表征语音的频点的能量值较大,表征非语音(静音)的频点能量值较小;本实施例在确定对应频点的能量值后,将对应频点的能量值与预设能量进行比对,如果对应频点的能量值小于预设能量,说明对应频点的能量值较小,就能准确地确定出对应频点的语音类别表征非语音;如果对应频点的能量值不小于预设能量,说明对应频点的能量值较大,就能准确地确定出对应频点的语音类别表征语音。
[0099]
上述步骤s202中确定带噪频域信号的语音能量信息以及非语音能量信息,可通过但不限于如下方式实现:
[0100]
将所述对应帧的参考频域信号中表征语音的所有频点,在所述带噪频域信号中的
能量信息之和,确定为所述带噪频域信号的语音能量信息;以及
[0101]
将所述对应帧的参考频域信号中表征非语音的所有频点,在所述带噪频域信号中的能量信息之和,确定为所述带噪频域信号的非语音能量信息。
[0102]
以第k帧带噪频域信号为例:
[0103][0104][0105]
其中,e
n
(k)为第k帧带噪频域信号的非语音能量信息;e
s
(k)为第k帧带噪频域信号的语音能量信息;s(k,ω
i
)为第k帧带噪频域信号;如果频点ω
i
的语音类别表征非语音,vad(k,ω
i
)为0;如果频点ω
i
的语音类别表征语音,vad(k,ω
i
)为1。
[0106]
上述示例只是确定非语音能量信息以及语音能量信息的一种可能的实现方式,本公开并不以此为限。
[0107]
上述步骤s203中基于所述带噪频域信号的语音能量信息以及非语音能量信息,确定所述带噪频域信号的信噪比,可通过但不限于如下方式实现:
[0108]
从所述带噪频域信号的语音能量信息以及预设能量信息中选择较大的第一能量信息,并从所述带噪频域信号的非语音能量信息以及所述预设能量信息中选择较大的第二能量信息;
[0109]
基于所述第一能量信息与所述第二能量信息的比值,确定所述带噪频域信号的信噪比。
[0110]
上述预设能量信息可以根据实际应用场景设置,本公开对此不做具体限定。
[0111]
以预设能量信息为1e
‑
06(即0.000001)为例,可通过以下方式确定第k帧带噪频域信号的信噪比:
[0112]
其中,snr(k)为第k帧带噪频域信号的信噪比(也就是带噪信号中第k帧带噪时域信号的信噪比);e
s
(k)为第k帧带噪频域信号的语音能量信息,max[e
s
(k),1e
‑
06]为上述第一能量信息;e
n
(k)为第k帧带噪频域信号的非语音能量信息,max[e
n
(k),1e
‑
06]为上述第二能量信息。
[0113]
上述示例只是确定带噪频域信号的信噪比的一种可能的实现方式,本公开并不以此为限。
[0114]
通过从语音能量信息以及预设能量信息中选择较大的第一能量信息,并从非语音能量信息以及预设能量信息中选择较大的第二能量信息;避免了因预设能量信息或者非语音能量信息过小而导致得到的信噪比不够精准;基于上述第一能量信息与第二能量信息的比值,精准地确定出帧级别的信噪比。
[0115]
本公开实施例提供第二种信噪比确定方法的流程示意图,如图3所示,包括以下步骤:
[0116]
步骤s301:将所述带噪信号与所述参考信号在时域上对齐。
[0117]
实施中,带噪信号与参考信号之间可能存在时间差值,例如带噪信号相较于参考信号晚了0.0002s,如果直接将带噪信号以及参考信号进行分帧处理,带噪频域信号与对应
帧的参考频域信号并不匹配,频点在参考频域信号中的类别,不能作为该频点在对应帧的带噪频域信号中的类别,确定的带噪频域信号的语音能量信息以及非语音能量信息还是不够准确。基于此,需要在对带噪信号与参考信号进行分帧处理前,先将两个信号在时域上对齐。
[0118]
一些可选的实施方式中,可通过以下方式将带噪信号与参考信号在时域上对齐:
[0119]
基于信号互相关性,确定所述带噪信号与所述参考信号的时间差值;
[0120]
基于所述时间差值,将所述带噪信号移动到与所述参考信号在时域上对齐。
[0121]
示例性的,通过以下公式计算带噪信号与参考信号的时间差值:
[0122]
delay=max[(s
★
x)(n)]
‑
floor{[len(s)+len(x)
‑
1]/2};其中,delay为带噪信号与参考信号的时间差值,
★
代表信号互相关性,s为带噪信号,len(s)为带噪信号的长度,x为参考信号,len(x)为参考信号的长度,floor{}代表取整运算。
[0123]
得到delay后,可以移动带噪信号,最终得到与参考信号对齐的带噪信号。可以理解,后续步骤均是基于对齐的带噪信号进行处理,具体实现方式与图2实施例类似,本实施例不再进行赘述。
[0124]
步骤s302:在将第一音频帧的参考时域信号转为第二音频帧的参考频域信号后,确定所述参考频域信号中各频点的语音类别。
[0125]
步骤s303:在将第一音频帧的带噪时域信号转为第二音频帧的带噪频域信号后,基于对应帧的参考频域信号中各频点的所述语音类别,确定所述带噪频域信号的语音能量信息以及非语音能量信息。
[0126]
步骤s304:基于所述带噪频域信号的语音能量信息以及非语音能量信息,确定所述带噪频域信号的信噪比。
[0127]
上述方案,通过将带噪信号以及参考信号在时域上对齐,使带噪频域信号与对应帧的参考频域信号匹配,频点在参考频域信号中的类别,就可以直接作为该频点在对应帧的带噪频域信号中的类别,更加准确地确定带噪频域信号的语音能量信息以及非语音能量信息。
[0128]
参阅图4a,为本实施例提供的一种带噪信号的示意图,图4b为经过上述信噪比确定方法得到的图4a带噪信号的帧级别的信噪比示意图,图4b中的帧次序是指带噪时域信号在带噪信号中的次序,如上述第k帧参考时域信号的帧次序为k。
[0129]
基于同一发明构思,本公开实施例中还提供了一种信噪比确定装置,该信噪比确定装置实施例可以继承前述方法实施例描述的内容。基于上述实施例,如图5所示为本公开实施例提供的一种信噪比确定装置的结构示意图,该信噪比确定装置具体包括:语音类别确定模块501、信号转化模块502、能量信息确定模块503以及信噪比确定模块504;
[0130]
所述语音类别确定模块501,用于在所述信号转化模块502将第一音频帧的参考时域信号转为第二音频帧的参考频域信号后,确定所述参考频域信号中各频点的语音类别;其中,所述语音类别表征语音或者非语音;所述参考时域信号是基于预设分帧方式对无噪音的参考信号进行分帧处理得到的;所述第一音频帧表征时域类型的音频帧,所述第二音频帧表征频域类型的音频帧;
[0131]
所述能量信息确定模块503,用于在所述信号转化模块502将第一音频帧的带噪时域信号转为第二音频帧的带噪频域信号后,基于对应帧的参考频域信号中各频点的所述语
音类别,确定所述带噪频域信号的语音能量信息以及非语音能量信息;其中,所述带噪时域信号是基于所述预设分帧方式对与所述参考信号匹配的有噪音的带噪信号进行分帧处理得到的;
[0132]
所述信噪比确定模块504,用于基于所述带噪频域信号的语音能量信息以及非语音能量信息,确定所述带噪频域信号的信噪比。
[0133]
在一些可选的实施方式中,所述语音类别确定模块501,具体用于:
[0134]
针对所述参考频域信号的任一频点,确定对应频点的能量值;
[0135]
若所述对应频点的能量值小于预设能量,则确定所述对应频点的语音类别表征非语音;否则确定所述对应频点的语音类别表征语音。
[0136]
在一些可选的实施方式中,所述能量信息确定模块503,具体用于:
[0137]
将所述对应帧的参考频域信号中表征语音的所有频点,在所述带噪频域信号中的能量信息之和,确定为所述带噪频域信号的语音能量信息;以及
[0138]
将所述对应帧的参考频域信号中表征非语音的所有频点,在所述带噪频域信号中的能量信息之和,确定为所述带噪频域信号的非语音能量信息。
[0139]
在一些可选的实施方式中,所述信噪比确定模块504,具体用于:
[0140]
从所述带噪频域信号的语音能量信息以及预设能量信息中选择较大的第一能量信息,并从所述带噪频域信号的非语音能量信息以及所述预设能量信息中选择较大的第二能量信息;
[0141]
基于所述第一能量信息与所述第二能量信息的比值,确定所述带噪频域信号的信噪比。
[0142]
在一些可选的实施方式中,所述信号转化模块502,具体用于:
[0143]
将所述参考时域信号进行加窗处理,得到在时域上的加窗参考信号;
[0144]
将所述加窗参考信号进行傅里叶变换,得到在频域上的参考频域信号。
[0145]
在一些可选的实施方式中,还包括分帧处理模块505,用于:
[0146]
将所述带噪信号与所述参考信号在时域上对齐。
[0147]
在一些可选的实施方式中,所述分帧处理模块505,具体用于:
[0148]
基于信号互相关性,确定所述带噪信号与所述参考信号的时间差值;
[0149]
基于所述时间差值,将所述带噪信号移动到与所述参考信号在时域上对齐。
[0150]
由于该信噪比确定装置即是本公开实施例中的方法中的信噪比确定装置,并且该信噪比确定装置解决问题的原理与该方法相似,因此该信噪比确定装置的实施可以参见方法的实施,重复之处不再赘述。
[0151]
下面参照图6来描述根据本公开的这种实施方式的电子设备600。图6所示的电子设备仅仅是一个示例,不对本公开实施例的功能和使用范围带来任何限制。
[0152]
如图6所示,电子设备600以通用计算装置的形式表现。电子设备600的组件可以包括但不限于:至少一个处理器601、至少一个存储器602、连接不同系统组件(包括存储器602和处理器601)的总线603。
[0153]
总线603表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
[0154]
存储器602可以包括易失性存储器形式的可读介质,例如随机存取存储器(ram)
5021和/或高速缓存存储器6022,还可以进一步包括只读存储器(rom)6023。
[0155]
存储器602还可以包括具有一组(至少一个)程序模块6024的程序/实用工具6025,这样的程序模块6024包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
[0156]
电子设备600也可以与一个或多个外部设备604(例如键盘、指向设备等)通信,还可与一个或者多个使得用户能与电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算装置进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口605进行。并且,电子设备600还可以通过网络适配器606与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器606通过总线603与用于电子设备600的其它模块通信。应当理解,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0157]
在本公开实施例中,存储器602存储有计算机程序,当该程序被处理器601执行时,使得处理器601执行:
[0158]
在将第一音频帧的参考时域信号转为第二音频帧的参考频域信号后,确定所述参考频域信号中各频点的语音类别;其中,所述语音类别表征语音或者非语音;所述参考时域信号是基于预设分帧方式对无噪音的参考信号进行分帧处理得到的;所述第一音频帧表征时域类型的音频帧,所述第二音频帧表征频域类型的音频帧;
[0159]
在将第一音频帧的带噪时域信号转为第二音频帧的带噪频域信号后,基于对应帧的参考频域信号中各频点的所述语音类别,确定所述带噪频域信号的语音能量信息以及非语音能量信息;其中,所述带噪时域信号是基于所述预设分帧方式对与所述参考信号匹配的有噪音的带噪信号进行分帧处理得到的;
[0160]
基于所述带噪频域信号的语音能量信息以及非语音能量信息,确定所述带噪频域信号的信噪比。
[0161]
在一些可选的实施方式中,所述处理器具体执行:
[0162]
针对所述参考频域信号的任一频点,确定对应频点的能量值;
[0163]
若所述对应频点的能量值小于预设能量,则确定所述对应频点的语音类别表征非语音;否则确定所述对应频点的语音类别表征语音。
[0164]
在一些可选的实施方式中,所述处理器具体执行:
[0165]
将所述对应帧的参考频域信号中表征语音的所有频点,在所述带噪频域信号中的能量信息之和,确定为所述带噪频域信号的语音能量信息;以及
[0166]
将所述对应帧的参考频域信号中表征非语音的所有频点,在所述带噪频域信号中的能量信息之和,确定为所述带噪频域信号的非语音能量信息。
[0167]
在一些可选的实施方式中,所述处理器具体执行:
[0168]
从所述带噪频域信号的语音能量信息以及预设能量信息中选择较大的第一能量信息,并从所述带噪频域信号的非语音能量信息以及所述预设能量信息中选择较大的第二能量信息;
[0169]
基于所述第一能量信息与所述第二能量信息的比值,确定所述带噪频域信号的信
噪比。
[0170]
在一些可选的实施方式中,所述处理器具体执行:
[0171]
将所述参考时域信号进行加窗处理,得到在时域上的加窗参考信号;
[0172]
将所述加窗参考信号进行傅里叶变换,得到在频域上的参考频域信号。
[0173]
在一些可选的实施方式中,所述处理器还执行:
[0174]
将所述带噪信号与所述参考信号在时域上对齐。
[0175]
在一些可选的实施方式中,所述处理器具体执行:
[0176]
基于信号互相关性,确定所述带噪信号与所述参考信号的时间差值;
[0177]
基于所述时间差值,将所述带噪信号移动到与所述参考信号在时域上对齐。
[0178]
由于该电子设备即是本公开实施例中的方法中的电子设备,并且该电子设备解决问题的原理与该方法相似,因此该电子设备的实施可以参见方法的实施,重复之处不再赘述。
[0179]
在一些可能的实施方式中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在电子设备上运行时,程序代码用于使电子设备的处理器执行上述任一种信噪比确定方法的步骤。
[0180]
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd
‑
rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0181]
如图7所示,描述了根据本公开的实施方式的程序产品700,其可以采用便携式紧凑盘只读存储器(cd
‑
rom)并包括程序代码,并可以在电子设备上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0182]
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0183]
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。
[0184]
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在电子设备上执行、部分地在电子设备上执行、作为一个独立的软件包执行、部分在电子设备上部分在远程设备上执行、或者完全在远程设备上执行。在涉及远程设备的情形中,远程设备可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到电子设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
[0185]
应当注意,尽管在上文详细描述中提及了系统的若干模块或子模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之,上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。
[0186]
此外,尽管在附图中以特定顺序描述了本公开系统各模块的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些操作,将多个操作合并为一个操作执行,和/或将一个操作分解为多个操作执行。
[0187]
虽然已经参考若干具体实施方式描述了本公开的精神和原理,但是应该理解,本公开并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本公开旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。