首页 > 乐器声学 专利正文
一种声学指数确定方法、装置及存储介质与流程

时间:2022-01-23 阅读: 作者:专利查询

一种声学指数确定方法、装置及存储介质与流程

1.本发明涉及声学领域,尤其是一种声学指数确定方法、装置及存储介质。


背景技术:

2.面对全球环境变化,生物多样性的评估是一项日益紧迫的任务。生物栖息地的任何变化都可以通过当地的声景反映出来,其中鸟类作为声景中最常见的物种,对栖息地环境的改变敏感,是重要的环境指示生物,同样鸟类物种多样性是生态物种多样性重要的组成部分之一,可以很好的反映当地生物多样性的变化。现有研究发现,鸟类声音信息与生物多样性有紧密联系,其中声学指数可以根据音频数据的频域和时域特征,在空间、时间和生态尺度上对当地声景的生态多样性进行描述。
3.而通常计算声学指数前,需要用录音设备在野外现场录制鸟声信号,而录音设备录制的录音信号可能具有多种影响因素,例如录音设备的性能以及环境噪声等等,使得录音信号不一定适用于声学指数的计算,若利用该录音信号进行声学指数的计算,可能会使得声学指数的准确性低,因此需要寻求解决方案。


技术实现要素:

4.有鉴于此,为了解决上述技术问题,本发明的目的是提供提高准确性的一种声学指数确定方法、装置及存储介质。
5.本发明采用的技术方案是:
6.一种声学指数确定方法,包括:
7.获取录音设备的最大采样频率并确定预选声学指数的上限频率值和下限频率值;
8.以所述录音设备为原点建立坐标系统,并根据所述坐标系统确定若干个声源点;
9.在所述声源点播放白噪声信号以确定各个所述声源点的录音信号,并计算各个所述录音信号对应的第一声功率级差;
10.测试与所述录音设备相隔预设距离的位置的脉冲响应,根据所述脉冲响应确定最小频率值以及最大频率值;
11.当所述第一声功率级差均小于等于级差阈值、所述最大频率值大于等于所述上限频率值、所述最小频率值小于等于所述下限频率值以及所述上限频率值小于等于所述最大采样频率的一半,通过所述录音设备获取鸟类声音信号;
12.获取所述鸟类声音信号的采样频率和数据量化比特数;
13.对所述鸟类声音信号进行绝对值处理,计算由大至小排列的前预设数量个绝对值处理结果的绝对值平均值;
14.当所述绝对值平均值大于等于平均值阈值、所述上限频率值小于等于所述采样频率的一半以及所述数据量化比特数大于等于比特数阈值,根据所述鸟类声音信号计算所述预选声学指数。
15.进一步,所述根据所述坐标系统确定若干个声源点,包括:
16.以所述坐标系统的原点为基准,在预设仰角范围和预设方位角范围内确定若干不同仰角或者不同方位角的若干个声源点;所述声源点与所述原点相隔预设距离。
17.进一步,所述在所述声源点播放白噪声信号以确定各个所述声源点的录音信号,并计算各个所述录音信号对应的第一声功率级差,包括:
18.通过扬声器分别在所述声源点上播放白噪声信号;所述扬声器相邻两个第一预设倍数频带的第二声功率级差小于等于所述级差阈值;
19.对所述扬声器的播放增益进行调节以使得在各个所述声源点播放白噪声信号时所述原点的声压级为预设声压级,获取各个所述声源点的录音信号;
20.通过第二预设倍数频程滤波器分别对各个所述录音信号进行滤波处理,得到每一所述录音信号对应的若干个第二预设倍数频带;
21.分别计算每一所述录音信号相邻的所述第二预设倍数频带的第一声功率级差。
22.进一步,所述根据所述脉冲响应确定最小频率值以及最大频率值,包括:
23.对所述脉冲响应进行快速傅立叶变换;
24.取快速傅立叶变换结果的幅度值并对数处理;
25.计算由大至小排列且位于中间位置的预设个数的对数处理结果的对数平均值;
26.根据所述快速傅立叶变换过程中的快速傅立叶变换点数与第一数值的比值,确定搜索阈值;
27.以搜索阈值为起点往小于搜索阈值的方向在对数处理结果中搜索出第一个比所述对数平均值小第二数值的第一数据,将所述第一数据对应的频率值确定为最小频率值,或当所述第一数据不存在,将所述最小频率值设定为0;
28.以搜索阈值为起点往大于搜索阈值的方向在对数处理结果中搜索出第一个比所述对数平均值小第二数值的第二数据,将所述第二数据对应的频率值确定为最大频率值,或者当所述第二数据不存在,将所述最大频率值设定为搜索阈值乘以第一数值的一半。
29.进一步,所述根据所述鸟类声音信号计算所述预选声学指数,包括:
30.对所述鸟类声音信号进行第一归一化,对归一化结果进行标注计算处理,确定有用声段的第一平均能量值以及噪声段的第二平均能量值,根据所述第一平均能量值以及所述第二平均能量值确定信噪比,根据信噪比以及信噪比阈值确定第一信号;
31.合成鸟鸣声参考声音信号,对所述鸟鸣声参考声音信号进行第二归一化处理,得到第二信号;
32.通过所述脉冲响应对所述第二信号进行滤波,得到第三信号;
33.计算所述第二信号的第一声学指数值以及计算所述第三信号的第二声学指数值;
34.根据所述第一声学指数值以及所述第二声学指数值,确定目标补偿滤波器;
35.根据所述目标补偿滤波器以及所述第一信号,计算所述预选声学指数。
36.进一步,所述根据所述第一声学指数值以及所述第二声学指数值,确定目标补偿滤波器,包括:
37.当所述第一声学指数值与所述第二声学指数值的相对差值小于差值阈值,将目标补偿滤波器设定为单位脉冲序列;
38.或者,
39.当所述第一声学指数值与所述第二声学指数值的相对差值大于等于差值阈值,将
补偿滤波器设置为均衡滤波器;所述均衡滤波器通过计算所述脉冲响应的倍数阈值频程的频率响应而确定;
40.通过所述补偿滤波器对第三信号进行滤波,得到第四信号,并计算所述第四信号的第三声学指数值;
41.当所述第二声学指数值与所述第三声学指数值的相对差值小于等于差值阈值,将所述补偿滤波器作为所述目标补偿滤波器,否则减少所述倍数阈值以更新所述补偿滤波器直至达到结束条件,将更新后的所述补偿滤波器作为所述目标补偿滤波器。
42.进一步,所述根据所述目标补偿滤波器以及所述第一信号,计算所述预选声学指数,包括:
43.通过所述目标补偿滤波器对所述第一信号进行滤波,并根据滤波结果计算所述预选声学指数。
44.本发明还提供一种声学指数确定装置,包括:
45.第一获取模块,用于获取录音设备的最大采样频率并确定预选声学指数的上限频率值和下限频率值;
46.第一确定模块,用于以所述录音设备为原点建立坐标系统,并根据所述坐标系统确定若干个声源点;
47.第一计算模块,用于在所述声源点播放白噪声信号以确定各个所述声源点的录音信号,并计算各个所述录音信号对应的第一声功率级差;
48.第二确定模块,用于测试与所述录音设备相隔预设距离的位置的脉冲响应,根据所述脉冲响应确定最小频率值以及最大频率值;
49.第二获取模块,用于当所述第一声功率级差均小于等于级差阈值、所述最大频率值大于等于所述上限频率值、所述最小频率值小于等于所述下限频率值以及所述上限频率值小于等于所述最大采样频率的一半,通过所述录音设备获取鸟类声音信号;
50.第三获取模块,用于获取所述鸟类声音信号的采样频率和数据量化比特数;
51.第二计算模块,用于对所述鸟类声音信号进行绝对值处理,计算由大至小排列的前预设数量个绝对值处理结果的绝对值平均值;
52.第三计算模块,用于当所述绝对值平均值大于等于平均值阈值、所述上限频率值小于等于所述采样频率的一半以及所述数据量化比特数大于等于比特数阈值,根据所述鸟类声音信号计算所述预选声学指数。
53.本发明还提供一种声学指数确定装置,包括处理器以及存储器;
54.所述存储器存储有程序;
55.所述处理器执行所述程序以实现所述方法。
56.本发明还提供一种计算机可读存储介质,所述存储介质存储有程序,所述程序被处理器执行时实现所述方法。
57.本发明的有益效果是:通过获取录音设备的最大采样频率并确定预选声学指数的上限频率值和下限频率值,以录音设备为原点建立坐标系统,并根据坐标系统确定若干个声源点,在声源点播放白噪声信号以确定各个声源点的录音信号,并计算各个录音信号对应的第一声功率级差,测试与录音设备相隔预设距离的位置的脉冲响应,根据脉冲响应确定最小频率值以及最大频率值,当第一声功率级差均小于等于级差阈值、最大频率值大于
等于上限频率值、最小频率值小于等于下限频率值以及上限频率值小于等于最大采样频率的一半,确保若通过录音设备录制信号,其录制信号适用于预选声学指数的计算;通过录音设备获取鸟类声音信号,获取鸟类声音信号的采样频率和数据量化比特数,对鸟类声音信号进行绝对值处理,计算由大至小排列的前预设数量个绝对值处理结果的绝对值平均值,当绝对值平均值大于等于平均值阈值、上限频率值小于等于采样频率的一半以及数据量化比特数大于等于比特数阈值,根据鸟类声音信号计算预选声学指数,进一步确保录音设备获取的鸟类声音信号适用于声学指数的计算,从而提高了预选声学指数的准确性。
附图说明
58.图1为本发明声学指数确定方法的步骤流程示意图;
59.图2为本发明具体实施例球坐标系统的示意图。
具体实施方式
60.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
61.本技术的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
62.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
63.如图1所示,本发明实施例提供一种声学指数确定方法,包括步骤s100-s800:
64.s100、获取录音设备的最大采样频率并确定预选声学指数的上限频率值和下限频率值。
65.本发明实施例中,当录音设备支持的一个或多个采样频率值时,选取最大的值即最大采样频率fs。可选地,预选声学指数可以事先进行选定,可选的声学指数包含但不限于:声学复杂性指数(acoustic complexity index,aci)、声学多样化指数(acoustic diversity index,adi)、声学均匀度指数(acoustic evenness index,aei)、声学丰富度指数(acoustic richness index,ar)、生物声学指数(bioacoustic index,bi)、声学熵指数(acoustic entropy index,h)、归一化差异声景指数(normalized difference soundscape index,ndsi),而每一种声学指数具有对输入信号的要求,例如声学指数要求的输入信号的上限频率值f
ih
和下限频率值f
il

66.s200、以录音设备为原点建立坐标系统,并根据坐标系统确定若干个声源点。
67.可选地,以录音设备的麦克风为原点建立球坐标系统,其他实施例中可以为其他坐标系统。本发明实施例中,麦克风a朝向的方向为正前方,以坐标系统的原点为基准,在预设仰角范围和预设方位角范围内确定若干不同仰角或者不同方位角的若干个声源点;声源点与原点相隔预设距离。
68.如图2所示,具体地,空间中任意点s用球坐标(r,θ,φ)表示,r为距离,本发明实施例中设置为1m(预设距离),φ为仰角,θ为方位角,-90
°
≤φ≤90
°
(预设仰角范围)和0
°
≤θ《360
°
(预设方位角范围);φ=0
°
和+90
°
分别表示水平面和正上方,在水平面θ=0
°
和90
°
分别表示正前和正右方。具体地,用支架将录音设备放置在消声室的有效自由场中,确定声源点分别为(1,0
°
,0
°
)、(1,45
°
,0
°
)、(1,90
°
,0
°
)、(1,135
°
,0
°
)、(1,180
°
,0
°
)、(1,0
°
,45
°
)、(1,45
°
,45
°
)、(1,90
°
,45
°
)、(1,135
°
,45
°
)、(1,180
°
,45
°
)、(1,0
°
,90
°
),共11个,其他实施例中声源点的数量和位置可以根据实际需要进行调整。
69.s300、在声源点播放白噪声信号以确定各个声源点的录音信号,并计算各个录音信号对应的第一声功率级差。
70.可选地,步骤s300包括步骤s310-s340:
71.s310、通过扬声器分别在声源点上播放白噪声信号。
72.本发明实施例中,声源点与录音设备均在消声室的有效自由场中,将同一扬声器分别在各述声源点上播放20秒的白噪声信号,扬声器朝向坐标原点。可选地,扬声器满足频率范围100hz~16000hz、相邻两个第一预设倍数(包括但不限于1/3倍)频带的第二声功率级差小于等于级差阈值(包括但不限于3db),白噪声信号的峰值因素≥2,频谱密度:20hz~20khz
±
1db,信噪比≥60db)。需要说明的是,设某个频带的上限频率是fh、下限频率是f
l
,若fh/f
l
=2
n1
,且每个频带都满足这个关系,则称这是n1倍频带划分,当n1为1/3进行频带划分即1/3倍频带,频带的中心频率fc=(f
hfl
)1/2,本发明实施例中,对于1/3倍频带,在100hz~16000hz之间,频带的中心频率分别是125、160、200、250、315、400、500、630、800、1000、1250、1600、2000、2500、3150、4000、5000、6300、8000、10000、12500hz,中心频率125、160hz对应的频带为相邻频带,160、200hz对应的频带也为相邻频带,以此类推,不再赘述。
73.s320、对扬声器的播放增益进行调节以使得在各个声源点播放白噪声信号时原点的声压级为预设声压级,获取各个声源点的录音信号。
74.可选地,在预设声压级范围70db~80db之间选择一个固定值lp(db)作为预设声压级,调节扬声器的播放增益,使得在各个声源点播放白噪声信号时原点处的声压级均为lp(db),然后通过录音设备录制各个声源点的录音信号,设各声源点对应的录音信号分别为yi(n),(i=1,2,

,11;n=0,1,2,

,n-1)。其中,n代表一个录音文件包含的样本点个数,例如某单声道录音文件长为2秒,采样率为32000hz,则n=2x32000=64000;yi(n)表示与第i个声源点对应的录音信号,例如y1(0)表示与第1个声源点对应的录音信号的第一个样本点,y1(n-1)表示第n个样本点,y2(0)与第2个声源点对应的录音信号的第一个样本点。
75.s330、通过第二预设倍数频程滤波器分别对各个录音信号进行滤波处理,得到每一录音信号对应的若干个第二预设倍数频带。
76.可选地,第二预设倍数以1/3为例,用1/3倍频程滤波器(上限截止频率是下限截止频率的2
1/3
倍的带通滤波器)对录音信号yi(n)滤波得到每一录音信号yi(n)对应的若干个1/3倍频带构成的频带信号,可选地以18个1/3倍频带为例,频带信号为y
ik
(n),k=1,2,

,18,
分别对应中心频率为200、250、315、400、500、630、800、1000、1250、1600、2000、2500、3150、4000、5000、6300、8000、10000hz的1/3倍频带,即每个声源点对应的录音信号都用18个1/3倍频程滤波器进行滤波,每个录音信号都分别被划分为18个频带的信号,y
ik
(n)表示第i个录音信号的第k个频带的信号。
77.s340、分别计算每一录音信号相邻的第二预设倍数频带的第一声功率级差。
78.具体地,第一声功率级l
ik
计算公式为:
[0079][0080]
需要说明的是,对于各个频带k,计算所有l
ik
两两之间的差值即第一声功率级差。
[0081]
s400、测试与录音设备相隔预设距离的位置的脉冲响应,根据脉冲响应确定最小频率值以及最大频率值。
[0082]
本发明实施例中,在消声室中用支架将录音设备放置在消声室的有效自由场中,高度为1.2-1.5m,在录音设备正前方1m处(预设距离)的位置测试录音设备的脉冲响应h(n)。
[0083]
具体地,步骤s400中根据脉冲响应确定最小频率值以及最大频率值,包括步骤s410-s460:
[0084]
s410、对脉冲响应进行快速傅立叶变换。
[0085]
具体地,对h(n)做fft(快速傅立叶变换),得到h(m)。其中,fft过程中的fft点数(对h(n)作fft时设置的fft点数/快速傅立叶变换点数)n_fft=fs(最大采样频率)。
[0086]
s420、取快速傅立叶变换结果的幅度值并作对数处理。
[0087]
具体地,对h(m)取幅度值,得到abs_h(m),对abs_h(m)进行对数处理,得到对数处理结果db_h(m)。其中,对数处理公式为:
[0088]
db_h(m)=20log
10
[abs_h(m)]
[0089]
s430、计算由大至小排列且位于中间位置的预设个数的对数处理结果的对数平均值。
[0090]
具体地,将对数处理结果由大至小排列,取出位于中间位置的预设个数的对数处理结果,然后利用取出的对数处理结果计算平均值得到对数平均值avg_db_h。需要说明的是,取出位于中间位置的预设个数的对数处理结果相当于去掉一定数量的最大值和最小值。
[0091]
s440、根据快速傅立叶变换过程中的快速傅立叶变换点数与第一数值的比值,确定搜索阈值。
[0092]
需要说明的是,第一数值可以根据需要调整,本发明实施例中以第一数值为4为例进行说明。具体地,搜索阈值m1=n_fft/4。
[0093]
s450、以搜索阈值为起点往小于搜索阈值的方向在对数处理结果中搜索出第一个比对数平均值小第二数值的第一数据,将第一数据对应的频率值确定为最小频率值,或当第一数据不存在,将最小频率值设定为0。
[0094]
需要说明的是,第二数值可以根据需要调整,本发明实施例中以第二数值为10db为例进行说明。具体地,以搜索阈值m1为起点,往m1<n_fft/4方向搜索,在对数处理结果db_
h(m)中搜索出第一个比对数平均值avg_db_h小10db的第一数据db_h

(m),将第一数据db_h

(m)对应的频率值确定为最小频率值m
min
。另外,当不存在第一数据db_h

(m),则最小频率值m
min
=0。
[0095]
s460、以搜索阈值为起点往大于搜索阈值的方向在对数处理结果中搜索出第一个比对数平均值小第二数值的第二数据,将第二数据对应的频率值确定为最大频率值,或者当第二数据不存在,将最大频率值设定为搜索阈值乘以第一数值的一半。
[0096]
需要说明的是,步骤s450与步骤s460不限定执行顺序。具体地,以搜索阈值m1起点,往m1>n_fft/4方向搜索,找出第一个比对数平均值avg_db_h小10db的第二数据db_h

(m),将第二数据db_h

(m)对应的频率值确定为最大频率值m
max
。另外,若不存在第二数据db_h

(m),则最大频率值m
max
=n_fft/2。
[0097]
s500、当第一声功率级差均小于等于级差阈值、最大频率值大于等于上限频率值、最小频率值小于等于下限频率值以及上限频率值小于等于最大采样频率的一半,通过录音设备获取鸟类声音信号。
[0098]
具体地,当第一声功率级差均小于等于级差阈值(包括但不限于3db)、最大频率值m
max
大于等于上限频率值f
ih
、最小频率值m
min
小于等于下限频率值f
il
以及上限频率值f
ih
小于等于最大采样频率的一半(fs/2),认为录音设备录制的声音信号可以用于计算预选声学指数,此时利用录音设备获取鸟类声音信号,鸟类声音信号即至少包含鸟的鸣叫声的信号,可选地,可以在野外现场录制得到。
[0099]
s600、获取鸟类声音信号的采样频率和数据量化比特数。
[0100]
可选地,鸟类声音信号可以为单声道或者双声道,若为双声道则一次只取其中一个声道,此时鸟类声音信号用x(n)表示,采样频率用f
sr
表示,数据量化比特数用nbits表示。其中,鸟类声音信号还包括数据个数n_x。
[0101]
s700、对鸟类声音信号进行绝对值处理,计算由大至小排列的前预设数量个绝对值处理结果的绝对值平均值。
[0102]
本发明实施例中,对鸟类声音信号进行绝对值处理包括:对鸟类声音信号x(n)取绝对值并除以2
nbits-1
,得到绝对值处理结果abs_x(n)。然后,将abs_x(n)从大到小排序,计算前预设数量个(floor(0.1n_x)~floor(0.3n_x)个)绝对值处理结果并取平均值,得到绝对值平均值avg_x。其中,floor()表示向下取整。
[0103]
s800、当绝对值平均值大于等于平均值阈值、上限频率值小于等于采样频率的一半以及数据量化比特数大于等于比特数阈值,根据鸟类声音信号计算预选声学指数。
[0104]
具体地,当绝对值平均值avg_x≥0.1(平均值阈值)、上限频率值f
ih
≤采样频率f
sr
/2、数据量化比特数nbits≥16(比特数阈值),认为该录音设备录制的声音信号可用于计算预选声学指数,此时根据鸟类声音信号计算预选声学指数。
[0105]
具体地,步骤s800中根据鸟类声音信号计算预选声学指数,包括步骤s810-s860:
[0106]
s810、对鸟类声音信号进行第一归一化,对归一化结果进行标注计算处理,确定有用声段的第一平均能量值以及噪声段的第二平均能量值,根据第一平均能量值以及第二平均能量值确定信噪比,根据信噪比以及信噪比阈值确定第一信号。
[0107]
具体地,对鸟类声音信号进行第一归一化得到归一化结果x
nor
(n),基于能量检测的方法进行标注计算处理:在x
nor
(n)上标注噪声段和有用声段,并计算有用声段的第一平
均能量值es以及噪声段的第二平均能量值en,然后计算信噪比db_sn=10log
10
[es/en]。
[0108]
可选地,若db_sn<15(信噪比阈值),对x
nor
(n)采用最优改进对数谱幅度估计(optimally-modified log-spectral amplitude,omlsa)方法作降噪处理,得到降噪后第一信号x
dn
(n);若db_sn≥15,则第一信号x
dn
(n)=x
nor
(n)。
[0109]
s820、合成鸟鸣声参考声音信号,对鸟鸣声参考声音信号进行第二归一化处理,得到第二信号。
[0110]
具体地,合成一段鸟鸣声参考声音信号xr(n),xr(n)中鸟类物种数大于等于两种,xr(n)覆盖频率范围至少为200hz-10000hz,xr(n)信噪比大于等于15db。本发明实施例中,对xr(n)作第二归一化处理,得到第二信号x0(n)。
[0111]
s830、通过脉冲响应对第二信号进行滤波,得到第三信号。
[0112]
具体地,通过脉冲响应h(n)对第二信号x0(n)进行滤波,得到第三信号x1(n)。
[0113]
s840、计算第二信号的第一声学指数值以及计算第三信号的第二声学指数值。
[0114]
s850、根据第一声学指数值以及第二声学指数值,确定目标补偿滤波器。
[0115]
具体地,步骤s850包括步骤s801或者s802:
[0116]
s801、当第一声学指数值与第二声学指数值的相对差值小于差值阈值,将目标补偿滤波器设定为单位脉冲序列。
[0117]
本发明实施例中,对比第一声学指数值与第二声学指数值,当第一声学指数值与第二声学指数值的相对差值均小于10%(差值阈值),令目标补偿滤波器hc(n)=单位脉冲序列δ(n)。
[0118]
可选地,步骤s802包括步骤s8021-s8023:
[0119]
s8021、当第一声学指数值与第二声学指数值的相对差值大于等于差值阈值,将补偿滤波器设置为均衡滤波器。
[0120]
具体地,当第一声学指数值与第二声学指数值的相对差值大于等于10%(差值阈值),令补偿滤波器h
c1
(n)=均衡滤波器he(n)。需要说明的是,均衡滤波器he(n)通过计算脉冲响应h(n)的1/m2倍(倍数阈值)频程的频率响应,m2由实验确定,例如初始值设为3,频率范围取100-16000hz,得到各频带的幅度分贝值,并计算其平均值,以该平均值为基准,计算各频带提升或衰减的分贝值,据此设计相应的均衡滤波器he(n)。
[0121]
s8022、通过补偿滤波器对第三信号进行滤波,得到第四信号,并计算第四信号的第三声学指数值。
[0122]
具体地,用补偿滤波器h
c1
(n)对第三信号x1(n)进行滤波得到第四信号x2(n),计算第四信号x2(n)对应的第三声学指数。
[0123]
s8023、当第二声学指数值与第三声学指数值的相对差值小于等于差值阈值,将补偿滤波器作为目标补偿滤波器,否则减少倍数阈值以更新补偿滤波器直至达到结束条件,将更新后的补偿滤波器作为目标补偿滤波器。
[0124]
具体地,当第二声学指数值与第三声学指数值的相对差值小于等于10%(差值阈值),将补偿滤波器h
c1
(n)作为目标补偿滤波器hc(n),否则将n增加128或m2增加3(相当于减少倍数阈值),重新按照步骤s8021更新补偿滤波器h
c1
(n),直至m2≥24(结束条件),将此时更新后的补偿滤波器h
c1
(n)作为目标补偿滤波器hc(n)。
[0125]
s860、根据目标补偿滤波器以及第一信号,计算预选声学指数。
[0126]
具体地,通过目标补偿滤波器hc(n)对第一信号x
dn
(n)进行滤波,得到滤波结果xf(n),并根据滤波结果xf(n)计算预选声学指数。需要说明的是,本发明实施例中预选声学指数以及各个声学指数值的计算可以采用基于开源的r语言程序包,对信号计算对应的声学指数。可选地,aci、adi、aei、bi、ndsi采用soundecology包,ar、h采用seewave包,还可以使用tuner包来用于信号的读取和格式转换。
[0127]
本发明实施例中,滤波可以从信噪比较低的x
nor
(n)信号中消除风声、蝉鸣声、溪流声等常见环境噪声,得到第一信号;目标补偿滤波器可以对录音设备获取的信号进行补偿,减小信号失真。
[0128]
本发明实施例的声学指数确定方法使得无论专业的录音设备还是非专业的录音设备,其录取数据都可获得较为一致的声学指数;另外,提高自制或廉价录音设备的可信度,这将有益于利用这类设备开展大规模的、可靠的生态多样性调查和监测,可以节省成本提高经济效益。
[0129]
本发明实施例还提供一种声学指数确定装置,包括:
[0130]
第一获取模块,用于获取录音设备的最大采样频率并确定预选声学指数的上限频率值和下限频率值;
[0131]
第一确定模块,用于以录音设备为原点建立坐标系统,并根据坐标系统确定若干个声源点;
[0132]
第一计算模块,用于在声源点播放白噪声信号以确定各个声源点的录音信号,并计算各个录音信号对应的第一声功率级差;
[0133]
第二确定模块,用于测试与录音设备相隔预设距离的位置的脉冲响应,根据脉冲响应确定最小频率值以及最大频率值;
[0134]
第二获取模块,用于当第一声功率级差均小于等于级差阈值、最大频率值大于等于上限频率值、最小频率值小于等于下限频率值以及上限频率值小于等于最大采样频率的一半,通过录音设备获取鸟类声音信号;
[0135]
第三获取模块,用于获取鸟类声音信号的采样频率和数据量化比特数;
[0136]
第二计算模块,用于对鸟类声音信号进行绝对值处理,计算由大至小排列的前预设数量个绝对值处理结果的绝对值平均值;
[0137]
第三计算模块,用于当绝对值平均值大于等于平均值阈值、上限频率值小于等于采样频率的一半以及数据量化比特数大于等于比特数阈值,根据鸟类声音信号计算预选声学指数。
[0138]
上述方法实施例中的内容均适用于本装置实施例中,本装置实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
[0139]
本发明实施例还提供了一种声学指数确定装置,该装置包括处理器以及存储器;
[0140]
存储器用于存储程序;
[0141]
处理器用于执行程序实现本发明实施例的声学指数确定方法。本发明实施例的装置可以实现声学指数确定的功能。该装置可以为包括手机、平板电脑、电脑、个人数字助理(personal digital assistant,简称pda)、车载电脑等任意智能终端。
[0142]
上述方法实施例中的内容均适用于本装置实施例中,本装置实施例所具体实现的
功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
[0143]
本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有程序,该程序被处理器执行完成如前述发明实施例的声学指数确定方法。
[0144]
本发明实施例还提供一种包括指令的计算机程序产品,当其在计算机上运行时,使得计算机执行前述发明实施例的声学指数确定方法。
[0145]
本技术的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0146]
应当理解,在本技术中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:只存在a,只存在b以及同时存在a和b三种情况,其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
[0147]
在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0148]
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括多指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等各种可以存储程序的介质。
[0149]
以上,以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。