首页 > 乐器声学 专利正文
一种基于声纹识别和声源定位的工程车辆识别定位装置的制作方法

时间:2022-02-24 阅读: 作者:专利查询

一种基于声纹识别和声源定位的工程车辆识别定位装置的制作方法

1.本实用新型属于信号处理技术领域,特别是涉及一种基于声纹识别和声源定位的工程车辆识别定位装置。


背景技术:

2.针对现有技术存在的技术问题,本技术提出使用声纹识别技术和声源定位技术来对工地特种车进行识别和定位并做成装置,这种装置可以在工地等复杂环境对工地特种车辆进行实时识别并且定位,在这些工地特种车辆工作时,给管理部门预警,暂停或是终止施工作业。该装置分为两步,第一步为声纹识别,第二步为声源定位。声纹识别的基本原理是通过音频来构建一个属于工地特种车特征的模型库,这个模型库主要包含了工程车辆的声纹特征,然后再和采集过来的音频进行对比,通过模式匹配来判别该语音是否是模型库音频,以达到识别的目的。声源定位的基本原理是通过工程车辆音频信号到达每个麦克风传感器的时间差,进而通过几何关系来确定工程车辆的位置。
3.使用基于视频图像的车辆检测及车型识别或是分布式光纤振动传感器在现实操作上会存在很多问题。现实情况,我们需要对工地特种车辆进行实时识别且定位,本实用新型提供了一种基于声纹识别和声源定位的工程车辆识别与定位的装置。这种基于声音特性和声音到达差的识别定位方法及装置,可以通过声音采集设备来采集声音,然后识别声音中是否存在工程车辆,并且通过工程车辆声音到达每个麦克风传感器的时间不同,进而通过几何关系来确定工程车辆的位置,而视频图像装置在安装时较为麻烦,从而会影响维修者的维修。


技术实现要素:

4.本实用新型的目的在于提供一种基于声纹识别和声源定位的工程车辆识别定位装置,通过设置的l形板,当转动螺纹杆时,螺纹杆带动l形板转动,从而对装置进行固定,方便了对定位装置进行安装和拆卸,提高了安装和拆卸的效率,而设置的u形板,减少了l形板在滑动时倾斜的情况发生,从而提高了装置的稳定性,解决了上述现有技术中存在的问题。
5.为达上述目的,本实用新型是通过以下技术方案实现的:
6.一种基于声纹识别和声源定位的工程车辆识别定位装置,包括训练模块、测试模块、基板,训练模块、测试模块均包括:预处理,预处理连接有特征提取,两特征提取分别连接有训练模型、对比判断;训练模型连接有模型库,对比判断连接有输出结果,模型库通过模式匹配与对比判断连接,预处理与dft的输入端连接;基板的内部开设有槽道,槽道的内部设置有两固定组件,槽道的内部转动配合有螺纹杆,螺纹杆的周侧螺纹配合有两u形板,固定组件包括:l形板、转动筒;转动筒的周侧安装有固定环,固定环的外侧安装有滑动板,且两滑动板分别滑动配合在两u形板内,转动筒的上端周侧安装有限位块。
7.可选的,三预处理的一侧分别连接有语音输入、待测语音、音频信号。
8.可选的,dft与mel滤波器组的输入端连接,mel滤波器组与对数能量的输入端连
接,对数能量与dct的输入端连接。
9.可选的,槽道的内部设置有挡板,挡板的一侧安装有连接板,连接板的一侧安装有固定杆,固定杆与l形板转动配合。
10.可选的,l形板的一侧安装有弹簧,且弹簧与挡板相连接。
11.可选的,螺纹杆的端部安装有转动板。
12.本实用新型的实施例具有以下有益效果:
13.本实用新型的一个实施例通过设置的l形板,当转动螺纹杆时,螺纹杆带动l形板转动,从而对装置进行固定,方便了对定位装置进行安装和拆卸,提高了安装和拆卸的效率,而设置的u形板,减少了l形板在滑动时倾斜的情况发生,从而提高了装置的稳定性。
14.当然,实施本实用新型的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
15.构成本技术的一部分的说明书附图用来提供对本实用新型的进一步理解,本实用新型的示意性实施例及其说明用于解释本实用新型,并不构成对本实用新型的不当限定。在附图中:
16.图1为本实用新型一实施例的训练模块结构示意图;
17.图2为本实用新型一实施例的训练模块结构示意图;
18.图3为本实用新型一实施例的tdoa结构示意图;
19.图4为本实用新型一实施例的tdoa定位结构示意图;
20.图5为本实用新型一实施例的gcc结构示意图;
21.图6为本实用新型一实施例的基板结构示意图;
22.图7为本实用新型一实施例的槽道结构示意图;
23.图8为图7中a处结构示意图。
24.其中,上述附图包括以下附图标记:
25.基板1,槽道2,螺纹杆3,固定板4,u形板5,转动板6,挡板7,连接板8,固定杆9,l形板10,弹簧11,转动筒12,固定环13,限位块14,滑动板15。
具体实施方式
26.下面将结合本实用新型实施例中的附图,对本实用新型实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本实用新型一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本实用新型及其应用或使用的任何限制。
27.为了保持本实用新型实施例的以下说明清楚且简明,本实用新型省略了已知功能和已知部件的详细说明。
28.请参阅图1

8所示,在本实施例中提供了一种基于声纹识别和声源定位的工程车辆识别定位装置,包括:训练模块、测试模块、基板1,训练模块、测试模块均包括:预处理,预处理连接有特征提取,两特征提取分别连接有训练模型、对比判断;训练模型连接有模型库,对比判断连接有输出结果,模型库通过模式匹配与对比判断连接,预处理与dft的输入端连接;基板1的内部开设有槽道2,槽道2的内部设置有两固定组件,槽道2的内部转动配合
有螺纹杆3,螺纹杆3的周侧螺纹配合有两u形板5,固定组件包括:l形板10、转动筒12;转动筒12的周侧安装有固定环13,固定环13的外侧安装有滑动板15,且两滑动板15分别滑动配合在两u形板5内,转动筒12的上端周侧安装有限位块14。
29.本实施例一个方面的应用为:
30.首先采集工地特种车的语音,经过预处理,再提取出特征参数,建立其模型数据库,在测试模块,在工地复杂场景上使用声音传感采集待识别工程车辆的音频,经过相同的预处理和端点检测、特征提取模块,然后与模型数据库中的参数进行相似度对比,进而来判别声音中是否包含有工程车辆;
31.在需要安装装置时,首先转动螺纹杆3,螺纹杆3通过两u形板5分别带动两滑动板15滑动,两滑动板15分别通过两固定环13带动两转动筒12转动,转动筒12通过限位块14带动l形板10转动,从而对装置进行固定,当需要拆卸装置时,同理方向转动螺纹杆3即可完成拆卸。需要注意的是,本技术中所涉及的用电设备均可通过蓄电池供电或外接电源。
32.具体的提取过程如下:
33.(1)预处理
34.对采集到的音频信号,经过采样和量化、预加重处理、分帧与加窗处理和端点检测处理,得到时域信号x(n)。
35.a、预加重。预加重是为了消除发声过程中嘴唇的影响,使信号频谱变得平坦。同时补偿语音信号高频部分,有利于后面进行频谱分析。
36.y(n)=s(n)

a*s(n

1)
37.其中,a为预加重系数,取值范围0.9~1.0。
38.b、分帧。音频信号虽然是非平稳的时变信号,但在一小段时间里依然具有短时平稳性,利用这一点,对语音做分帧处理。通常设置0.02~0.05ms的时长作为一帧,帧移设置0.01ms作为移动步长,使两帧之间有部分重叠,避免两帧变化过大。
39.c、加窗。在mfcc特征提取过程中,常使用的窗函数为汉明窗。由于后面对每一帧做傅里叶变换,假设每一帧是一个周期信号。添加汉明窗函数,就是在连续信号的分段处做平滑处理,波形类似周期函数。
40.x'(n)=x(n)*ω(n)
41.其中,
42.d、端点检测。端点检测就是把我们需要的语音信号将它的开始点和结束点检测出来,丢掉那些我们不需要的无关段。在声纹识别技术中,端点检测起的作用是不能小看的,因为好的端点检测的技术能使整个系统的时间鲁棒性提高,节约了时间。也能使得在之后特征参数提取和识别阶段运行得更加顺畅,较少的受到一些无关段的影响,从而提高了识别率。
43.(2)dft变换
44.最开始对信号进行补0处理,直到补齐到n等于512,再进行dft,得到x(k)为信号的频谱。其表达式为:
[0045][0046]
在此步骤时,一定要考虑傅里叶级数的大小,选择合适的级数会减少计算量,也能使得精度较高。
[0047]
(3)mel滤波器组
[0048]
实验观测发现人耳就像是一个滤波器组,只关注某些特定的频率分量,而降低甚至忽略对其他频率信号的感知。mel频率分析就是基于人类听觉感知实验的,考虑到了人耳的听觉特征,将线性频谱映射到基于听觉感知的非线性频谱中,然后转化到倒谱上。滤波器传递函数h
m
(k):
[0049][0050]
f(m)定义为:
[0051][0052]
f
l
和f
h
分别是在mel滤波器组内的最低和最高频率。n是离散余弦变换的变换点数。m为三角滤波器的个数。b

1和b是互逆函数,且
[0053]
fs是采样频率。每个滤波器的输出为:
[0054][0055]
(4)去能量对数
[0056]
对e(m)取对数,得到对数频谱s(m):
[0057]
s(m)=ln(e(m)),0≤m≤m
[0058]
(5)离散余弦变换(dct)
[0059]
离散余弦变换dct(discretecosinetransform)的主要目的是使得向量之间独立。经过离散余弦变换后,使得特征参数的维度减少,而且能够减少训练,使得识别率的计算更加简单。对s(m)进行离散余弦变换,其公式如下:
[0060][0061]
得到了mfcc特征参数,需要对使用一种识别模型来对工程车辆建立数据库,声纹识别系统中,不同的模式匹配最大区别在于模型的表示和测试时音频匹配的方法,常用识
別方法中的概率模型更具有灵活性,似然得分的理论意义更有说服力。我们技术使用的是高斯混合模型

通用背景模型。
[0062]
将工程车辆识别出来了之后,需要通过声源定位来确定工程车辆的位置,这里,我们使用基于到达时间差的定位算法来对其定位。该算法主要原理是利用麦克风传感器收到的声音信号,求取声音信号到达各个接收器的时间延迟,时间延迟即对应三维空间中各个接收器与声源之间的声程差,再利用声程差与定位方程解算方法求解声源位置坐标。基于tdoa的定位算法的主要流程可以分为两个步骤:第一步先估计声信号传播到每个传感器之间的时间差,也就是时延估计;第二步中依靠几何关系来计算声源的坐标,即声源定位。基于tdoa的双步定位技术可以通过图3、图4来进行说明。图3、tdoa估计,图4、基于tdoa的声源定位过程;
[0063]
广义互相关方法是一种传统的时间延迟估计方法。由于来自同一声源的信号存在一定的相关性,通过计算不同麦克风所接收到的信号之间的相关函数,就可以估计出tdoa值。广义互相关函数算法的流程图如图5所示。图5、广义互相关函数算法的流程图。
[0064]
通过gcc求出了tdoa后,需要使用几何定位法来对工程车辆进行定位。该方法运算量小,简单易实现。在完成时延估计步骤后,我们已知的可用于位置解算的条件有:声速v,麦克风阵列坐标(x
i
,y
i
,z
i
),i=1,2,3,4,以及麦克风之间的时间延迟τ
12
,τ
13
,τ
14
。我们需要通过位置解算得出声源位置坐标,即(x
s
,y
s
,z
s
)。以四元麦克风阵列为例,3维空间下声源的位置解算公式如下所示:其中
[0065]
i=1,2,3,4代表声源到达每个麦克风的声程,上式通过迭代法就能够求出工程车辆声源的位置。
[0066]
通过设置的l形板(10),当转动螺纹杆(3)时,螺纹杆(3)带动l形板(10)转动,从而对装置进行固定,方便了对定位装置进行安装和拆卸,提高了安装和拆卸的效率,而设置的u形板(5),减少了l形板(10)在滑动时倾斜的情况发生,从而提高了装置的稳定性。
[0067]
本实施例的三预处理的一侧分别连接有语音输入、待测语音、音频信号。
[0068]
本实施例的dft与mel滤波器组的输入端连接,mel滤波器组与对数能量的输入端连接,对数能量与dct的输入端连接。
[0069]
本实施例的槽道2的内部设置有挡板7,挡板7的一侧安装有连接板8,连接板8的一侧安装有固定杆9,固定杆9与l形板10转动配合,通过设置的固定杆9,便于转动l形板10。
[0070]
本实施例的l形板10的一侧安装有弹簧11,且弹簧11与挡板7相连接。
[0071]
本实施例的螺纹杆3的端部安装有转动板6,通过设置的转动板6,便于转动螺纹杆3。
[0072]
上述实施例可以相互结合。
[0073]
需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施方式能够以除了在这里图示或描述的那些以外的顺序实施。
[0074]
在本实用新型的描述中,需要理解的是,方位词如“前、后、上、下、左、右”、“横向、竖向、垂直、水平”和“顶、底”等所指示的方位或位置关系通常是基于附图所示的方位或位
置关系,仅是为了便于描述本实用新型和简化描述,在未作相反说明的情况下,这些方位词并不指示和暗示所指的装置或元件必须具有特定的方位或者以特定的方位构造和操作,因此不能理解为对本实用新型保护范围的限制;方位词“内、外”是指相对于各部件本身的轮廓的内外。