1.本发明涉及声音识别技术领域,特别涉及一种基于声音识别生理现象的装置。
背景技术:2.目前,咳嗽是呼吸疾病的主要症状,许多疾病便有咳嗽症状,当这些患者可能会借助呼吸机进行治疗,借助呼吸机进行呼吸的患者,偶尔会出现叹气、咳嗽等突发生理现象。在某些呼吸模式(强制呼吸等)下,患者由于上述生理现象呼吸时,呼吸机送给患者的气体与之相撞,导致患者不能充分呼气或者憋气,可能导致患者重度咳嗽或者缺氧,危及患者生命安全。因此,需要呼吸机预判患者上述生理现象并做出延迟送气等操作。
3.目前,在进行声音识别生理现象时,根据呼吸流量和压力等过程量参数判断上述生理现象的方法识别需要基于大数据分析,但是判断不准确并且误判率高。
技术实现要素:4.本发明提供一种基于声音识别生理现象的装置,用以采用声音识别生理现象,处理突发情况。
5.一种基于声音识别生理现象的装置,包括:
6.导管(1):与患者呼吸导管连接,呼吸气体流经导管(1);
7.拾音器(2):用于实时采集接收导管(1)所传送的声音,对所述声音进行放大处理,生成处理音频;
8.声音传感器(3):用于接收所述处理音频,并转换为电信号;导线(4):用于连接音频处理装置和声音传感器;
9.音频处理装置(5):用于对所述电信号进行声音特征分离,确定非语言声音特征,对所述非语音声音特征进行处理,并匹配不同的处理设备。
10.进一步地,所述拾音器包括:
11.声音采集器:用于在目标检测范围内,实时采集接收场景声音;
12.音频还原器:用于将所述场景声音通过选频网络进行声音频率和振幅的还原。
13.进一步地,所述声音传感器包括:
14.振幅测试仪:用于将采集到声音的音频进行振幅检测,通过与生理现象样本音频的振幅进行对比,将所述音频进行第一预分类,确定生理现象音频和普通音频;
15.扫频信号仪:用于将所述音频进行频率检测,通过与生理现象样本音频的频率进行对比,将所述声音进行第二预分类,确定生理现象音频和普通音频;
16.信号处理器:用于将所述第一预分类和第二预分类所确定的生理现象音频和普通音频转化为生理现象电信号,传输给音频处理装置。
17.进一步地,所述音频处理装置包括:
18.去噪器:用于将所述生理现象电信号通过自适应滤波器进行信号提纯,获得纯净的生理现象电信号;
19.端点测试仪:用于对所述生理现象电信号进行信号端点测试,确定所述生理现象电信号的起始位置;
20.分帧器:用于从所述生理现象电信号的起始位置,将所述电信号进行分帧,平均分成各小段的短时平稳信号,将所述短时平稳信号进行分段分析特征参数。
21.进一步地,所述音频处理装置还包括:
22.特征参数提取仪:用于通过感知线性预测系数,提取生理现象的短时平稳信号关键特征参数;
23.生理现象音频存储器:用于存储现实中采集到的生理现象电信号样本和样本的关键特征参数,并存储所述关键特征参数设置的阈值;
24.生理声音信号分类设备:用于对短时平稳信号的关键特征参数进行抽样,根据所述抽样与所述阈值的对比,将短时平稳信号进行分类处理。
25.进一步地,所述生理声音信号分类设备包括:
26.特征参数分析设备:将根据所述对比结果,将所述短时平稳信号归类为咳嗽短时平稳信号、叹气短时平稳信号、清喉音短时平稳信号,根据所述分类匹配不同的处理模式;
27.匹配设备:用于接收并对将归类信号进行匹配对应的信号处理方式。
28.进一步地,所述匹配设备包括:
29.咳嗽电信号处理器:用于将检测到的咳嗽电信号,发出延迟操作初始命令,且根据不同的设备,可设置不同的操作命令;
30.叹气电信号处理器:用于将检测到的叹气电信号,发出减缓操作初始命令,且根据不同的设备,可设置不同的操作命令;
31.清喉音电信号处理器:用于将检测到的清喉音电信号,发出暂停操作初始命令,且根据不同的设备,可设置不同的操作命令。
32.进一步地,所述端点测试仪的步骤为:
33.s1:确定检测过程中起始点的条件,并根据谱熵均值排出空白语音段;
34.s2:检测到生理现象声音端点后,采取后端自适应门限,调整门限值至合适值;
35.s3:根据生理现象声音的特点,确定每一帧的短时能量和平均过零率阈值,并确定生理现象声音端点;
36.s4:计算前20帧的过零率低于过零率阈值的个数,计算前20帧的平均谱熵;
37.s5:判断前20帧的过零率个数和平均谱熵是否达标,若是达标,则端点检测结束,否则,则继续下一次端点检测,转步骤s1。
38.进一步地,所述音频处理装置还包括:
39.非语音声音信号检测仪:用于通过对人体器官或关节发出的声音信号进行分析,确定生理声音信号在频域的分布,根据频域信息,对所处器官或关节进行频谱分析,确定患者的病情。
40.进一步地,所述音频处理装置还包括:
41.信号加重器:在去噪器后,将纯净的电信号的高频部分通过a/d转换进行预加重,压缩所述生理现象声音信号的动态范围,得到高信噪比,用于加强生理现象声音的信号。
42.本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明
书以及附图中所特别指出的结构来实现和获得。
43.下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
44.附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
45.图1为本发明实施例中一种基于声音识别生理现象的装置结构示意图;
46.图2为本发明实施例中一种基于声音识别生理现象的生理现象声音信号幅值变化图;
47.图3为本发明实施例中一种基于声音识别生理现象的端点测试仪的步骤图。;
具体实施方式
48.以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
49.实施例1:
50.本发明实施例提供了一种基于声音识别生理现象的装置,如图1所示,包括:
51.导管(1):与患者呼吸导管连接,呼吸气体流经导管(1);
52.拾音器(2):用于实时采集接收导管(1)所传送的声音,对所述声音进行放大处理,生成处理音频;
53.声音传感器(3):用于接收所述处理音频,并转换为电信号;
54.导线(4):用于连接音频处理装置和声音传感器;
55.音频处理装置(5):用于对所述电信号进行声音特征分离,确定非语言声音特征,对所述非语音声音特征进行处理,并匹配不同的处理设备。
56.上述技术方案的工作原理为:
57.通过导管将现场的声音采集并传送给拾音器,拾音器将现场声音进行振幅和频率的放大,并将处理的音频传输给声音传感器进行电信号的转换,音频处理装置接收电信号,并对音频电信号的特征参数进行提取和端点检测,将生理现象声音进行归类和匹配不同的处理方式。
58.上述技术方案的有益效果为:本发明的针对生理现象声音,发明了一个自动的、针对非固定个体的装置,将生理现象声音从含有大量说话语音和具有相似特性的声音的音频中检测分离出来,并根据生理现象语音的频率和振幅及特性给生理现象声音进行归类,并根据分类匹配所对应的处理设备进行处理,本发明不限于应用于任何机器设上,任何采用声音识别生理现象的装置、算法或者方法均适用于本发明。
59.实施例2:
60.在一个实施例中,所述拾音器包括:
61.声音采集器:用于在目标检测范围内,实时采集接收场景声音;
62.音频还原器:用于将所述场景声音通过选频网络进行声音频率和振幅的还原。
63.上述技术方案的工作原理为:
64.声音接收器通过采集声音的元件将声音通过传到收集在一起,而音频放大器则主
要起将声音的音频放大还原到原声或者是接近原声的状态,它能够将声音采集放大,并且能够起到一定的消除噪音的作用,拾音器能够工作,是因为在拾音器内部所安装的简单高效的选频网络上,频网络可以将不同频率的声音进行选择性的过滤,挑出并且保留人们所需要采集的声音,保存这些需要采集声音的频率,而其他声音的频率则与需要保留声音频率不同,因此,其他杂音进入麦克风之后,经过选频网络之后,就会被过滤掉,而那些人们需要采集的声音则通过选频网络保留,并且通过音频放大装置的还原,保持了最初的声音。
65.上述技术方案的有益效果为:本发明采用了拾音器作为本装置的声音采集设备,拾音器具有高灵敏度,能采集到现场的细微的声音,同时,拾音器是全向性,能够采集整个监控空间的声音,确保采集到的现场的声音全面且清晰。
66.实施例3:
67.在一个实施例中,如图2所示为生理现象声音信号幅值变化图,所述声音传感器包括:
68.振幅测试仪:用于将采集到声音的音频进行振幅检测,通过与生理现象样本音频的振幅进行对比,将所述音频进行第一预分类,确定生理现象音频和普通音频;
69.扫频信号仪:用于将所述音频进行频率检测,通过与生理现象样本音频的频率进行对比,将所述声音进行第二预分类,确定生理现象音频和普通音频;
70.信号处理器:用于将所述第一预分类和第二预分类所确定的生理现象音频和普通音频转化为生理现象电信号,传输给音频处理装置。
71.上述技术方案的工作原理为:
72.振幅测试仪利用线性振动系统,将振动信号用谱分析技术化作许多谐振动的叠加,测量振幅的幅值,进而根据幅值的不停,对声音进行预分类,根据振幅将声音分为生理现象音频和普通音频,通过扫频信号仪,计算每秒内声音信号的脉冲个数,此时我们称闸门时间为1秒。闸门时间也可以大于或小于一秒。闸门时间越长,得到的频率值就越准确,但闸门时间越长则没测一次频率的间隔就越长。信号处理器把一个和振动膜连接的线圈放在磁场间隙中,当有人对着膜片讲话时,线圈就会在磁场中发生振动,并通过切割磁力线而产生音频电流。
73.上述技术方案的有益效果为:本发明通过振动测试仪扫频信号仪对声音进行声音振幅检测和声音频率检测,进而通过振幅和频率将声音分为生理现象声音和普通声音,通过预分类,将生理现象声音从大量声音中剥离出来,并通过信号处理器对生理现象声音和普通声音进行电信号的转换。
74.实施例4:
75.在一个实施例中,所述声音处理装置包括:
76.去噪器:用于将所述生理现象电信号通过自适应滤波器进行信号提纯,获得纯净的生理现象电信号;
77.端点测试仪:用于对所述生理现象电信号进行信号端点测试,确定所述生理现象电信号的起始位置;
78.分帧器:用于从所述生理现象电信号的起始位置,将所述电信号进行分帧,平均分成各小段的短时平稳信号,将所述短时平稳信号进行分段分析特征参数。
79.上述技术方案的工作原理为:
80.去噪器在未知环境中跟踪时变的输入信号,使输入信号达到最优,这样用来构造自适应的噪声消除器,去噪器将带噪信号进行噪声估计,并用原始信号减去噪声估计值达到增强语音;端点测试仪根据对生理现象声音范本的观察、统计和分析,确定了短时能量和平均过零率阈值,并通过确定检测过程中起始点的条件,并根据谱熵均值排出空白语音段,检测到生理现象声音端点后,采取后端自适应门限,调整门限值至合适值,根据生理现象声音的特点,确定每一帧的短时能量和平均过零率阈值,并确定生理现象声音端点;计算前20帧的过零率低于过零率阈值的个数,计算前20帧的平均谱熵,判断前20帧的过零率个数和平均谱熵是否达标,若是达标,则端点检测结束,否则,则继续下一次端点检测;分帧器将生理现象电信号分成均等的小段的短时平稳技术,分帧是分成连续的帧,采用信号交叠技术使帧与帧之间平滑过渡,对生理现象电信号的序列进行分帧通过去一段取样值乘以1/2帧长,帧长越长,信号越平滑,帧长越小,对信号几乎没有平滑作用,所以取帧的1/2长度。
81.上述技术方案的有益效果为:本发明通过去噪器对生理现象电信号去除噪音干扰,这些噪音干扰在对生理现象声音识别中有着消极的作用,因此,从带噪信号张红提取纯净的生理现象声音,改善声音质量,是识别生理现象声音的一个重要环节;端点测试仪对生理现象声音进行端点测试,准确地找到生理现象声音的其实位置,排除连续语音中的静音或语音等干扰信息,提高了后续过程中的识别率;分帧器将生理现象电信号平均分成各小段的短时平稳信号,采用短时分析技术对生理现象电信号进行分析,分帧是将电信号分成连续的帧,使帧之间可以平滑过渡。
82.实施例5:
83.在一个实施例中,所述声音处理装置还包括:
84.特征参数提取仪:用于通过感知线性预测,提取生理现象的短时平稳信号关键特征参数;
85.生理现象音频存储器:用于存储现实中采集到的生理现象电信号样本和样本的关键特征参数,并存储所述关键特征参数设置的阈值;
86.生理声音信号分类设备:用于对短时平稳信号的关键特征参数进行抽样,根据所述抽样与所述阈值的对比,将短时平稳信号进行分类处理。
87.上述技术方案的工作原理为:
88.线性预测用于对生理现象的关键特征参数进行抽样,组成一个线性预测抽样组合,将实际的生理现象语音信号与线性预测抽样之间进行最小平方误差逼近,当所述最小平方误差达到其中一类阈值时,则对所述生理现象语音信号进行归类;
89.上述技术方案的有益效果为:本发明的特征参数提取仪选取能代表生理现象声音特征的参数,这些参数能有效的代表生理现象声音特征,具有很好的可区分性,不随时间和空间的变化而变化,并且易于从众多声音中提取出来;生理现象音频存储器存储手机的生理现象声音范本,方便调出阈值;生理声音信号分类设备与短时平稳信号的抽样进行对比,快速对音频进行分类;
90.实施例6:
91.在一个实施例中,所述特征参数分析设备包括:
92.特征参数分析设备:将根据所述对比结果,将所述短时平稳信号归类为咳嗽短时平稳信号、叹气短时平稳信号、清喉音短时平稳信号,根据所述分类匹配不同的处理模式;
93.匹配设备:用于接收并对将归类信号进行匹配对应的信号处理方式。
94.上述技术方案的工作原理为:
95.特征参数分析设备以固定的滑动窗对电信号进行分析,时域的滑动窗处理将信号分频段滤波,将不满足生理现象声音信号特征参数的信号,进行滤除,将根据生理现象声音信号的特征进行详细分类,匹配设备将对应每一个分类设置初始处理操作,也可根据不同的连接设备设置不同的操作命令和算法。
96.上述技术方案的有益效果为:本发明的特征参数分析设备根据所述抽样与阈值的对比结果,对短时平稳信号进行更细致的分类,并且对分类好的生理现象语音进行匹配对应的信号处理方式,并且,所述处理方式根据不同设备的需要,可进行处理方式的更改。
97.实施例7:
98.在一个实施例中,所述匹配设备包括:
99.咳嗽电信号处理器:用于将检测到的咳嗽电信号,发出延迟操作初始命令,且根据不同的设备,可设置不同的操作命令;
100.叹气电信号处理器:用于将检测到的叹气电信号,发出减缓操作初始命令,且根据不同的设备,可设置不同的操作命令;
101.清喉音电信号处理器:用于将检测到的清喉音电信号,发出暂停操作初始命令,且根据不同的设备,可设置不同的操作命令。
102.上述技术方案的工作原理为:
103.咳嗽电信号处理器当接收到咳嗽电信号时,发出延迟操作初始命令,且根据不同的设备,可设置不同的操作命令,叹气电信号处理器用于将检测到的叹气电信号,发出减缓操作初始命令,且根据不同的设备,可设置不同的操作命令;清喉音电信号处理器用于将检测到的清喉音电信号,发出暂停操作初始命令,且根据不同的设备,可设置不同的操作命令。
104.上述技术方案的有益效果为:本发明的匹配设备中包括三个主要处理器,且都设置了初始处理操作命令,根据所述处理器的不同算法及所连接的不同设备,设置了不同的操作命令。
105.实施例8:
106.在一个实施例中,如图3所示,所述端点测试仪的步骤为:
107.s1:确定检测过程中起始点的条件,并根据谱熵均值排出空白语音段;
108.s2:检测到生理现象声音端点后,采取后端自适应门限,调整门限值至合适值;
109.s3:根据生理现象声音的特点,确定每一帧的短时能量和平均过零率阈值,并确定生理现象声音端点;
110.s4:计算前20帧的过零率低于过零率阈值的个数,计算前20帧的平均谱熵;
111.s5:判断前20帧的过零率个数和平均谱熵是否达标,若是达标,则端点检测结束,否则,则继续下一次端点检测,转步骤s1。
112.上述技术方案的工作原理为:
113.确定检测过程中起始点的条件,并根据谱熵均值排出空白语音段,检测生理现象声音的起始点,设置初始值liy,先从第1帧开始,逐次比较每帧的平均幅度,m1是平均幅度的第一帧的帧号,但若是后续的平均幅度超过了之前的幅度,则原来的m1不作为初始起点,
改记下一个平均幅度超过前一个的作为m1,且mi的值要大于初始值,依次类推,在找到第一个平均幅度最大值的帧时停止比较,检测生理现象声音结束点m2,从初始点m1逐帧向后搜索,若有连续20帧片平均幅度低于初始值liy,且其中有5帧以上的过零率低于均值nhy,则取第一帧,作为生理现象声音结束点m2,最后根据谱熵均值排出空白语音段;
114.检测到生理现象声音端点后,采取后端自适应门限,调整门限值至合适值,最初的门限值为rfrv=min[ijn,p]
[0115]
检测到端点后,采用结束点m2的后5帧的值更新门限值,根据以下公式更新门限值:
[0116]
liy=m
×
nhy+(2
‑
m)
×
nhy
[0117]
nhy=2.5m
[0118]
ieg=m
×
ieg
·
1+(2
‑
m)
×
ieg
·2[0119]
其中,m是权值,赋值为0.9,liy为初始值,nhy为幅值均值,ieg是当前计算的门限值,ieg
·
1和ieg
·
2是前一次所用的门限值;生理现象语音的产生不可控,将最初的门限值取为rfrv,以尽快检测到第一声咳嗽,而后采用自适应门限值,会逐渐调整门限值至合适值;
[0120]
上述技术方案的有益效果为:本发明在端点测试仪第一个步骤就把空白语音段剔除,对留下的音频进行设置门限值,通过完整的步骤进行端点检测,防止出现遗漏的音频和空白音频的出现。
[0121]
实施例9:
[0122]
在一个实施例中,所述声音处理装置还包括:
[0123]
非语音声音信号检测仪:用于通过对人体器官或关节发出的声音信号进行分析,确定生理声音信号在频域的分布,根据频域信息,对所处器官或关节进行频谱分析,确定患者的病情。
[0124]
上述技术方案的工作原理为:
[0125]
通过对生理信号进行信号检测,根据分析生理信号的频谱图,判断病人的生理状况,同时也可根据采集的关节音诊断关节炎,用于通过对人体器官或关节发出的声音信号进行分析,确定生理信号在频域的分布,根据频域信息,对所处器官或关节进行频谱分析,确定患者的病情。
[0126]
上述技术方案的有益效果为:人体的很多器官无时无刻不在跳动,这些声音非常微弱,但是却反应了人体器官的病症,以往,医生智能依靠听诊器去听这些声音并根据经验进行判断,这让判断很不准确,但是生理信号在频域内,根据频谱分析,可以判断人体的生理状况,从而使病人得到更精确的治疗。
[0127]
实施例10:
[0128]
在一个实施例中,所述声音处理装置还包括:
[0129]
信号加重器:在去噪器后,将纯净的电信号的高频部分通过a/d转换进行预加重,压缩所述生理现象声音信号的动态范围,得到高信噪比,用于加强生理现象声音的信号。
[0130]
上述技术方案的工作原理为:
[0131]
同语音信号一样,生理现象声音的高频部分会受到门激励和口鼻辐射的影响而减弱,通过a/d变换,这样不仅能过进行预加重,还可以压缩信号的动态范围,从而提高信噪
比,加强生理现象声音的信号。
[0132]
上述技术方案的有益效果为:电信号通语音信号一样,会受到门激励和口鼻辐射的影响,高频部分会发生衰减,因此需要对纯净的电信号的高频部分通过a/d转换进行预加重,这样在分析信号,可使电信号还原到原来的特性。
[0133]
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。