1.本实用新型属于音频采集技术领域,具体是一种音频采集与识别装置。
背景技术:2.新冠疫情爆发针对无接触医护请求需求明确。目前市场上医护呼叫普遍是按键触发,极易交互感染。求救按钮只能安置特定区域,无法覆盖整个可活动其它区域。医疗按键求救虽可以实现医护与病人联动,但按键方式在特殊时期或针对不方便行动的病人存在一定难度。尤其在流行病传染高发期尽量避免多方接触,以及无法独立完成按键求救的病人,公共区域无求助按钮和突发情况下求救人员等,都造成医疗求救困难。
技术实现要素:3.本实用新型的目的在于克服现有技术的缺陷,提供一种音频采集与识别装置,通过对音频进行采集、提取和识别,从语音中提取请求信息实现求救帮助,获得安全、可靠和及时信息沟通。音频监听不受位置限制,呼叫求救词可以及时联动医护人员。
4.为实现上述目的,本实用新型采用了如下技术方案:
5.一种音频采集与识别装置,包括底壳,所述底壳内设有主板,所述主板上方设有音网,所述主板上设置至少一个麦克风、前置放大器、语音处理单元、语音输出单元、网络传输单元,所述麦克风与所述前置放大器连接,所述前置放大器通过ad接口与所述语音处理单元连接,所述语音处理单元通过da接口与所述语音输出单元连接,所述语音处理单元通过所述网络传输单元与服务器连接;所述语音处理单元设有自适应滤波形成模块、自动增益控制模块、ans模块、语音识别模块和语音编码模块。
6.进一步的,还包括开关量报警接口,所述语音处理单元通过所述开关量报警接口与报警显示设备连接。
7.进一步的,所述语音输出单元设有音频流输出接口,所述音频流输出接口与网络摄像装置连接。
8.进一步的,所述音网的内侧设有防尘网。
9.进一步的,还包括安装支架,所述安装支架通过旋扣与所述底壳连接。
10.进一步的,所述音网的中心设有状态指示灯。
11.进一步的,所述底壳上设有出线口。
12.本实用新型与现有技术相比,具有如下优点:
13.本实用新型通过对音频进行采集、提取和关键词识别,从语音中提取请求信息实现求救帮助,获得安全、可靠和及时信息沟通。音频监听不受位置限制,呼叫求救词可以及时联动医护人员,在公共区域无按钮区域和突发情况下,第一时间发出求救信息。
附图说明
14.图1是本实用新型的结构示意图;
15.图2是本实用新型中主板的电路结构框图。
16.附图标记:1、底壳;2、主板;3、音网;4、麦克风;5、前置放大器;6、语音处理单元;7、语音输出单元;8、网络传输单元;9、开关量报警接口;10、安装支架;11、状态指示灯;12、出线口。
具体实施方式
17.以下结合附图1
‑
2,进一步说明本实用新型的一种音频采集与识别装置的具体实施方式。本实用新型的一种音频采集与识别装置不限于以下实施例的描述。
18.实施例一:
19.参见图1、图2,一种音频采集与识别装置,包括底壳1,底壳内设有主板2,主板上方设有音网3,音网上具有高密度音孔,音网3的内侧设有防尘网,声音自由场通过音网。
20.主板上设置两个或两个以上麦克风4、前置放大器5、语音处理单元6、语音输出单元7、网络传输单元8,麦克风4与前置放大器5连接,前置放大器5通过ad接口与语音处理单元6连接,语音处理单元6通过da接口与语音输出单元7连接,语音处理单元6通过网络传输单元8与服务器连接;语音处理单元6设有自适应滤波形成模块、自动增益控制模块、ans模块、语音识别模块和语音编码模块。
21.在本实施例中,麦克风4作为音频采集元件,采集到的声音通过前置放大器5音频处理,使拾音拾取远场声音,从而扩大监听范围。声音通过ad接口转化数字音频信号,数字音频信号经自适应滤波形成模块处理增强语音源端信噪比,自动增益控制模块(agc模块)处理声音大小,ans模块预处理提取清晰语音,语音识别模块对关键词识别提取识别结果,语音编码模块对语音数据和识别结果信息封包发送下一单元处理。经语音编码为aac编码或pcm编码,通过网络传输单元8发送给服务器,服务器显示并下发对讲模式,最终实现及时呼叫和应答。ans模块中预设降噪算法。语音信息封装包含识别结果信息和对讲请求,一旦服务器受理请求,音频采集与识别装置与服务器建立语音链路,实现实时对讲。
22.在本实施例中,语音处理单元6采用mimxrt1051芯片,内核为arm cortex
‑
m7,实现音频流处理和定制化离线关键词识别等。自适应滤波形成模块的技术内容参见dinei florencio and cha zhang,“enhanced mvdr beamforming for arrays of directional microphones”。agc模块的技术内容可以参见专利gb2115629a公开的内容。ans模块的技术内容参见《实时语音处理实践指南》中公开的内容。语音识别模块的技术内容可以参见专利202010535453.x,一种基于深度神经网络的哭声检测方法和系统中公开的内容。
23.da接口转化模拟音频信号和高保真音频数据分别发送到扬声器和音频链路接口。
24.网络传输单元8可以是有线网络设备,也可以是无线网络设备,如wifi或td
‑
lte。
25.参见图2,在本实施例中,还包括开关量报警接口9,语音处理单元6通过开关量报警接口9与报警显示设备连接。识别结果以逻辑电平处理,通过开关量报警接口发送到报警显示设备。开关量报警接口可扩展报警铃声,不限于铃声形式。
26.在本实施例中,语音输出单元7设有音频流输出接口,音频流输出接口与网络摄像装置连接,实现音视频一体化保存,保存完整信息还原始发地信息。
27.参见图1,在本实施例中,音频采集与识别装置安装在待监控区域,通过电源供电或采用poe(以太网供电)提供电源。音网3的中心设有状态指示灯11。
28.当需求人在监控范围内的任意位置说出请求词语,音频采集与识别装置实时监听分解语音音素,实时提取特征识别,当与识别数据匹配时,输出识别结果信息。
29.参见图1,底壳后面连接安装支架10,安装支架通过旋扣与底壳1连接。旋扣使音频采集与识别装置与安装支架的安装和拆卸更加方便,不需要借助任何工具。
30.参见图1,底壳1上设有出线口12。通过出线口引出尾线方便对接设备。
31.语音处理单元6对语音的处理分析采用离线方式,不受限于网络。音频采集与识别装置的部署位置无限制。
32.实施例二:
33.参见图1,本实施例的一种音频采集与识别装置,包括底壳1,底壳内设有主板2,主板上方设有音网3,音网上具有高密度音孔,音网3的内侧设有防尘网,声音自由场通过音网。
34.主板2上设置一个麦克风、前置放大器、语音处理单元、语音输出单元、网络传输单元,麦克风与前置放大器连接,前置放大器通过ad接口与语音处理单元连接,语音处理单元通过da接口与语音输出单元连接,语音处理单元通过网络传输单元与服务器连接;语音处理单元设有自适应滤波形成模块、自动增益控制模块、ans模块、语音识别模块和语音编码模块。
35.本实施例与实施例一相同的技术内容,参见实施例一,此处不作重复描述。
36.以上内容是结合具体的优选实施方式对本实用新型所作的进一步详细说明,不能认定本实用新型的具体实施只局限于这些说明。对于本实用新型所属技术领域的普通技术人员来说,在不脱离本实用新型构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本实用新型的保护范围。