首页 > 乐器声学 专利正文
一种语音控制物业管理的方法、系统、设备及介质与流程

时间:2022-02-17 阅读: 作者:专利查询

一种语音控制物业管理的方法、系统、设备及介质与流程

1.本发明涉及语音控制技术领域,具体而言,涉及一种语音控制物业管理的方法、系统、设备及介质。


背景技术:

2.由于人民生活水平和生活质量的不断提高,当前居住人员对居住的安全要求也水涨船高,居住安全已然成为当前物业管理的首要任务。在这种趋势下,智能小区的物业管理重要性日益凸显。其中对于物业管理中的操作例如每户的燃气开关、水电开关等等,现有技术需要对各种开关进行寻找,由于开关数量较多种类繁杂,管理起来费时费力,故而需要一种可以直接进行语音控制物业管理方法。


技术实现要素:

3.本发明的目的在于提供一种语音控制物业管理的方法,其能够采用声音控制的方法,迅速地使对应的控制设备在接收到语音信息后进行对应的控制,节约了寻找的时间,由此提高了便捷性。
4.本发明的实施例是这样实现的:
5.第一方面,本技术实施例提供一种语音控制物业管理的方法,其包括利用客户端设备采集多个用于控制物业管理的原始语音信息,将任一所述原始语音信息利用声电转换器转换成语音脉冲序列进行传输;对任一所述语音脉冲序列滤除干扰信号后,提取所述语音脉冲序列中的语音特征矢量,并将提取的所述语音特征矢量量化成标准语音特征矢量;在所述客户端设备上建立本地隐马尔可夫模型,在后台终端设置终端隐马尔可夫模型;当所述客户端设备与所述后台终端无互联网连接时,利用所述本地隐马尔可夫模型对多次提取的所述标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;当客户端设备与后台终端有互联网连接时,利用所述终端隐马尔可夫模型对多次提取的所述标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;预设语音模板库,在所述语音模板库内储存关联控制物业管理相关操作的对比语音矢量;将所述最佳标准语音特征矢量与所述对比语音矢量进行比较,若所述最佳标准语音特征矢量与任一对比语音矢量相匹配,向所述对比语音矢量对应的控制设备发送启动信号;反之则不发送启动信号。
6.基于第一方面,在本发明的一些实施例中,提取所述语音脉冲序列中的语音特征矢量的步骤包括:对所述语音脉冲序列的每一帧提取,将每一帧语音脉冲序列进行傅里叶变换得到语音频谱,根据所述语音频谱进行三角滤波转换得到梅尔频率倒谱,将得到的所述梅尔频率倒谱保存为语音特征矢量。
7.基于第一方面,在本发明的一些实施例中,将所述最佳标准语音特征矢量与所述对比语音矢量进行比较的步骤包括:利用动态时间规整算法分别计算所述标准语音特征矢量和对比特征矢量每一帧对应的欧式距离,若相邻两帧对应的欧式距离在预设范围内,则判定为标准语音特征矢量和对比特征矢量匹配,反之则不匹配。
8.基于第一方面,在本发明的一些实施例中,所述语音模板库中多个对比特征矢量对应一个控制物业管理的控制设备。
9.基于第一方面,在本发明的一些实施例中,还包括所述后台终端利用互联网将所述客户端设备的提取的所述标准语音特征矢量保存至储存单元,将其中与所述对比语音矢量适配的标准语音特征矢量作为新的对比语音矢量保存至所述语音模板库。
10.基于第一方面,在本发明的一些实施例中,还包括所述后台终端通过互联网对所述客户端设备的语音模板库进行实时更新。
11.基于第一方面,在本发明的一些实施例中,反之则不发送启动信号的步骤之后还包括:利用播放器播放用于提示未能识别的预设语音,并重新采集语音信息,当在预设时间内没有再次采集到语音信息,停止工作。
12.第二方面,本技术实施例提供一种语音控制物业管理的系统,其包括采集模块,用于利用客户端设备采集多个用于控制物业管理的原始语音信息,将任一所述原始语音信息利用声电转换器转换成语音脉冲序列进行传输;
13.转换模块,用于对任一所述语音脉冲序列滤除干扰信号后,提取所述语音脉冲序列中的语音特征矢量,并将提取的所述语音特征矢量量化成标准语音特征矢量;
14.筛选识别模块,用于在所述客户端设备上建立本地隐马尔可夫模型,在后台终端设置终端隐马尔可夫模型;当所述客户端设备与所述后台终端无互联网连接时,利用所述本地隐马尔可夫模型对多次提取的所述标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;当客户端设备与后台终端有互联网连接时,利用所述终端隐马尔可夫模型对多次提取的所述标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;
15.模型预设模块,用于预设语音模板库,在所述语音模板库内储存关联控制物业管理相关操作的对比语音矢量;
16.判断模块,用于将所述最佳标准语音特征矢量与所述对比语音矢量进行比较,若所述最佳标准语音特征矢量与任一对比语音矢量相匹配,向所述对比语音矢量对应的控制设备发送启动信号;反之则不发送启动信号。
17.第三方面,本技术实施例提供一种电子设备,其包括至少一个处理器、至少一个存储器和数据总线;其中:所述处理器与所述存储器通过所述数据总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令以执行一种语音控制物业管理的方法。
18.第四方面,本技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现一种语音控制物业管理的方法。
19.相对于现有技术,本发明的实施例至少具有如下优点或有益效果:
20.一种语音控制物业管理的方法,鉴于物业管理中由于用户数量较多,需要物业管理的开关种类数量庞大,由此发明采用声音控制的方法,可以迅速地使对应的开关在接收到语音信息后进行对应的控制,由此提高了便捷性。对于声音信息的采集,采用现有技术中较为成熟的方式,即利用录音机或录音笔进行声音录制,而后通过声电转换器换成语音脉冲序列,利用电信号的方式进行传输。由于在对声音信号进行录制的过程中,会伴有电流杂音或其他干扰,本发明采用陷波滤波器,并且鉴于人耳最敏感声音频率范围是1khz

3khz之间的声音,对小于1khz,大于3khz频率声音对应的信号进行滤除。同时对滤除后的语音脉冲
序列提取语音特征矢量,再量化成标准语音特征矢量。建立隐马尔可夫模型,主要用于对标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;而在客户端设备和后台终端上均设置隐马尔可夫模型,主要是为了避免断网时客户端设备无法与后台终端进行实时通讯,导致无法使用。由此在客户端设备上设置本地隐马尔可夫模型对多次提取的标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;在后台终端上设置终端隐马尔可夫模型对多次提取的标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量。在客户端设置以及后台终端接收到标准语音特征矢量,需要对其进行判定,而判定的操作需要进行对比,由此设置语音模板库,并在其内设置关联控制物业管理相关操作的对比语音矢量。当物业管理的控制设备接收到语音信息后,例如使用者发出“打开104房间燃气开关”,控制设备在进行上述语音匹配确认后,打开104房间燃气开关,由此完成语音控制物业管理,提高了便捷性。
附图说明
21.为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
22.图1为本发明中一种语音控制物业管理的方法的流程图;
23.图2为本发明中一种语音控制物业管理的方法的另一种流程图;
24.图3为本发明中一种语音控制物业管理的方法的再一种流程图;
25.图4为本发明中一种语音控制物业管理的系统的结构示意流程图;
26.图5为本发明中一种电子设备的结构示意流程图。
27.图标:1、采集模块;2、转换模块;3、筛选识别模块;4、模型预设模块;5、判断模块;6、处理器;7、存储器;8、数据总线。
具体实施方式
28.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。
29.因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
30.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
31.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存
在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
32.在本技术的描述中,需要说明的是,术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该申请产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本技术的限制。
33.在本技术的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本技术中的具体含义。
34.下面结合附图,对本技术的一些实施方式作详细说明。在不冲突的情况下,下述的各个实施例及实施例中的各个特征可以相互组合。
35.实施例1
36.请参阅图1,为本技术实施例提供的一种语音控制物业管理的方法,鉴于物业管理中由于用户数量较多,需要物业管理的开关种类数量庞大,由此发明采用声音控制的方法,可以迅速地使对应的开关在接收到语音信息后进行对应的控制,由此提高了便捷性。
37.s101:利用客户端设备采集多个用于控制物业管理的原始语音信息,将任一原始语音信息利用声电转换器转换成语音脉冲序列进行传输;
38.对于声音信息的采集,采用现有技术中较为成熟的方式,即利用录音机或录音笔进行声音录制,而后通过声电转换器换成语音脉冲序列,利用电信号的方式进行传输。
39.s102:对任一语音脉冲序列滤除干扰信号后,提取语音脉冲序列中的语音特征矢量,并将提取的语音特征矢量量化成标准语音特征矢量;
40.由于在对声音信号进行录制的过程中,会伴有电流杂音或其他干扰,本发明采用陷波滤波器,并且鉴于人耳最敏感声音频率范围是1khz至3khz之间的声音,对小于1khz,大于3khz频率声音对应的信号进行滤除。同时对滤除后的语音脉冲序列提取语音特征矢量,再量化成标准语音特征矢量。
41.s103:在客户端设备上建立本地隐马尔可夫模型,在后台终端设置终端隐马尔可夫模型;当客户端设备与后台终端无互联网连接时,利用本地隐马尔可夫模型对多次提取的标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;当客户端设备与后台终端有互联网连接时,利用终端隐马尔可夫模型对多次提取的标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;
42.建立隐马尔可夫模型,主要用于对标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;而在客户端设备和后台终端上均设置隐马尔可夫模型,主要是为了避免断网时客户端设备无法与后台终端进行实时通讯,导致无法使用。由此在客户端设备上设置本地隐马尔可夫模型对多次提取的标准语音特征矢量进行概率统计,得出最佳标准语音
特征矢量;在后台终端上设置终端隐马尔可夫模型对多次提取的标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量。
43.s104:预设语音模板库,在语音模板库内储存关联控制物业管理相关操作的对比语音矢量;
44.在客户端设置以及后台终端接收到标准语音特征矢量,需要对其进行判定,而判定的操作需要进行对比,由此设置语音模板库,并在其内设置关联控制物业管理相关操作的对比语音矢量。
45.s105:将最佳标准语音特征矢量与对比语音矢量进行比较,若最佳标准语音特征矢量与任一对比语音矢量相匹配,向对比语音矢量对应的控制设备发送启动信号;反之则不发送启动信号。
46.当物业管理的控制设备接收到语音信息后,例如使用者发出“打开104房间燃气开关”,控制设备在进行上述语音匹配确认后,打开104房间燃气开关,由此完成语音控制物业管理,提高了便捷性。
47.在本发明的一些实施例中,提取语音脉冲序列中的语音特征矢量的步骤包括:
48.对语音脉冲序列的每一帧提取,将每一帧语音脉冲序列进行傅里叶变换得到语音频谱,根据语音频谱进行三角滤波转换得到梅尔频率倒谱,将得到的梅尔频率倒谱保存为语音特征矢量。
49.在本发明的一些实施例中,对于语音脉冲序列中特征进行提取,其无法直接在脉冲序列信号上进行识别,由此将语音脉冲序列进行可视化操作,即利用傅里叶变换将脉冲序列信号的每一帧转换为语音频谱,在将语音频谱上关于语音脉冲序列对应的矢量利用三角滤波转换得到梅尔频率倒谱,由于便可得到最终的语音特征矢量。
50.在本发明的一些实施例中,将最佳标准语音特征矢量与对比语音矢量进行比较的步骤包括:
51.利用动态时间规整算法分别计算标准语音特征矢量和对比特征矢量每一帧对应的欧式距离,若相邻两帧对应的欧式距离在预设范围内,则判定为标准语音特征矢量和对比特征矢量匹配,反之则不匹配。
52.在本发明的一些实施例中,在比对最佳标准语音特征矢量与对比语音矢量过程中,通常采用比对最佳标准语音特征矢量和对比语音矢量形状的相似度,但由于计算机无法像人一样可以直观的用肉眼进行比对,由此采用动态时间规整算法计算每一帧的欧式距离,其中相邻两帧欧式距离在差值在

2mm至3mm的区间内,判定标准语音特征矢量和对比特征矢量匹配,反之则不匹配。
53.在本发明的一些实施例中,语音模板库中多个对比特征矢量对应一个控制物业管理的控制设备。
54.在本发明的一些实施例中,鉴于在现实生活中,除了普通话以为还有多种方言,为了尽可能地进行适配,本实施将多种方言作为对比特征矢量保存至语音模板库中,并将同一语意的对比特征矢量关联同一个控制物业管理的控制设备,由此提高了适配性。
55.请参阅图2,在本发明的一些实施例中,s106:还包括后台终端利用互联网将客户端设备的提取的标准语音特征矢量保存至储存单元,将其中与对比语音矢量适配的标准语音特征矢量作为新的对比语音矢量保存至语音模板库。
56.在本发明的一些实施例中,由于不同的人说话的声音有差别,为了尽可能的避免匹配失误,对于与后台终端连接的客户端设备的所有使用者每一次的标准语音特征矢量进行保存,并利用后台终端将作为新的对比语音矢量,从而使得匹配更为精确。
57.请参阅图3,在本发明的一些实施例中,s107:还包括后台终端通过互联网对客户端设备的语音模板库进行实时更新。
58.在本发明的一些实施例中,为了离线情况下进一步提高匹配的精确性,利用互联网将后台终端中新的对比语音矢量同步至客户端设备中,实时更新语音模板库。
59.在本发明的一些实施例中,反之则不发送启动信号的步骤之后还包括:利用播放器播放用于提示未能识别的预设语音,并重新采集语音信息,当在预设时间内没有再次采集到语音信息,停止工作。
60.在本发明的一些实施例中,在物业管理人员对控制设备进行操作时,如果未能成功启动控制设备,应当进行实时提醒,具体实施方式为利用播放器播放用于提示未能识别的预设语音,例如预设语音为:“无法识别您的命令,请重复命令”等,同时重新采集语音信息;而在5分钟内没有再次采集到语音信息,即判断该无命令下达,停止工作。
61.实施例2
62.请参阅图4,为本技术实施例提供的一种语音控制物业管理的系统,包括
63.采集模块1,用于利用客户端设备采集多个用于控制物业管理的原始语音信息,将任一原始语音信息利用声电转换器转换成语音脉冲序列进行传输;
64.转换模块2,用于对任一语音脉冲序列滤除干扰信号后,提取语音脉冲序列中的语音特征矢量,并将提取的语音特征矢量量化成标准语音特征矢量;
65.筛选识别模块3,用于在客户端设备上建立本地隐马尔可夫模型,在后台终端设置终端隐马尔可夫模型;当客户端设备与后台终端无互联网连接时,利用本地隐马尔可夫模型对多次提取的标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;当客户端设备与后台终端有互联网连接时,利用终端隐马尔可夫模型对多次提取的标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;
66.模型预设模块4,用于预设语音模板库,在语音模板库内储存关联控制物业管理相关操作的对比语音矢量;
67.判断模块5,用于将最佳标准语音特征矢量与对比语音矢量进行比较,若最佳标准语音特征矢量与任一对比语音矢量相匹配,向对比语音矢量对应的控制设备发送启动信号;反之则不发送启动信号。
68.实施例3
69.请参阅图5,为本技术实施例提供的一种电子设备,包括至少一个处理器6、至少一个存储器7和数据总线8;其中:处理器6与存储器7通过数据总线8完成相互间的通信;存储器7存储有可被处理器6执行的程序指令,处理器6调用程序指令以执行一种语音控制物业管理的方法。例如实现:
70.利用客户端设备采集多个用于控制物业管理的原始语音信息,将任一所述原始语音信息利用声电转换器转换成语音脉冲序列进行传输;对任一所述语音脉冲序列滤除干扰信号后,提取所述语音脉冲序列中的语音特征矢量,并将提取的所述语音特征矢量量化成标准语音特征矢量;在所述客户端设备上建立本地隐马尔可夫模型,在后台终端设置终端
隐马尔可夫模型;当所述客户端设备与所述后台终端无互联网连接时,利用所述本地隐马尔可夫模型对多次提取的所述标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;当客户端设备与后台终端有互联网连接时,利用所述终端隐马尔可夫模型对多次提取的所述标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;预设语音模板库,在所述语音模板库内储存关联控制物业管理相关操作的对比语音矢量;将所述最佳标准语音特征矢量与所述对比语音矢量进行比较,若所述最佳标准语音特征矢量与任一对比语音矢量相匹配,向所述对比语音矢量对应的控制设备发送启动信号;反之则不发送启动信号。
71.其中,存储器7可以是但不限于,随机存取存储器7(random access memory,ram),只读存储器(read only memory,rom),可编程只读存储器(programmable read

only memory,prom),可擦除只读存储器(erasable programmable read

only memory,eprom),电可擦除只读存储器(electric erasable programmable read

only memory,eeprom)等。
72.处理器6可以是一种集成电路芯片,具有信号处理能力。该处理器6可以是通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)等;还可以是数字信号处理器(digital signal processing,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
73.实施例4
74.为本技术实施例提供的一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器6执行时实现一种语音控制物业管理的方法。例如实现:
75.利用客户端设备采集多个用于控制物业管理的原始语音信息,将任一所述原始语音信息利用声电转换器转换成语音脉冲序列进行传输;对任一所述语音脉冲序列滤除干扰信号后,提取所述语音脉冲序列中的语音特征矢量,并将提取的所述语音特征矢量量化成标准语音特征矢量;在所述客户端设备上建立本地隐马尔可夫模型,在后台终端设置终端隐马尔可夫模型;当所述客户端设备与所述后台终端无互联网连接时,利用所述本地隐马尔可夫模型对多次提取的所述标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;当客户端设备与后台终端有互联网连接时,利用所述终端隐马尔可夫模型对多次提取的所述标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;预设语音模板库,在所述语音模板库内储存关联控制物业管理相关操作的对比语音矢量;将所述最佳标准语音特征矢量与所述对比语音矢量进行比较,若所述最佳标准语音特征矢量与任一对比语音矢量相匹配,向所述对比语音矢量对应的控制设备发送启动信号;反之则不发送启动信号。
76.在本技术所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本技术的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个
方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
77.另外,在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
78.所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read

only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
79.以上所述仅为本技术的优选实施例而已,并不用于限制本技术,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
80.对于本领域技术人员而言,显然本技术不限于上述示范性实施例的细节,而且在不背离本技术的精神或基本特征的情况下,能够以其它的具体形式实现本技术。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本技术的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本技术内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。