首页 > 乐器声学 专利正文
声波识别方法、系统、机器人及存储介质与流程

时间:2022-02-06 阅读: 作者:专利查询

声波识别方法、系统、机器人及存储介质与流程

1.本技术涉及声波识别技术领域,特别涉及一种声波识别方法、系统及存储介质。


背景技术:

2.随着声波识别技术的发展,设备与移动终端之间能够以声波为载体进行信息(运行状态、工作时长、电压、电流等)的传送。例如,设备将需要上报的有效信息通过蜂鸣器载波,发出特制的声音,移动终端通过自带的麦克风采集该声音,再由移动终端内部处理器对该音频数据进行处理,最终提取出有效数据,得到设备上报的有效信息。然而,传统的识别算法是基于傅里叶算法以及加窗算法进行运算,需要高频率的浮点运算,算法容量大,运行效率低,对硬件性能要求高,无法适配硬件性能较低的移动终端。如果在硬件性能一般的移动终端进行运算,会有5秒或以上的延时,造成较差的用户体验。


技术实现要素:

3.本技术提出一种声波识别方法、系统及存储介质,有效解决传统识别算法运行效率低、对硬件性能要求高以及无法适配硬件性能较低的移动终端的问题。
4.根据本技术的实施例,本技术的第一方面,提出了一种声波识别方法,包括:
5.提取音频数据中音频波形的多段基本波形;其中,每段基本波形对应一组特征数据,每组特征数据包括波形的时间信息、上升幅度和下降幅度;
6.将每段基本波形分割成多段单位波形;
7.根据特征数据加权重做浮点运算,依次计算每段单位波形为第一波形和第二波形的可能值,并记录每段单位波形的位置;其中,第一波形为包含第一特征数据的载波波形,第二波形为包含第二特征数据的载波波形,第一特征数据和第二特征数据均包括波形的时间信息、上升幅度和下降幅度;
8.获取单位波形为第一波形和第二波形的最大可能值,并将最大可能值对应的波形作为所述单位波形;
9.依次确定多段基本波形中第一波形和第二波形的位置和顺序;
10.根据第一波形和第二波形的位置和顺序,解析出音频波形中的信息。
11.根据本技术的一些实施例,还包括:
12.判断单位波形为第一波形与第二波形的可能值的差值是否大于预设阈值;
13.若单位波形为第一波形与第二波形的可能值的差值大于预设阈值,则确定单位波形为最大可能值对应的波形。
14.根据本技术的一些实施例,还包括:
15.判断最大可能值是否大于或等于可信值;
16.若最大可能值大于或等于可信值,则将最大可能值对应的波形作为单位波形。
17.根据本技术的一些实施例,还包括:
18.若最大可能值小于可信值,则聚焦该段单位波形,根据特征数据重新加权做浮点
运算,分别计算第一波线和第二波形的可能值;其中,特征数据还包括波形的波峰值、波谷值、平均值和低位分割线;
19.返回执行判断最大可能值是否大于或等于可信值。
20.根据本技术的一些实施例,还包括:
21.若最大可能值小于可信值,则舍弃所述单位波形;
22.计算下一段单位波形为第一波形和第二波形的可能值,并记录所述单位波形的位置;
23.返回执行获取单位波形为第一波形和第二波形的最大可能值,并将最大可能值对应的波形作为单位波形。
24.根据本技术的一些实施例,还包括:
25.验证最大可能值对应的波形是否符合预设条件;其中,预设条件包括第一特征数据和第二特征数据,第一特征数据和第二特征数据还包括波形的波峰值、波谷值、平均值和低位分割线;
26.若是,则将最大可能值对应的波形作为该段单位波形;
27.若否,则舍弃该段单位波形,返回执行计算下一段单位波形为第一波形和第二波形的可能值,并记录该段单位波形的位置。
28.根据本技术的一些实施例,还包括:
29.若单位波形为第一波形和第二波形的可能值的差值小于预设阈值,则根据波形的特征数据加权重做浮点运算,分别计算所述单位波形为第一波形和第二波形的可能值;其中特征数据还包括波形的波峰值、波谷值、平均值和低位分割线;
30.返回执行判断单位波形为第一波形和第二波形的可能值的差值是否大于预设阈值。
31.根据本技术的一些实施例,根据第一波形和第二波形的位置和顺序,解析出音频波形中的信息,包括:
32.将第一波形和第二波形的位置和顺序进行解析;
33.将解析后的数据进行crc校验;
34.若校验成功,则识别成功,并输出有效数据;
35.若校验失败,则检测识别次数是否大于预设次数;
36.若检验次数大于或等于预设次数,则识别失败,并输出错误代码;
37.若校验次数小于预设次数,则检验次数加一,并返回执行依次计算单位波形为第一波形和第二波形的可能值,并记录该段单位波形的位置。
38.本技术的第二方面,提出一种声波识别系统,包括:至少一个存储器、至少一个处理器及至少一个程序指令,程序指令是指存储在存储器上并可在处理器上运行,处理器用于执行本技术第一方面提出的声波识别方法。
39.本技术的第三方面,还提出了一种存储介质,存储介质上存储有程序指令,程序指令用于执行本技术第一方面提出的声波识别方法。
40.本技术具有以下有益效果:通过提取音频波形中的多段基本波形,再将基本波形分割成多段单位波形,再通过计算将单位波形识别为第一波形或第二波形,而第一波形和第二波形均为载有信息的载波波形,根据确定的多段基本波形中第一波形和第二波形的位
置和顺序,能够解析出音频波形中的信息。相对于传统的采用傅里叶算法,需要频繁进行浮点运算的方式,本方案对数据的处理简单,运算量小,运算效率高,对硬件性能要求低,能够解决传统的识别算法无法适配硬件性能较低的移动终端的问题。
附图说明
41.图1为本技术实施例的声波识别方法的流程图;
42.图2为本技术实施例的声波识别方法的逻辑图。
具体实施方式
43.下面详细描述本技术的实施例,所述实施例的示例在附图中示出。下面通过参考附图描述的实施例是示例性的,仅用于解释本技术,而不能理解为对本技术的限制。
44.在本技术的描述中,多种的含义是两个以上。描述的第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
45.本技术的描述中,除非另有明确的限定,设置、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本技术中的具体含义。
46.相关技术中,设备与移动终端之间能够以声波为载体进行信息(运行状态、工作时长、电压、电流等)的传送。例如,设备将需要上报的有效信息通过蜂鸣器载波,发出特制的声音,移动终端通过自带的麦克风采集该声音,再由移动终端内部处理器对该音频数据进行处理,最终提取出有效数据,得到设备上报的有效信息。然而,传统的识别算法是基于傅里叶算法以及加窗算法进行运算,需要高频率的浮点运算,算法容量大,运行效率低,对硬件性能要求高,无法适配硬件性能较低的移动终端。如果在硬件性能一般的移动终端进行运算,会有5秒或以上的延时,造成较差的用户体验。
47.为此,本技术提出一种声波识别方法,通过提取音频波形中的多段基本波形,再将基本波形分割成多段单位波形,再通过计算将单位波形识别为第一波形或第二波形,而第一波形和第二波形均为载有信息的载波波形,根据确定的多段基本波形中第一波形和第二波形的位置和顺序,能够解析出音频波形中的信息。相对于传统的采用傅里叶算法,需要频繁进行浮点运算的方式,本方案对数据的处理简单,运算量小,运算效率高,对硬件性能要求低,能够解决传统的识别算法无法适配硬件性能较低的移动终端的问题。
48.参照图1和图2,本技术的第一方面提出了一种声波识别方法,包括:
49.s100、提取音频数据中音频波形的多段基本波形;其中,每段基本波形对应一组特征数据,每组特征数据包括波形的时间信息、上升幅度和下降幅度;
50.具体的,采样的音频数据为12s,采样频率为48kbyte每秒,音频数据量为50万byte左右,那么提取的基本波形为2000个左右,每个基本波形对应一组特征数据,每组特征数据均包括波形的时间信息、上升幅度和下降幅度,时间信息可以包括波形的起始时间和结束时间,通过波形的起始时间、上升幅度、结束时间和下降幅度,可以得到波形的宽度。
51.s200、将每段基本波形分割成多段单位波形;
52.将上述提取的2000段基本波形,每段基本波形均分割成单位波形,优选的,可以将每段基本波形均分割成最小单位的波形,然后再对分割后的最小单位波形进行处理。
53.s300、根据特征数据加权重做浮点运算,依次计算每段单位波形为第一波形和第二波形的可能值,并记录每段单位波形的位置;其中,第一波形为包含第一特征数据的载波波形,第二波形为包含第二特征数据的载波波形,第一特征数据和第二特征数据均包括波形的时间信息、上升幅度和下降幅度;
54.通过对单位波形进行加权重做浮点运算,可以得到单位波形为第一波形和第二波形的可能值,具体为,对特征数据中的波形宽度、上升幅度和下降幅度分别乘上对应的权重系数,再分别计算该段单位波形为第一波形和第二波形的可能性对应的可能值。其中,第一波形为包含第一特征数据的载波波形,第二波形为包含第二特征数据的载波波形,第一特征数据和第二特征数据均包括波形的时间信息、上升幅度和下降幅度,可以将第一波形和第二波形分别视为携带信息的逻辑0和逻辑1,计算该段单位波形为第一波形和第二波形的可能性对应的可能值,即为计算该段单位波形为0和1的可能值。
55.具体的,可以将第一波形视为0,第二波形视为1,则第二波形的预设宽度范围中的最小宽度要大于第一波形中的预设宽度范围中的最大宽度。
56.当然,也可以将第二波形视为0,第一波形视为1,也可以将1对应的预设宽度范围中的最大波形宽度设置为小于0对应的预设宽度范围中的最小波形宽度。
57.本文中,暂将第一波形视为0,第二波形视为1,且第二波形的预设宽度范围中的最小宽度设置为大于第一波形的预设宽度范围中的最大宽度。
58.s400、获取单位波形为第一波形和第二波形的最大可能值,并将最大可能值对应的波形作为该段单位波形;
59.计算出单位波形为第一波形和第二波形的可能值后,可以将两个可能值比较得到最大可能值,最大可能值对应的波形即为该段单位波形的最大可能波形。
60.s500、依次确定多段基本波形中第一波形和第二波形的位置和顺序;
61.通过依次确定多段基本波形中第一波形和第二波形的位置和顺序,可以得到对应的0和1的位置和顺序,此前,可以预先将按一定顺序排列的0和1设置为二进制代码,并将此二进制代码进行预设为不同的信息,例如运行状态、工作时长、电压或电流等信息,从而将机器设备的运行状态、工作时长、电压或电流等信息搭载到声波中,通过声波传递相关信息。
62.s600、根据第一波形和第二波形的位置和顺序,解析出音频波形中的信息。
63.通过已确定的多段基本波形中的第一波形和第二波形的位置和顺序,可以解析出第一波形和第二波形预先按对应顺序编码的机器设备例如运行状态、工作时长、电压或电流等信息。
64.当然,为便于用户及时了解机器设备的相关信息,可以在接收设备上,例如移动终端,以文字的形式显示解析出的机器设备的信息。同样的,也可以在接收设备上以音频的形式播报解析出的机器设备的信息。
65.在本技术的一些实施例中,在获取单位波形为第一波形和第二波形的可能值之后,还包括:判断两个可能值的差值是否大于预设阈值;若两个可能值的差值大于预设阈值,则确定单位波形为最大可能值对应的波形。在获取两个可能值之后,通过判断两个可能值的差值,可以得到获得的可能值是否可用,若两个可能值的差值过小,则说明该段单位波形为模糊波形,需要重新聚焦计算该段单位波形的可能值,若两个可能值的差值比较大,则
说明计算得到的可能值可用,该段单位波形为最大可能值对应的波形。
66.在本技术的一些实施例中,判断得到单位波形为最大可能值对应的波形之后,还包括:判断最大可能值是否大于或等于可信值;若最大可能值大于或等于可信值,则将最大可能值对应的波形作为该段单位波形。
67.可以理解的,在本技术的一些实施例中,还包括:若最大可能值小于可信值,则证明得到的可能值不可信,需要聚焦该段单位波形,根据波形的特征数据,包括起始时间、上升幅度、结束时间、下降幅度波峰值、波谷值、平均值和低位分割线等,加上对应数据的权重系数,重新加权做浮点运算,再次计算该段单位波形为第一波形和第二波形的可能值;并返回执行步骤判断最大可能值是否大于或等于可信值。通过进一步判断最大可能值是否可信,能够有效降低对该段单位波形的误识别率,提高对该段单位波形的识别率。
68.进一步的,若聚焦该段单位波形重新加权做浮点运算之后,得到的最大可能值仍小于可信值,则舍弃该段单位波形,再计算下一段单位波形为第一波形和第二波形的可能值,并记录下一段单位波形的位置,返回执行获取单位波形为第一波形和第二波形的最大可能值,再判断最大可能值是否大于或等于可信值:若大于或等于可信值,则确定该段单位波形为最大可能值对应的波形;若最大可能值仍小于可信值,舍弃该段单位波形,再定位到下一段单位波形进行识别计算。
69.在本技术的一些实施例中,还包括:验证最大可能值对应的波形是否符合预设条件;其中,预设条件包括第一波形特征和第二波形特征,第一波形特征和第二波形特征分别包括波形对应的波峰值、波谷值、平均值和低位分割线,以及波形的时间信息、上升幅度和下降幅度;若最大可能值对应的波形满足对应波形的波形特征,则将最大可能值对应的波形作为该段单位波形;若最大可能值对应的波形不满足对应波形的波形特征,则舍弃该段单位波形,再识别计算下一段单位波形为第一波形和第二波形的可能值,判断二者的可能值的差值是否大于预设阈值,若两个可能值的差值大于预设阈值,则获取最大可能值,判断最大可能值是否大于可信值,若最大可能值大于可信值,在返回验证最大可能值对应的波形是否符合对应的波形特征,若最大可能值对应的波形符合对应的波形特征,则将最大可能值对应的波形作为该段单位波形。
70.在本技术的一些实施例中,根据第一波形和第二波形的位置和顺序,解析出音频波形的信息,包括:将第一波形和第二波形的位置和顺序进行解析,将解析后的数据进行crc校验;若校验成功,则声波识别成功,并输出有效数据;若校验失败,则检测识别次数是否大于预设次数,若校验次数大于或等于预设次数,则是识别失败,并输出错误代码,若校验次数小于预设次数,则校验次数加一,并返回重新执行计算每段单位波形为第一波形和第二波形的可能值,并记录每段单位波形的位置。通过将解析出的数据进行crc校验,能够有效避免声波信息的误识别,提高声波识别率。
71.本技术的第二方面,提出了一种声波识别系统,包括:至少一个存储器,至少一个处理器及至少一个程序指令,程序指令是指存储在存储器上,并可以在处理器上运行,处理器用于执行本技术第一方面提出的声波识别方法。
72.本技术的第三方面,还提出了一种存储介质,存储介质上存储有程序指令,程序指令用于执行本技术第一方面提出的声波识别方法。
73.上面结合附图1和图2,对本技术实施例作了详细说明,但是本技术不限于上述实
施例,在技术领域普通技术人员所具备的知识范围内,还可以在不脱离本技术宗旨的前提下作出各种变化。
74.上述对本说明书特定实施例进行了描述。其他实施例在所附权利要求的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
75.程序指令包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或者某些中间形式等。存储介质包括:能够携带计算机程序代码的任何实体或装置、记录介质、计算机存储器、只读存储器(rom)、随机存取存储器(ram)、电载波信号、电信信号以及软件分发介质等。需要说明的是,存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,存储介质不包括电载波信号和电信信号。
76.需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为依据本技术,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本技术所必须的。
77.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。