首页 > 乐器声学 专利正文
语音唤醒模式的调节方法、存储介质及电子设备与流程

时间:2022-02-13 阅读: 作者:专利查询

语音唤醒模式的调节方法、存储介质及电子设备与流程

1.本发明涉及语音唤醒技术领域,具体涉及一种语音唤醒模式的调节方法、存储介质及电子设备。


背景技术:

2.目前大部分智能设备都具有语音唤醒功能,当智能设备长时间不使用时,自动进入休眠状态。在休眠状态,智能设备可以降低功耗,减少用电。
3.现有智能设备都集成有语音活性检测单元(voice activity detection,vad)和关键词检测单元(keyword spotting,kws),语音活性检测单元用于检测音频信号是否包含语音信号,其中,语音信号为用户发出的信号,若包含语音信号,则语音活性检测单元唤醒关键词检测单元进行工作。关键词检测单元用于检测语音信号是否包含用户设定的唤醒关键词,若包含唤醒关键词,则关键词检测单元唤醒智能设备进入正常工作模式。
4.由于语音活性检测单元的唤醒模式比较单一,无法自适应各类声场环境,如在酒吧、演唱会或商场等人声较多的场景,语音活性检测单元容易被错误唤醒,且此场景下的唤醒频率远高于安静环境下的唤醒频率。由于语音活性检测单元与关键词检测单元是直通的,且语音活性检测单元也一直处于监听状态,因此,关键词检测单元也是一直处于运算状态,在上述嘈杂环境中容易增加智能设备的功耗。


技术实现要素:

5.本发明实施例的一个目的旨在提供一种语音唤醒模式的调节方法、存储介质及电子设备,用于解决现有技术存在的上述技术缺陷。
6.在第一方面,本发明实施例提供一种语音唤醒模式的调节方法,包括:
7.获取语音活性检测单元在预设时长内的语音唤醒次数,所述语音活性检测单元在唤醒状态时,可唤醒关键词检测单元进行工作;
8.根据所述语音唤醒次数及预设唤醒阈值,调节所述语音活性检测单元的当前唤醒模式。
9.可选地,所述当前唤醒模式为低唤醒模式或高唤醒模式,所述语音活性检测单元在所述低唤醒模式下唤醒所述关键词检测单元的唤醒难度,比在所述高唤醒模式下唤醒所述关键词检测单元的唤醒难度低。
10.可选地,所述根据所述语音唤醒次数及预设唤醒阈值,调节所述语音活性检测单元的当前唤醒模式包括:
11.根据所述语音唤醒次数,确定目标唤醒值;
12.根据所述目标唤醒值及预设唤醒阈值,调节所述语音活性检测单元的当前唤醒模式。
13.可选地,所述预设唤醒阈值包括第一阈值或第二阈值,所述根据所述目标唤醒值及预设唤醒阈值,调节所述语音活性检测单元的当前唤醒模式包括:
14.若所述当前唤醒模式为低唤醒模式,则根据所述目标唤醒值及所述第一阈值,调节所述语音活性检测单元的当前唤醒模式;
15.若所述当前唤醒模式为高唤醒模式,则根据所述目标唤醒值及所述第二阈值,调节所述语音活性检测单元的当前唤醒模式,所述第二阈值大于所述第一阈值。
16.可选地,所述根据所述语音唤醒次数,确定目标唤醒值包括:
17.若所述关键词检测单元的识别概率小于或等于预设概率,则将所述语音唤醒次数作为目标唤醒值;
18.若所述关键词检测单元的识别概率大于预设概率,则获取所述关键词检测单元的特征参数,根据所述特征参数及所述语音唤醒次数,融合生成目标唤醒值。
19.可选地,所述语音活性检测单元唤醒所述关键词检测单元的唤醒难度可由语音判断门限表示,其中,所述语音判断门限与所述唤醒难度呈正相关关系,在所述当前唤醒模式下,所述目标唤醒值与所述语音判断门限呈正相关关系。
20.可选地,所述方法还包括:
21.确定所述语音活性检测单元在当前唤醒模式下的目标预置值,所述语音活性检测单元在不同唤醒模式下配置不同标预置值;
22.根据所述目标唤醒值及所述目标预置值,调节所述语音活性检测单元的语音判断门限。
23.可选地,所述根据所述目标唤醒值及所述目标预置值,调节所述语音活性检测单元的语音判断门限包括:
24.计算所述目标唤醒值与所述目标预置值的差值;
25.以所述差值作为输入,施加给预设的pid架构,使得所述pid架构输出补偿值;
26.根据所述补偿值,调节所述语音活性检测单元的语音判断门限。
27.可选地,若当前唤醒模式为低唤醒模式,则所述目标预置值为第一预置值;
28.若当前唤醒模式为高唤醒模式,则所述目标预置值为第二预置值,所述第二预置值大于所述第一预置值。
29.在第二方面,本发明实施例提供一种存储介质,存储有计算机可执行指令,所述计算机可执行指令用于使电子设备执行上述的语音唤醒模式的调节方法。
30.在第三方面,本发明实施例提供一种电子设备,包括:
31.语音活性检测单元,用于获取音频信号,若检测到所述音频信号包含语音信号,则产生唤醒指令;
32.关键词检测单元,用于根据所述唤醒指令,判断所述语音信号是否包含唤醒关键词,若包含唤醒关键词,则唤醒所述电子设备;
33.控制器,用于执行上述的调节方法。
34.可选地,所述语音活性检测单元还用于判断所述音频信号的声压是否小于最小声压阈值或是否大于最大声压阈值,若否,则检测所述音频信号是否包含语音信号。
35.在本发明实施例提供的语音唤醒模式的调节方法中,获取语音活性检测单元在预设时长内的语音唤醒次数,语音活性检测单元在唤醒状态时,可唤醒关键词检测单元进行工作,根据语音唤醒次数及预设唤醒阈值,调节语音活性检测单元的当前唤醒模式,由于语音唤醒次数可反映外部环境情况,本实施例根据外部环境,自适应地调节语音活性检测单
元的当前唤醒模式,使得调节后的当前唤醒模式自适应外部环境,降低使用单一唤醒模式而容易出现语音活性检测单元被误唤醒的频率,以及关键词检测单元被误唤醒的频率,从而降低功耗。
附图说明
36.一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
37.图1为本发明实施例提供的一种电子设备的电路结构示意图;
38.图2为本发明实施例提供的一种语音唤醒模式的调节方法的流程示意图;
39.图3为图2所示的s22的流程示意图;
40.图4为图3所示的s222的流程示意图;
41.图5为本发明另一实施例提供的一种语音唤醒模式的调节方法的流程示意图;
42.图6为图5所示的s24的流程示意图;
43.图7为本发明实施例提供的一种控制器的电路结构示意图。
具体实施方式
44.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
45.需要说明的是,如果不冲突,本发明实施例中的各个特征可以相互结合,均在本发明的保护范围之内。另外,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。再者,本发明所采用的“第一”、“第二”、“第三”等字样并不对数据和执行次序进行限定,仅是对功能和作用基本相同的相同项或相似项进行区分。
46.本发明实施例提供的电子设备可以为任意合适类型的电子产品,举例的,电子设备为智能音箱、智能手表、智能手机、扫地机器人或智能电视等。
47.请参阅图1,电子设备100包括语音活性检测单元11、关键词检测单元12及控制器13。
48.语音活性检测单元11用于获取音频信号,并检测音频信号是否包含语音信号,例如,语音活性检测单元11集成有音频采集模块与音频分析模块,音频采集模块用于采集音频信号,并将音频信号传输给音频分析模块,音频分析模块烧录有语音提取的软件代码,根据噪声过滤算法,过滤包含在音频信号中的噪声信号,其中,噪声信号包括敲击声、杂音、白噪声等环境噪声。
49.接着,音频分析模块根据语音提取算法,判断过滤后的音频信号是否存在语音信号,其中,语音信号为用户发出的信号,例如,音频分析模块计算每帧过滤后的音频信号的短时能量或短时过零数,根据每帧音频信号的短时能量与能量门限或短时过零数与过零门限,判断过滤后的音频信号是否存在语音信号,若短时能量大于能量门限,或者,短时过零
数大于过零门限,则过滤后的音频信号存在语音信号。若短时能量小于能量门限,或者,短时过零数小于过零门限,则过滤后的音频信号不存在语音信号。
50.若语音活性检测单元11检测到音频信号包含语音信号,则产生唤醒指令,其中,唤醒指令用于唤醒关键词检测单元进入正常工作模式。若语音活性检测单元11检测到音频信号未包含语音信号,则继续获取音频信号。
51.在一些实施例中,音频采集模块为具有电声采集功能的电声换能器,例如音频采集模块为麦克风。音频分析模块为具有逻辑分析和运算功能的集成芯片,例如,音频分析模块可以为通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)、单片机、arm(acorn risc machine)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。
52.在一些实施例中,语音活性检测单元11还用于判断音频信号的声压是否小于最小声压阈值或是否大于最大声压阈值,若否,则检测音频信号是否包含语音信号,若是,则重新获取音频信号,其中,最小声压阈值或最大声压阈值由设计者根据工程经验自定义。
53.由于语音活性检测单元11提取出的语音信号需要传输至关键词检测单元12进行分析,若语音信号(音频信号)的声压过小或过大,则都会降低关键词检测单元12从语音信号中提取出唤醒关键词的可靠性和准确性,因此,本实施例能够及时地将声压小于最小声压阈值或大于最大声压阈值的语音信号进行过滤,避免关键词检测单元12分析此类语音信号,从而增强唤醒电子设备的可靠性和准确性。
54.关键词检测单元12用于根据唤醒指令,判断语音信号是否包含唤醒关键词,若包含唤醒关键词,则唤醒电子设备,若不包含唤醒关键词,则不唤醒电子设备,其中,唤醒关键词由设计者自定义,例如,唤醒关键词包括打开、启动、开始或关闭等词语。
55.关键词检测单元12配置有关键词提取算法,其中,关键词提取算法可以为任意合适类型的算法,诸如深度学习算法或神经网络算法等。
56.在一些实施例中,关键词检测单元12为具有逻辑分析和运算功能的集成芯片。
57.控制器13用于执行下文各个实施例所阐述的语音唤醒模式的调节方法。
58.本发明实施例提供一种语音唤醒模式的调节方法。请参阅图2,语音唤醒模式的调节方法s200包括:
59.s21、获取语音活性检测单元在预设时长内的语音唤醒次数,语音活性检测单元在唤醒状态时,可唤醒关键词检测单元进行工作;
60.作为示例但非限定的是,语音唤醒次数为语音活性检测单元在预设时长内唤醒关键词检测单元的次数,举例而言,语音活性检测单元在预设时长内唤醒关键词检测单元的次数为10次或100次,则语音唤醒次数为10或100。其中,预设时长由设计者根据工程经验自定义,例如预设时长为1分钟或10分钟或30分钟等。
61.在一些实施例中,语音活性检测单元每次处于唤醒状态时,控制器都进行累加自然数1,例如,在预设时长内,假设控制器目前已累加语音唤醒次数5,在第t1时刻,语音活性检测单元唤醒关键词检测单元,则控制器在已累加语音唤醒次数的基础上,累加自然数1,则得到新的已累加语音唤醒次数6,以此类推。
62.唤醒状态为语音活性检测单元可唤醒关键词检测单元进行工作时的状态,亦即,语音活性检测单元在唤醒状态时,都可唤醒关键词检测单元进行工作,如前所述,语音唤醒
次数为10,则说明语音活性检测单元在预设时长内10次处于唤醒状态,10次都可唤醒关键词检测单元进行工作。关键词检测单元进入工作状态时,都可判断语音信号是否存在唤醒关键词,若包含唤醒关键词,则唤醒电子设备。
63.s22、根据语音唤醒次数及预设唤醒阈值,调节语音活性检测单元的当前唤醒模式。
64.作为示例但非限定的是,唤醒模式为语音活性检测单元可唤醒关键词检测单元的模式,当前唤醒模式为语音活性检测单元当前所处的唤醒模式。不同唤醒模式配置不同唤醒难度,其中,由于语音活性检测单元检测音频信号包含语音信号时,语音活性检测单元都可以唤醒关键词检测单元,因此,唤醒难度可定义为唤醒语音活性检测单元检测音频信号是否包含语音信号的难度,通常,唤醒难度可选择语音判断门限进行表示,语音判断门限为用于判断音频信号是否包含语音信号的门限,其中,唤醒难度与语音判断门限呈正相关关系,语音判断门限越大,唤醒难度越高,语音判断门限越小,唤醒难度越小。
65.如前所述,语音活性检测单元可以根据能量门限或过零门限进行判断音频信号是否包含语音信号,亦即,语音判断门限可以为能量门限或过零门限。
66.通常,当能量门限大于音频信号的短时能量或过零门限大于音频信号的短时过零数时,方可判断音频信号包含语音信号,若提高能量门限或过零门限,音频信号中能够超过能量门限或过零门限的信号就相对越少,亦即,判断音频信号是否包含语音信号的唤醒难度就越高。若降低能量门限或过零门限,音频信号中能够超过能量门限或过零门限的信号就相对越多,亦即,判断音频信号是否包含语音信号的唤醒难度就越低,因此,可采用能量门限或过零门限作为语音判断门限以表示唤醒难度。
67.可以理解的是,本领域技术人员也可采用其它语音特征表示唤醒难度,本文不局限于采用能量门限或过零门限以表示唤醒难度的作法。
68.预设唤醒阈值由设计者根据工程经验自定义,例如,预设唤醒阈值为0.5或1或8或15或30等,可以理解的是,语音唤醒次数可被转换成任意合适数值,以便与预设唤醒阈值进行比较或判断,例如,语音唤醒次数为10,本实施例可将语音唤醒次数按照规则转换成0.6,也可按照规则保持语音唤醒次数为10,因此,相应的,预设唤醒阈值并不局限于整数,例如8或15或30,也可以为0.5或0.8等。
69.如前所述,当控制器的累加时长等于预设时长时,控制器都会根据语音唤醒次数及预设唤醒阈值,调节语音活性检测单元的当前唤醒模式。
70.由于语音唤醒次数可反映外部环境情况,本实施例根据外部环境,自适应地调节语音活性检测单元的当前唤醒模式,使得调节后的当前唤醒模式自适应外部环境,降低使用单一唤醒模式而容易出现语音活性检测单元被误唤醒的频率,以及关键词检测单元被误唤醒的频率,从而降低功耗。
71.在一些实施例中,当前唤醒模式为低唤醒模式或高唤醒模式,语音活性检测单元在低唤醒模式下唤醒关键词检测单元的唤醒难度,比在高唤醒模式下唤醒关键词检测单元的唤醒难度低。
72.举例而言,语音活性检测单元在低唤醒模式下被配置第一能量门限,语音活性检测单元在高唤醒模式下被配置第二能量门限,第一能量门限小于第二能量门限。
73.假设当前唤醒模式为低唤醒模式,音频信号f1的短时能量大于第一能量门限,则
语音活性检测单元检测到音频信号f1存在语音信号,于是,语音活性检测单元唤醒关键词检测单元进行工作。如电子设备此时工作在比较安静的环境下,语音活性检测单元能够容易地检测到正常发声的人声或者较弱的人声。
74.因此,本实施例可提前将语音活性检测单元的唤醒模式设置为低唤醒模式,从而满足安静场景下唤醒电子设备的需求,亦即电子设备处于越安静的场景,越容易检测到语音信号,从而也越容易唤醒关键词检测单元进行工作。
75.假设当前唤醒模式为高唤醒模式,虽然音频信号f1的短时能量大于第一能量门限,但是,音频信号f1的短时能量却小于第二能量门限,则语音活性检测单元检测到音频信号f1未存在语音信号,于是,语音活性检测单元不能唤醒关键词检测单元进行工作。
76.因此,本实施例可提前将语音活性检测单元的唤醒模式设置为高唤醒模式,从而满足嘈杂场景下避免过度频繁唤醒电子设备而增加功耗的情形出现,亦即电子设备处于越嘈杂的场景,越不容易检测到语音信号,从而也越不容易唤醒关键词检测单元进行工作。
77.在一些实施例中,请参阅图3,s22包括:
78.s221、根据语音唤醒次数,确定目标唤醒值;
79.s222、根据目标唤醒值及预设唤醒阈值,调节语音活性检测单元的当前唤醒模式。
80.在s221中,若关键词检测单元的识别概率小于或等于预设概率,则将语音唤醒次数作为目标唤醒值,其中,识别概率为关键词检测单元从语音信号中识别出唤醒关键词的概率,通常,关键词检测单元采用神经网络算法分析语音信号,可输出语音信号包含唤醒关键词的识别概率。举例而言,预设概率α为70%,关键词检测单元的识别概率β为50%,由于识别概率β小于预设概率α,则将语音唤醒次数作为目标唤醒值。
81.为了提高语音唤醒次数反映外部环境情况的准确率,在一些实施例中,若关键词检测单元的识别概率大于预设概率,则获取关键词检测单元的特征参数,根据特征参数及语音唤醒次数,融合生成目标唤醒值,其中,特征参数为用于表示关键词检测单元进行工作时的参数,例如,特征参数为用于反映关键词检测单元的功耗的参数。
82.在一些实施例中,获取关键词检测单元的特征参数时,本实施例根据第一权重因子与语音唤醒次数,计算特征参数,例如,特征参数ρ0=η1*k,其中,ρ0为特征参数,η1为第一权重因子,k为语音唤醒次数。由于语音活性检测单元一旦检测到音频信号包含语音信号,则语音活性检测单元都会唤醒关键词检测单元进行工作,关键词检测单元工作时都消耗功耗,因此,关键词检测单元的功耗可由语音唤醒次数进行反映。为了方便后续步骤能够综合体现外部环境及功耗的影响,此次可对语音唤醒次数乘以第一权重因子。
83.本实施例根据特征参数及语音唤醒次数融合生成目标唤醒值时,首先,本实施例可分别对特征参数及识别概率作归一处理,分别得到第一归一值及第二归一值,其中,第一归一值与目标唤醒值呈正相关关系,第二归一值与目标唤醒值呈负相关关系。例如,第一归一值ρ1=tanhρ0,第二归一值ρ2=tanhβ。接着,本实施例根据加权算法,对第一归一值及第二归一值进行加权运算,得到目标唤醒值,例如,y=η2*tanh(η1*k)

η3*tanhβ=η2*ρ1

η3*ρ2,y为目标唤醒值,η2为第二权重因子,η3为第三权重因子,1=η1+η2+η3,其中,η1、η2及η3可由设计者根据工程经验自定义。
84.可以理解的是,本实施例可以采用任意合适融合算法生成目标唤醒值,在此并不局限于上述实施例提供的方式。
85.如前所述,语音活性检测单元唤醒关键词检测单元的唤醒难度可由语音判断门限表示,其中,语音判断门限与唤醒难度呈正相关关系,在当前唤醒模式下,目标唤醒值与语音判断门限呈正相关关系。
86.举例而言,在当前唤醒模式为低唤醒模式的前提下,目标唤醒值越小,语音判断门限就越小,语音判断门限越小,唤醒难度就越低,因此,当当前唤醒模式为低唤醒模式,若外部环境变得愈安静,唤醒难度就愈低,此时,语音活性检测单元容易唤醒关键词检测单元进行工作,避免漏检音频信号,从而满足安静场景的高可靠性地检测需求。
87.再举例而言,在当前唤醒模式为高唤醒模式的前提下,目标唤醒值越高,语音判断门限就越高,语音判断门限越高,唤醒难度就越高,因此,当当前唤醒模式为高唤醒模式,若外部环境变得愈嘈杂,唤醒难度就愈高,此时,语音活性检测单元更不容易唤醒关键词检测单元进行工作,避免频繁唤醒关键词检测单元进行工作而浪费功耗的情形出现。
88.在一些实施例中,预设唤醒阈值包括第一阈值或第二阈值,请参阅图4,s222包括:
89.s2221、若当前唤醒模式为低唤醒模式,则根据目标唤醒值及第一阈值,调节语音活性检测单元的当前唤醒模式;
90.s2222、若当前唤醒模式为高唤醒模式,则根据目标唤醒值及第二阈值,调节语音活性检测单元的当前唤醒模式,第二阈值大于第一阈值。
91.在步骤s2221中,在当前唤醒模式为低唤醒模式的前提下,若目标唤醒值大于或等于第一阈值,则调节语音活性检测单元的唤醒模式至高唤醒模式,若目标唤醒值小于第一阈值,则保持语音活性检测单元的唤醒模式为低唤醒模式。
92.举例而言,在当前唤醒模式为低唤醒模式的前提下,当y≥a1时,调节语音活性检测单元的唤醒模式至高唤醒模式,a1为第一阈值,当y<a1时,保持语音活性检测单元的唤醒模式为低唤醒模式。
93.在步骤s2222中,在当前唤醒模式为高唤醒模式的前提下,若目标唤醒值大于或等于第二阈值,若大于或等于第二阈值,则保持语音活性检测单元的唤醒模式为高唤醒模式。若小于第二阈值,则调节语音活性检测单元的唤醒模式至低唤醒模式。
94.举例而言,在当前唤醒模式为高唤醒模式的前提下,当y≥a2时,保持语音活性检测单元的唤醒模式至高唤醒模式,a2为第二阈值,当y<a2时,调节语音活性检测单元的唤醒模式至低唤醒模式。
95.因此,通过设置第一阈值或第二阈值,本实施例避免目标唤醒值y出现小波动时(稍微小于a1或稍微大于a2),而不会频繁切换唤醒模式。
96.在一些实施例中,请参阅图5,语音唤醒模式的调节方法s200还包括:
97.s23、确定语音活性检测单元在当前唤醒模式下的目标预置值,语音活性检测单元在不同唤醒模式下配置不同目标预置值;
98.s24、根据目标唤醒值及目标预置值,调节语音活性检测单元的语音判断门限。
99.作为示例但非限定的是,目标预置值为电子设备为语音活性检测单元在不同唤醒模式下配置的固定值,举例而言,语音活性检测单元在低唤醒模式下,被配置第一预置值作为目标预置值,例如,第一预置值为10。语音活性检测单元在高唤醒模式下,被配置第二预置值作为目标预置值,第二预置值大于第一预置值,例如,第二预置值为20,采用此种作法,在步骤s24中,可以更加有效、可靠和准确地适应各类外部环境。
100.在步骤s24中,请参阅图6,s24包括:
101.s241、计算目标唤醒值与目标预置值的差值;
102.s242、以差值作为输入,施加给预设的pid架构,使得pid架构输出补偿值;
103.s243、根据补偿值,调节语音活性检测单元的语音判断门限。
104.举例而言,假设外部环境比较安静,目标唤醒次数比较小,根据上面提供的实施例,可将当前唤醒模式设置为低唤醒模式。由于当前唤醒模式为低唤醒模式,则目标预置值为第一预置值,假设第一预置值为10,并且假设语音活性检测单元的当前语音判断门限为h1。
105.第一种情况:假设在第一预设时长内,目标唤醒值为8,目标唤醒值

目标预置值=差值=8

10=

2。以差值

2作为输入,施加给预设的pid架构,使得pid架构输出补偿值

δh1,本实施例将当前语音判断门限调整为h1_1=h1

δh1,因此,经过调整后的当前语音判断门限h1_1相对先前的语音判断门限h1是降低了。
106.第二种情况:假设在第二预设时长内,目标唤醒值为6,则说明第二预设时长对应的外部环境的安静程度比第一预设时长的更安静,目标唤醒值

目标预置值=差值=6

10=

4。以差值

4作为输入,施加给预设的pid架构,使得pid架构输出补偿值

δh2,δh2>δh1。本实施例将当前语音判断门限调整为h1_2=h1

δh2,因此,经过调整后的当前语音判断门限h1_2相对先前的语音判断门限h1是降低了,并且,h1_2<h1_1,则说明对应相同幅值的音频信号,语音活性检测单元在第二种情况比在第一种情况更容易唤醒关键词检测单元进行工作。
107.再举例而言,假设外部环境比较嘈杂,目标唤醒次数比较大,根据上面提供的实施例,可将当前唤醒模式设置为高唤醒模式。由于当前唤醒模式为高唤醒模式,则目标预置值为第二预置值,假设第二预置值为20,并且假设语音活性检测单元的当前语音判断门限为h2。
108.第三种情况:假设在第三预设时长内,目标唤醒值为30,目标唤醒值

目标预置值=差值=30

20=10。以差值10作为输入,施加给预设的pid架构,使得pid架构输出补偿值δh3,本实施例将当前语音判断门限调整为h2_1=h2+δh3,因此,经过调整后的当前语音判断门限h2_1相对先前的语音判断门限h2是提高了。
109.第四种情况:假设在第三预设时长内,目标唤醒值为40,则说明第三预设时长对应的外部环境的嘈杂程度比第三预设时长的更嘈杂,目标唤醒值

目标预置值=差值=40

10=30。以差值30作为输入,施加给预设的pid架构,使得pid架构输出补偿值δh4,δh4>δh3。本实施例将当前语音判断门限调整为h2_2=h2+δh4,因此,经过调整后的当前语音判断门限h2_2相对先前的语音判断门限h2是提高了,并且,h2_2>h2_1,则说明对应相同幅值的音频信号,语音活性检测单元在第四种情况比在第三种情况更不容易唤醒关键词检测单元进行工作。
110.总体而言,采用上述作法,一方面,在更加安静的外部环境下,能够自适应地反馈降低语音判断门限,使得语音活性检测单元能够更为容易地唤醒关键词检测单元进行工作,避免漏检情形出现。另一方面,在更加嘈杂的外部环境下,能够自适应地反馈提高语音判断门限,使得语音活性检测单元能够更为不容易地唤醒关键词检测单元进行工作,避免语音活性检测单元频繁唤醒关键词检测单元进行工作而浪费功耗。
111.需要说明的是,在上述各个实施方式中,上述各步骤之间并不必然存在一定的先后顺序,本领域普通技术人员,根据本发明实施方式的描述可以理解,不同实施方式中,上述各步骤可以有不同的执行顺序,亦即,可以并行执行,亦可以交换执行等等。
112.请参阅图7,图7为本发明实施例提供的一种控制器的电路结构示意图。如图7所示,控制器700包括一个或多个处理器71以及存储器72。其中,图7中以一个处理器71为例。
113.处理器71和存储器72可以通过总线或者其他方式连接,图7中以通过总线连接为例。
114.存储器72作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的语音唤醒模式的调节方法对应的程序指令/模块。处理器71通过运行存储在存储器72中的非易失性软件程序、指令以及模块,从而实现上述方法实施例提供的语音唤醒模式的调节方法的功能。
115.存储器72可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器72可选包括相对于处理器71远程设置的存储器,这些远程存储器可以通过网络连接至处理器71。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
116.所述程序指令/模块存储在所述存储器72中,当被所述一个或者多个处理器71执行时,执行上述任意方法实施例中的语音唤醒模式的调节方法。
117.本发明实施例还提供了一种存储介质,所述存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,例如图7中的一个处理器71,可使得上述一个或多个处理器可执行上述任意方法实施例中的语音唤醒模式的调节方法。
118.本发明实施例还提供了一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被控制器执行时,使所述控制器执行任一项所述的语音唤醒模式的调节方法。
119.以上所描述的装置或设备实施例仅仅是示意性的,其中所述作为分离部件说明的单元模块可以是或者也可以不是物理上分开的,作为模块单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络模块单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
120.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
121.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明,它们没有在细节中提供;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实
施例技术方案的范围。