首页 > 乐器声学 专利正文
语音唤醒方法、装置、电子设备及存储介质与流程

时间:2022-02-17 阅读: 作者:专利查询

语音唤醒方法、装置、电子设备及存储介质与流程

1.本技术涉及电子设备技术领域,更具体地,涉及一种语音唤醒方法、装置、电子设备及存储介质。


背景技术:

2.随着科技水平和生活水平的快速进步,电子设备(如智能手机、平板电脑等)成为人们生活中不可或缺的一部分。在电子设备被使用时,通常可以通过语音唤醒的方式对电子设备进行唤醒。相关技术中,通过语音唤醒电子设备,需要电子设备在未被唤醒的状态下持续录音和运行唤醒的程序,给电子设备带来了较大的功耗。


技术实现要素:

3.鉴于上述问题,本技术提出了一种语音唤醒方法、装置、电子设备及存储介质。
4.第一方面,本技术实施例提供了一种语音唤醒方法,应用于电子设备,所述方法包括:获取所述电子设备的屏幕状态;若所述屏幕状态由熄屏状态变为亮屏状态,采集所述电子设备所处环境中的语音信号;若所述语音信号对应的文本包括与预设唤醒词匹配的内容,对所述电子设备进行唤醒。
5.第二方面,本技术实施例提供了一种语音唤醒装置,其特征在于,应用于电子设备,所述装置包括:状态获取模块、语音采集模块以及设备唤醒模块,其中,所述状态获取模块用于获取所述电子设备的屏幕状态;所述语音采集模块用于若所述屏幕状态由熄屏状态变为亮屏状态,采集所述电子设备所处环境中的语音信号;所述设备唤醒模块用于若所述语音信号对应的文本包括与预设唤醒词匹配的内容,对所述电子设备进行唤醒。
6.第三方面,本技术实施例提供了一种电子设备,包括:一个或多个处理器;存储器;一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述第一方面提供的语音唤醒方法。
7.第四方面,本技术实施例提供了一种计算机可读取存储介质,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行上述第一方面提供的语音唤醒方法。
8.本技术提供的方案,通过获取电子设备的屏幕状态,在电子设备的屏幕状态由熄屏状态变为亮屏状态时,采集电子设备所处环境中的语音信号,若语音信号对应的文本包括与预设唤醒词匹配的内容,则对电子设备进行唤醒。由于电子设备在屏幕状态由熄屏变为亮屏时,才触发执行语音唤醒的录音以及语音识别,并在识别的文本包括预设唤醒词时,对电子设备进行唤醒,降低了电子设备的功耗。
附图说明
9.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使
用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
10.图1示出了根据本技术一个实施例的语音唤醒方法流程图。
11.图2示出了本技术实施例提供的语音唤醒方法的应用场景的一种示意图。
12.图3示出了本技术实施例提供的语音唤醒方法的应用场景的另一种示意图。
13.图4示出了根据本技术另一个实施例的语音唤醒方法流程图。
14.图5示出了根据本技术又一个实施例的语音唤醒方法流程图。
15.图6示出了根据本技术再一个实施例的语音唤醒方法流程图。
16.图7示出了根据本技术又另一个实施例的语音唤醒方法流程图。
17.图8示出了根据本技术一个实施例的语音唤醒装置的一种框图。
18.图9是本技术实施例的用于执行根据本技术实施例的语音唤醒方法的电子设备的框图。
19.图10是本技术实施例的用于保存或者携带实现根据本技术实施例的语音唤醒方法的程序代码的存储单元。
具体实施方式
20.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述。
21.随着电子设备的发展,电子设备可以实现的功能越来越多,目前,大部分的电子设备可以支持语音唤醒的功能。在语音唤醒电子设备的技术中,电子设备在休眠的情况下,可以进行录音、语音识别及根据识别结果确定是否唤醒电子设备的处理流程,以实现语音唤醒设备。
22.当然,电子设备大多支持语音助手,语音助手具有通过智能对话与即时问答等语音交互方式实现语音控制、信息查询等功能。语音唤醒也可以用于语音助手的唤醒,通常电子设备上的语音助手通常需要用户对其进行唤醒,一般是通过输入特定的语音唤醒词实现语音助手的唤醒,例如:语音助手小a的语音唤醒词为“嘿,小a”。在语音助手的唤醒方案中,也需要电子设备进行录音、语音识别及根据识别结果确定是否唤醒电子设备的处理流程,以实现唤醒语音助手。可见,在设备本身以及语音助手的语音唤醒方案中,均需要电子设备处于休眠或者语音助手处于休眠的状态下,长期且持续的采集语音、进行语音识别和确定是否唤醒的流程,因此会给电子设备带来较大的功耗。相关技术中,一些电子设备增加设置有低功耗的芯片,以在其处于休眠状态或者语音助手处于休眠状态下,运行语音唤醒的处理流程,从而降低电子设备的功耗,但是这样也带来了成本问题,并且部分电子设备由于成本问题,只能使用高功耗的方案,依然功耗较高。
23.针对上述问题,发明人提出了本技术实施例提供的语音唤醒方法、装置、电子设备以及存储介质,可以实现在电子设备的屏幕由熄屏变为亮屏时,触发执行语音唤醒的录音以及语音识别,并在识别的文本包括预设唤醒词时,对电子设备进行唤醒,降低了电子设备的功耗。其中,具体的语音唤醒方法在后续的实施例中进行详细的说明。
24.请参阅图1,图1示出了本技术一个实施例提供的语音唤醒方法的流程示意图。在
具体的实施例中,所述语音唤醒方法应用于如图8所示的语音唤醒装置400以及配置有所述语音唤醒装置400的电子设备100(图9)。下面将以电子设备为例,说明本实施例的具体流程,当然,可以理解的,本实施例所应用的电子设备可以为智能手机、平板电脑、智能手表、智能眼镜、笔记本电脑等,在此不做限定。下面将针对图1所示的流程进行详细的阐述,所述语音唤醒方法具体可以包括以下步骤:
25.步骤s110:获取所述电子设备的屏幕状态。
26.在本技术实施例中,电子设备可以监测其屏幕状态,以根据屏幕状态确定是否触发语音唤醒的处理流程。其中,屏幕状态指的是电子设备的屏幕的工作状态;屏幕状态可以包括亮屏状态以及熄屏状态,亮屏状态指的是电子设备的屏幕点亮时的工作状态,熄屏状态指的是电子设备的屏幕熄灭时的工作状态。
27.在一些实施方式中,电子设备可以通过多种方式来获取屏幕状态。可选地,操作系统读取相应的参数值,以根据读取到的参数值,确定电子设备的屏幕状态。
28.作为一种实施方式,电子设备中安装的系统为安卓(android)系统时,可以通过powermanager的isscreenon方法,获取屏幕状态,即通过获取isscreenon的值,如果isscreenon的值为真,则电子设备的屏幕处于亮屏状态,如果isscreenon的值为假,则电子设备的屏幕处于熄屏状态。
29.作为另一种实施方式,电子设备也可以通过获取屏幕的亮度值,并根据屏幕的亮度值,确定电子设备的屏幕状态。例如,如果屏幕的亮度值为0,则表示屏幕处于熄屏状态,如果屏幕的亮度值大于0,则屏幕处于亮屏状态。
30.当然,具体检测电子设备的屏幕状态的方式可以不作为限定。
31.可以理解地,电子设备的屏幕状态一定程度上表示了用户是否使用电子设备,因此可以基于电子设备的屏幕状态来确定是否触发语音唤醒的处理流程。
32.步骤s120:若所述屏幕状态由熄屏状态变为亮屏状态,采集所述电子设备所处环境中的语音信号。
33.在本技术实施例中,电子设备在获取到屏幕状态后,可以确定屏幕状态是否发生变化,若电子设备的屏幕状态发生变化时,可以基于屏幕状态发生的变化,确定是否触发语音唤醒的处理流程。其中,电子设备可以基于屏幕状态,确定屏幕状态是否由熄屏状态变为亮屏状态;若电子设备的屏幕状态由熄屏状态变为亮屏状态,则表示用户可能会使用电子设备,具有唤醒电子设备的可能性,因此,电子设备可以采集电子设备所处环境中的语音信号,以根据采集的语音信号,确定是否对电子设备进行唤醒。若电子设备的屏幕状态为熄屏状态,则可以不执行语音唤醒的处理流程。
34.在一些实施方式中,在屏幕状态由熄屏状态变为亮屏状态的情况下,则电子设备可以开始采集其所处环境中的语音信号,进而根据采集的语音信号确定是否对电子设备进行唤醒。也就是说,在电子设备的屏幕状态由熄屏状态变为亮屏状态之前,其屏幕状态为熄屏状态,此时电子设备不进行语音信号的采集,由此,在屏幕状态变为亮屏状态的情况下,才采集语音信号以及根据语音信号确定是否对电子设备进行唤醒,节省电子设备的功耗。可选地,电子设备开始采集所处环境中的语音信号后,可以在屏幕处于亮屏状态的情况下,持续采集其所处环境中的语音信号,以便用户在电子设备的屏幕处于亮屏状态时,能够输入语音对电子设备进行唤醒。
35.在一些实施方式中,电子设备在开始采集环境中的语音信号后,可以持续获取屏幕状态,在确定屏幕状态由熄屏状态变为亮屏状态后,还可以在屏幕状态由亮屏状态变为熄屏状态时,停止采集电子设备所处环境中的语音信号,即结束语音唤醒的处理流程,以降低电子设备的功耗。
36.在一些实施方式中,电子设备的屏幕状态由熄屏状态变为亮屏状态,可以是用户对电子设备进行操作,从而触发电子设备的屏幕状态由熄屏状态变为亮屏状态。例如,电子设备处于熄屏状态下,用户对电源键进行点击,则可以触发电子设备的屏幕状态变为亮屏状态;又例如,电子设备处于熄屏状态下,用户握持电子设备使其抬起,从而电子设备检测到抬起事件,触发电子设备的屏幕状态变为亮屏状态;再例如,电子设备处于熄屏状态下,用户于屏幕上输入熄屏手势操作,相应的,电子设备检测到熄屏手势操作,控制屏幕变为亮屏状态。当然,用户触发电子设备的屏幕由熄屏状态变为亮屏状态的方式可以不做限定。
37.在另一些实施方式中,电子设备的屏幕状态由熄屏状态变为亮屏状态,也可以是电子设备自动触发变为亮屏状态。可选地,电子设备可以在检测到产生提醒事件时,控制屏幕变为亮屏状态,其中,提醒事件可以为产生的来电提醒事件、短信提醒事件等,在此不做限定。当然,触发电子设备由熄屏状态变为亮屏状态的具体方式可以不做限定。
38.在一些实施方式中,电子设备可以设置有音频采集装置,例如,电子设备可以设置有麦克风。电子设备确定出屏幕状态由熄屏状态变为亮屏状态的情况下,可以控制音频采集装置采集电子设备所处环境中的语音信号,以根据采集的语音信号确定是否对电子设备进行唤醒。
39.步骤s130:若所述语音信号对应的文本包括与预设唤醒词匹配的内容,对所述电子设备进行唤醒。
40.在本技术实施例中,若电子设备采集到语音信号,则可以对采集的语音信号进行语音识别,以得到语音信号对应的文本。在得到语音信号对应的文本后,可以判断语音信号对应的文本是否包括与预设唤醒词匹配的内容,以根据判断结果确定是否对电子设备进行唤醒。其中,预设唤醒词为用于对电子设备进行唤醒所设置的唤醒词。若判断出语音信号对应的文本包括与预设唤醒词匹配的内容,则可以对电子设备进行唤醒;若语音信号对应的文本不包括与预设唤醒词匹配的内容,则可以不对电子设备进行唤醒。
41.在一些实施方式中,电子设备对采集的语音信号进行语音识别,可以采用多种方式。可选地,电子设备可以采用基于动态时间规整(dynamic time warping)的算法、基于参数模型的隐马尔可夫模型(hmm)的方法、基于非参数模型的矢量量化(vq)的方法等语音识别算法,对采集的语音信号进行语音识别。可选地,电子设备也可以采用预先训练的神经网络模型,对采集的语音信号进行语音识别,神经网络模型可以为卷积神经网络、深度学习神经网络等,在此不做限定。
42.在一些实施方式中,电子设备在判断出语音信号对应的文本包括与预设唤醒词匹配的内容时,可以对电子设备本身进行唤醒。可选地,电子设备为休眠状态,则可以唤醒电子设备,其中,通常电子设备在息屏状态时会进入休眠状态,在一些场景中,电子设备也可以处于亮屏状态下的休眠状态。例如,当电子设备的处于亮屏省电模式,屏幕由熄屏状态变为亮屏状态时,电子设备的系统不可以被直接唤醒,而是进入亮屏休眠模式,首先可以对系统时间进行更新,显示到屏幕上;然后系统走跟灭屏休眠一样的流程,对各种功能器件进行
关闭,并且在关闭屏幕和背光时,在屏幕驱动层,屏幕正常下电,但是不关闭背光,驱动给系统回复背光已经熄灭的假状态,实际仍然是亮屏的,屏幕显示的是当前系统时间。
43.可选地,电子设备在由熄屏状态变为亮屏状态时,电子设备可以为锁屏状态,此时,对电子设备进行唤醒,可以是对电子设备进行解锁。其中,电子设备处于熄屏状态时,通常也会进入锁屏状态,在由熄屏状态变为亮屏状态后,依然会处于锁屏状态,在处于锁屏状态的情况下,需要对电子设备进行解锁后才可以对电子设备进行使用。
44.在一种可能的实施方式中,若对电子设备进行唤醒,是对电子设备进行解锁,电子设备还可以根据采集的语音信号提取声纹特征,若提取的声纹特征与预先设置的用于解锁屏幕的声纹特征匹配,则可以解锁屏幕;若提取的声纹特征与预先设置的用于解锁屏幕的声纹特征不匹配,则不解锁屏幕。
45.在一种可能的实施方式中,若对电子设备进行唤醒,是对电子设备进行解锁,考虑到解锁电子设备的安全性,电子设备在判断出语音信号对应的文本包括与预设唤醒词匹配的内容时,可以采集解锁所需的用户验证信息,例如采集人脸图像等,以根据采集的用户验证信息,确定是否解锁屏幕。
46.在一些实施方式中,电子设备在判断出语音信号对应的文本包括与预设唤醒词匹配的内容时,对电子设备进行唤醒,也可以是,唤醒电子设备的语音助手。其中,语音助手是移动终端的系统中安装的应用,其可以实现通过智能对话与即时问答的智能交互,实现帮忙用户解决问题,例如,通过智能对话与即时问答等语音交互方式实现语音控制、信息查询等功能。
47.示例性地,请同时参阅图2及图3,图2及图3示出了本技术实施例提供的语音唤醒方法的应用场景的示意图,电子设备可以为智能手机101,用户可以将智能手机101放置于桌面,并且智能手机101在长时间未被操作后处于熄屏状态且智能手机101的语音助手处于休眠状态;在用户触控智能手机101的屏幕后,使智能手机101的屏幕处于亮屏状态时,智能手机101可以采集用户发出的语音信号,并且识别语音信号对应的文本,在该文本包括预设唤醒词时,唤醒智能手机101的语音助手,以完成用户所需的语音控制、信息查询等功能。由此,电子设备由熄屏状态变为亮屏状态的情况下,可以实现语音唤醒电子设备的语音助手,并且在熄屏状态变为亮屏状态的情况下,才执行语音唤醒的处理流程,可以降低电子设备的功耗。
48.本技术实施例提供的语音唤醒方法,电子设备在屏幕状态由熄屏变为亮屏时,触发执行语音唤醒的录音以及语音识别,并在识别的文本包括预设唤醒词时,对电子设备进行唤醒,因此,在其他情况下不会触发语音唤醒的处理流程,降低了电子设备的功耗。并且,可以在不增加硬件成本的情况下,实现语音唤醒的同时,降低电子设备的功耗。
49.请参阅图4,图4示出了本技术另一个实施例提供的语音唤醒方法的流程示意图。该语音唤醒方法应用于上述电子设备,下面将针对图4所示的流程进行详细的阐述,所述语音唤醒方法具体可以包括以下步骤:
50.步骤s210:获取所述电子设备的屏幕状态。
51.步骤s220:若所述屏幕状态由熄屏状态变为亮屏状态,采集所述电子设备所处环境中的语音信号。
52.在本技术实施例中,步骤s210以及步骤s220可以参阅前述实施例的内容,在此不
再赘述。
53.步骤s230:若所述屏幕状态为熄屏状态,检测所述电子设备的预设类型的设备状态,所述设备状态至少包括位姿信息以及产生的实时提醒事件。
54.在本技术实施例中,电子设备在获取屏幕状态后,若屏幕状态为熄屏状态,还可以检测电子设备的预设类型的设备状态,以根据检测的设备状态,确定电子设备的屏幕在熄屏的情况下,是否触发语音唤醒的处理流程。预设类型的设备状态可以包括位姿信息以及产生的实时提醒事件,其中,位姿信息可以包括电子设备位置和姿态;实时提醒事件可以包括来电提醒事件、短信提醒事件、应用通知、闹钟提醒等提醒事件。可以理解地,在电子设备的屏幕处于熄屏状态的情况下,若电子设备的位姿信息满足相应的位姿条件或者产生了相应的实时提醒事件,此时用户使用电子设备的可能性也较高,因此在屏幕状态为熄屏状态时,可以检测电子设备的以上设备状态,以确定是否触发语音唤醒的处理流程。
55.在一些实施方式中,电子设备中可以设置有用于检测位姿信息的传感器,从而电子设备在确定出屏幕状态为熄屏状态的情况下,可以通过以上传感器检测到位姿信息。其中,用于检测位姿信息的传感器可以为加速度计、陀螺仪等传感器,在此不做限定。
56.在一些实施方式中,电子设备获取的产生的实时提醒事件,可以是距离当前时刻的第一时长内产生的实时提醒事件,例如,可以为距离当前时刻的五分钟内产生的实时提醒事件。由此,可以根据短时间内的实时提醒事件,确定是否触发语音唤醒的流程,更为符合用户基于实时提醒事件使用语音唤醒的习惯,避免了产生较久的实时提醒事件触发语音唤醒的流程,而带来电子设备的功耗增加。
57.在一种可能的实施方式中,电子设备获取的实时提醒事件,可以为距离当前时刻的第一时长内用户未查看过的提醒事件。可以理解地,若产生的实时提醒事件中,用户已对其进行查看,则用户基于该实时提醒事件使用语音唤醒的可能性较小,因此可以排除用户查看过的实时提醒事件,提升触发语音唤醒的准确性,降低电子设备的功耗。
58.步骤s240:若所述设备状态中至少一个状态满足对应的预设状态条件,采集所述电子设备所处环境中的语音信号。
59.在本技术实施例中,预设状态条件可以为预先设置的熄屏状态下,针对每种设备状态设置的可以触发语音唤醒的处理流程的条件。若电子设备的设备状态中任意一个状态满足该状态对应的预设状态条件,可以表示用户此时需使用电子设备的可能性较大,因此可以触发语音唤醒的流程,即采集其所处环境的语音信号,并根据采集的语音信号确定是否对电子设备进行唤醒。也就是说,以上的设备状态包括位姿信息以及实时提醒事件等多个状态,在这多个状态中任一状态满足其对应的预设状态条件,都可以触发语音唤醒的处理流程。若电子设备的设备状态中任何一个状态都不满足其对应的预设状态条件,则表示用户当前对电子设备进行唤醒的可能性较小,因此可以不触发语音唤醒的流程。
60.在一些实施方式中,位姿信息对应的预设状态条件可以包括:位姿信息满足预设位姿条件。其中,预设位姿条件可以触发语音唤醒的处理流程的行为事件对应的位姿信息。
61.可选地,预设位姿条件可以包括:电子设备被抬起时的位姿信息、携带电子设备处于步行状态时的位姿信息、及携带电子设备处于跑步状态的位姿信息等,预设位姿条件也可以由用户进行定义,在此不做限定。
62.可以理解地,若电子设备的位姿信息与被抬起时的位姿信息匹配,则表示用户当
前使用语音唤醒电子设备的可能性较大,因此可以触发语音唤醒的处理流程,例如,电子设备为智能手表时,检测到的位姿信息与抬腕事件的位姿信息匹配,则可以采集语音信号,以及基于语音信号确定是否对智能手表进行唤醒。若电子设备的位姿信息与携带电子设备处于步行状态时的位姿信息匹配,或者与携带电子设备处于跑步状态的位姿信息匹配,此时用户不方便对电子设备进行操作,因此使用语音唤醒电子设备的可能性较大,故可以触发语音唤醒的处理流程,例如用户携带智能手表跑步时,不方便直接用手操作智能手表,因此可以通过语音唤醒的方式,唤醒电子设备的语音助手,以进行用户所需对电子设备进行的操作。
63.在一些实施方式中,实时提醒事件对应的预设状态条件包括可以包括:产生的实时提醒事件与预设提醒事件匹配。其中,预设提醒事件可以预先设置的用于触发语音唤醒的处理流程的提醒事件。
64.可选地,预设提醒事件可以包括:来电提醒事件、短信提醒事件、应用通知等,预设提醒事件也可以由用户进行定义,在此不做限定。可以理解地,产生来电提醒事件、短信提醒事件、应用通知等提醒事件时,用户大概率会操作电子设备,查看提醒事件,因此使用语音唤醒的方式唤醒电子设备的可能性较高,故可以触发语音唤醒的处理流程。例如,电子设备在产生短信提醒事件时,会进行亮屏并进行提示,但是用户可能并未来得及查看短信提醒事件,因此,在屏幕熄屏后,可以根据该短信提醒事件,继续触发语音唤醒的流程,以便满足用户需要通过语音唤醒电子设备,以获知该短信提醒事件对应的信息的需求。
65.步骤s250:若所述语音信号对应的文本包括与预设唤醒词匹配的内容,对所述电子设备进行唤醒。
66.在本技术实施例中,步骤s250可以参阅前述实施例的内容,在此不再赘述。
67.本技术实施例提供的语音唤醒方法,电子设备在屏幕状态由熄屏变为亮屏时,可以触发执行语音唤醒的录音以及语音识别,并在识别的文本包括预设唤醒词时,对电子设备进行唤醒,并且在屏幕状态为熄屏状态的情况下,若获取的预设类型的设备状态满足预设状态条件,也触发执行语音唤醒的处理流程,由此,满足了用户需要通过语音唤醒的方式对电子设备进行唤醒的需求,也降低了电子设备的功耗。
68.请参阅图5,图5示出了本技术又一个实施例提供的语音唤醒方法的流程示意图。该语音唤醒方法应用于上述电子设备,下面将针对图5所示的流程进行详细的阐述,所述语音唤醒方法具体可以包括以下步骤:
69.步骤s310:获取所述电子设备的屏幕状态。
70.在本技术实施例中,步骤s310可以参阅前述实施例的内容,在此不再赘述。
71.步骤s320:若所述屏幕状态由熄屏状态变为亮屏状态,采集所述电子设备所处环境中的语音信号。
72.在本技术实施例中,电子设备在确定出屏幕状态由熄屏状态变为亮屏状态,开始采集电子设备所处环境中的语音信号后,可以在第二时长内执行采集所处环境中的语音信号,以及根据采集的语音信号确定是否对电子设备唤醒。可以理解地,电子设备的屏幕状态由熄屏状态变为亮屏状态时,用户通常是通过触发屏幕亮屏,而进行语音唤醒,而且,电子设备的屏幕状态处于亮屏状态时,若一直进行语音唤醒的处理流程,则会带来较大的功耗,因此电子设备可以在确定出屏幕状态由熄屏状态变为亮屏状态时,在第二时长内执行语音
唤醒的处理流程,从而降低电子设备的功耗。
73.在一些实施方式中,第二时长可以根据记录的每次检测到亮屏后至用户每次触发语音唤醒的时长确定。其中,电子设备中记录有每次由熄屏状态变为亮屏状态的时刻,距离通过语音对电子设备唤醒的时刻之间的时长,电子设备可以根据每次记录的时长,确定用户在不同时间段的使用习惯,以在不同时间段设置不同的第二时长。可选地,电子设备可以通过深度学习神经网络,并根据每次记录的时长,以及每次触发语音唤醒的时刻所属的时间段,进行学习,从而得到不通过时间段所对应设置的第二时长。可选地,电子设备也可以通过统计的方式,根据每次记录的时长,统计出不同时间段内所对应的平均时长,得到对应用户对电子设备进行语音唤醒的习惯的第二时长。
74.在一些实施方式中,电子设备在确定出屏幕状态由熄屏状态变为亮屏状态,开始采集其所处环境中的语音信号之前,还可以确定当前用户是否
处于
可进行语音唤醒的时间段

若用户处于可进行语音唤醒的时间段,则可以开始采集其所处环境中的语音信号,若用户不处于可进行语音唤醒的时间段,则可以不进行语音唤醒的处理流程,即不采集语音信号以及根据采集的语音信号确定是否对电子设备进行唤醒,由此,可以更准确地控制语音唤醒的处理流程是否触发,进一步地降低电子设备的功耗。可选地,可以获取用户的日程安排信息,并根据日程安排信息,确定当前时刻所属时间段内用户是否进行目标行为,若正进行目标行为,则表示当前时刻属于不可进行语音唤醒的时间段,若前时刻所属时间段内用户未进行目标行为,则表示当前时刻属于可进行语音唤醒的时间段。目标行为可以为进行会议、课堂教学、工作中等用户不便利用语音对电子设备进行唤醒的行为,在此不做限定。
75.在一些实施方式中,电子设备在确定出屏幕状态由熄屏状态变为亮屏状态,开始采集其所处环境中的语音信号后,还可以根据开始采集指定时长内的语音信号,确定环境音的音量;若环境音的音量大于音量阈值,则表示当前不适合利用语音对电子设备进行唤醒,此时电子设备可以不执行后续根据采集的语音信号确定是否对电子设备进行唤醒的流程,并在屏幕显示提示信息,以提示当前语音唤醒模式未开启;若环境音的音量不大于音量阈值,则表示当前适合利用语音对电子设备进行唤醒,因此可以持续地采集语音信号,并根据采集的语音信号确定是否对电子设备进行唤醒。
76.在一种可能的实施方式中,电子设备也可以根据开始采集指定时长内的语音信号,确定环境音中的声源数量,在声源数量大于数量阈值的情况下,则表示当前不适合利用语音对电子设备进行唤醒,此时电子设备可以不执行后续根据采集的语音信号确定是否对电子设备进行唤醒的流程,并在屏幕显示提示信息,以提示当前语音唤醒模式未开启;若声源数量不不大于数量阈值,则表示当前适合利用语音对电子设备进行唤醒,因此可以持续地采集语音信号,并根据采集的语音信号确定是否对电子设备进行唤醒。
77.步骤s330:若所述屏幕状态为熄屏状态,检测所述电子设备的预设类型的设备状态,所述设备状态至少包括位姿信息以及产生的实时提醒事件。
78.在本技术实施例中,步骤s330可以参阅前述实施例的内容,在此不再赘述。
79.步骤s340:若所述设备状态满足所述预设状态条件,在预设时长内采集所述电子设备所处环境中的语音信号。
80.在本技术实施例中,电子设备在屏幕状态为熄屏状态的情况下,确定出电子设备的预设类型的设备状态满足预设状态条件时,可以在预设时长内执行语音唤醒的处理流
程,即在预设时长内采集电子设备所处环境中的语音信号,以及若语音信号对应的文本包括与预设唤醒词匹配的内容,对电子设备进行唤醒。由此,可以实现在预设时长内执行语音唤醒的处理流程,降低电子设备的功耗。
81.在一些实施方式中,满足预设位姿条件的不同位姿信息,以及与预设提醒事件匹配的不同实时提醒事件,所对应的预设时长可以不同。例如,若位姿信息为与步行状态的位姿信息匹配,则可以在整个步行状态期间采集电子设备所处环境中的语音信号,以及若语音信号对应的文本包括与预设唤醒词匹配的内容,对电子设备进行唤醒。又例如,若位姿信息与抬腕事件的位姿信息匹配,则确定检测到抬腕事件,可以在检测到抬腕事件后的一分钟内采集电子设备所处环境中的语音信号,以及若语音信号对应的文本包括与预设唤醒词匹配的内容,对电子设备进行唤醒。再例如,若与预设提醒事件匹配的实时提醒事件为来电提醒事件,则可以在产生来电提醒事件后的5分钟内采集电子设备所处环境中的语音信号,以及若语音信号对应的文本包括与预设唤醒词匹配的内容,对电子设备进行唤醒,由此可以实现产生了来电事件,但是用户未来得及接听,且屏幕变为熄灭状态,此时,用户可以在5分钟内进行语音唤醒,以实现免接触的回复来电。
82.在一些实施方式中,电子设备可以记录每次用户触发语音唤醒的时刻距离与检测到设备状态满足预设状态条件的时长,以根据每次记录的时长,确定满足预设位姿条件的不同位姿信息以及与预设提醒事件匹配的不同实时提醒事件,所对应的预设时长。可选地,电子设备可以通过深度学习神经网络,并根据每次记录的时长,以及每次所满足设备状态条件的位姿信息和实时提醒事件,进行学习,从而得到满足预设位姿条件的不同位姿信息以及与预设提醒事件匹配的不同实时提醒事件,所对应的预设时长。可选地,电子设备也可以通过统计的方式,根据每次记录的时长,统计出满足预设位姿条件的不同位姿信息以及与预设提醒事件匹配的不同实时提醒事件,所对应的平均时长作为预设时长。
83.在一些实施方式中,若电子设备的设备状态满足预设状态条件,为产生的实时提醒事件与预设提醒事件匹配,则电子设备还可以获取用户的日程信息,以确定当前用户的状态,然后根据用户的状态确定预设时长。其中,确定的预设时长可以与用户的状态对应。例如,用户的状态为会议状态,则用户长时间内都没法响应实时提醒事件,因此可以在相对较短的时间内,执行语音唤醒的处理流程,以节省功耗。又例如,用户的状态为驾驶状态,则预设时长可以相对较长,以便用户在停止驾驶时,能够快速地通过语音唤醒的方式,唤醒电子设备,并对产生的实时提醒事件进行查看等。
84.步骤s350:若所述语音信号对应的文本包括与预设唤醒词匹配的内容,对所述电子设备进行唤醒。
85.在本技术实施例中,步骤s550可以参阅其他实施例的内容,在此不再赘述。
86.本技术实施例提供的语音唤醒方法,与前一个实施例不同的是,在电子设备处于熄屏状态,且预设类型的设备状态满足预设状态条件时,在预设时长内执行采集所处环境的语音信号,以及根据采集的语音信号确定是否对电子设备进行唤醒,由此,可以实现在预设时长内执行语音唤醒的处理流程,降低电子设备的功耗。
87.请参阅图6,图6示出了本技术再一个实施例提供的语音唤醒方法的流程示意图。该语音唤醒方法应用于上述电子设备,下面将针对图6所示的流程进行详细的阐述,所述语音唤醒方法具体可以包括以下步骤:
88.步骤s410:获取所述电子设备的屏幕状态。
89.步骤s420:若所述屏幕状态由熄屏状态变为亮屏状态,采集所述电子设备所处环境中的语音信号。
90.在本技术实施例中,步骤s410以及步骤s420可以参阅前述实施例的内容,在此不再赘述。
91.步骤s430:若所述语音信号对应的文本包括与预设唤醒词匹配的内容,唤醒所述电子设备的语音助手。
92.在本技术实施例中,对电子设备进行唤醒,可以为对电子设备的语音助手进行唤醒,以便用户通过智能对话与即时问答等语音交互方式实现语音控制、信息查询等功能。
93.步骤s440:采集输入的控制语音。
94.在本技术实施例中,在唤醒电子设备的语音助手后,则可以进一步的采集用户输入的控制语音,从而语音助手可以根据用户输入的控制语音,执行相应的控制。
95.步骤s450:若所述控制语音用于待解锁屏幕后的控制场景,获取输入的解锁信息。
96.在本技术实施例中,电子设备处于熄屏状态时,通常处于锁屏状态,在电子设备的屏幕由熄屏状态变为亮屏状态后,若对语音助手进行了唤醒,此时电子设备依然处于锁屏的状态。若语音助手处于唤醒状态的情况下,根据输入的控制语音,识别出当前的控制语音用于待解锁屏幕后的控制场景,即解锁屏幕后才可以进行控制的场景,则可以检测用户的操作,获取用户输入的解锁信息,以根据解锁信息对电子设备进行解锁。其中,解锁信息可以为密码信息、人脸图像、指纹信息等,在此不做限定。
97.在一些实施方式中,用于解锁状态下的控制场景可以包括:运行目标应用程序的场景、使用电子设备在解锁状态下可使用的功能、查询电子设备中存储的文件等场景,在此不做限定,也可以为其他需要电子设备处于解锁状态才能够实现的场景。
98.在一些实施方式中,若控制语音用于锁屏状态下可执行的控制,则可以响应该控制语音,执行对应的控制。例如,若该控制语音用于查询和播报系统时间、查询和播报天气、查询和播报电量等场景,而并非需要解锁屏幕后才能执行的控制,因此,可以直接根据该控制语音,执行相应的控制。
99.步骤s460:若所述解锁信息与预设验证信息匹配,控制所述电子设备进行解锁后,执行所述控制语音对应的控制。
100.在本技术实施例中,若获取的解锁信息与预设验证信息匹配,则可以控制电子设备进行解锁。其中,预设验证信息为预先设置的用于解锁屏幕的验证信息,预设验证信息与解锁信息的类型相匹配,例如,解锁信息为密码信息,则预设验证信息为预先设置的解锁密码,又例如,解锁信息为人脸图像,则预设验证信息为预先录入的人脸图像,再例如,解锁信息为指纹信息,则预设验证信息为预先录入的指纹数据。
101.在控制电子设备进行解锁之后,则可以响应于以上的控制语音,执行该控制语音对应的控制。示例性地,在以上控制场景为运行音乐应用,播放音乐的场景时,则可以在控制电子设备进行解锁后,运行音乐应用,并播放相应的歌曲。
102.在一些实施方式中,电子设备中可以安装有多个语音助手。多个语音助手可以包括:系统语音助手、第三方应用的语音助手等。电子设备在唤醒语音助手时,可以对系统语音助手进行唤醒;系统语音助手在识别输入的控制语音时,可以先识别控制语音中包含应
用程序的关键词,在识别出用户输入的控制语音包含目标应用的关键词时,则表示该控制语音是对目标应用的控制,其中,该目标应用为具有其对应的语音助手的应用;该情况下,系统语音助手不可能无法识别出是对目标应用的何种控制,因此可以将控制语音交由该目标应用的语音助手进行处理,以实现对目标应用的控制;若识别出用户输入的控制语音不包含目标应用的关键词时,则系统语音助手可以进一步识别具体的控制操作,以完成用户所需的控制。通过该实施方式,可以实现电子设备安装有多个语音助手的情况下,对其系统语音助手进行唤醒,而不是对所有语音助手进行唤醒,由此节省了电子设备的功耗,提升了电子设备的续航能力。
103.本技术实施例提供的语音唤醒方法,与前述实施例不同的是,在对语音助手进行唤醒之后,若采集的控制语音用于待解锁屏幕后的控制场景,需要用户输入解锁信息,对电子设备进行解锁后,才能实现相应的控制,有效避免了对电子设备的语音助手唤醒后,利用语音助手进行解锁状态下才能进行的控制,保证了安全性。
104.请参阅图7,图7示出了本技术又再一个实施例提供的语音唤醒方法的流程示意图。该语音唤醒方法应用于上述电子设备,下面将针对图7所示的流程进行详细的阐述,所述语音唤醒方法具体可以包括以下步骤:
105.步骤s510:获取所述电子设备的屏幕状态。
106.步骤s520:若所述屏幕状态由熄屏状态变为亮屏状态,采集所述电子设备所处环境中的语音信号。
107.在本技术实施例中,步骤s510以及步骤s520可以参阅前述实施例的内容,在此不再赘述。
108.步骤s530:若所述电子设备处于播放音频的状态,基于所述电子设备播放的音频对所述语音信号进行回音消除。
109.在本技术实施例中,电子设备在采集环境中的语音信号之后,若电子设备处于播放音频的状态,则电子设备播放的音频可能会影响通过语音唤醒电子设备,即对语音唤醒电子设备产生干扰。因此,电子设备还可以获取电子设备播放的音频,以根据电子设备播放的音频对采集的语音信号进行回音消除。
110.在一些实施方式中,电子设备可以获取各个扬声器播放的音频,然后根据各个扬声器播放的音频,模拟生成回声部分,然后再用该模拟生成的回声部分,对采集的语音信号中的回声进行消除。其中,电子设备中可以增加回传通道,回传通道的数据与扬声器数量匹配,从而可以获取到各个扬声器播放的音频。
111.步骤s540:将所述回音消除后的语音信号对应的文本与所述预设唤醒词匹配。
112.步骤s550:若所述语音信号对应的文本包括与预设唤醒词匹配的内容,获取所述语音信号对应的声纹特征作为目标声纹特征。
113.在本技术实施例中,若语音信号对应的文本包括与预设唤醒词匹配的内容,电子设备还可以进行进一步的校验,以避免非用户本人对电子设备进行唤醒。其中,电子设备可以对以上语音信号进行声纹识别,得到语音信号对应的声纹特征作为目标声纹特征,以根据目标声纹特征进行身份验证。
114.步骤s560:若目标声纹特征与预设声纹特征匹配,对所述电子设备进行唤醒。
115.在本技术实施例中,预设声纹特征为预先设置的可对电子设备进行唤醒的用户的
声纹特征。电子设备在获取到目标声纹特征之后,可以将目标声纹特征与预设声纹特征匹配,若目标声纹特征与预设声纹特征匹配,则表示当前输入语音信号的用户为可以对电子设备进行唤醒的用户,因此可以对电子设备进行唤醒;若目标声纹特征与预设声纹特征不匹配,则表示当前输入语音信号的用户不为可以对电子设备进行唤醒的用户,因此可以忽略此次采集的语音信号,不对电子设备进行唤醒。
116.在一些实施方式中,电子设备可以设置有播放状态监听模块、录音模块(含参考音)、声学回声消除(acoustic echo cancellation,aec)模块、唤醒词检测模块、深度校验模块(声纹校验等)以及触发模块。当播放状态监听模块确定出存在自播放音频时,录音模块可以开启带参考音的录音,音频驱动中增加参考音(扬声器播放音)的回传模块,回传通道数量等同于扬声器数量,将麦克通道音,以及扬声器通道音一起送入aec模块;然后aec模块根据获取的音频,进行回声消除,消除回声之后,可以将音频输入至唤醒词检测模块;唤醒词检测模块再根据音频进行唤醒词检测;在检测到唤醒词的情况下,声纹检测模块进一步进行声纹校验,进行声纹校验后,若声纹校验通过,则触发模块控制对电子设备进行唤醒。
117.本技术实施例提供的语音唤醒方法,与前述实施例不同的是,在采集到环境中的语音信号的情况下,若电子设备处于音频播放状态,则对采集的语音信号进行回声消除,则消除回声后再识别是否包括预设唤醒词,有效提升了语音唤醒电子设备的准确性。另外,在识别出包括预设唤醒词的情况下,还根据采集的语音信号,进一步进行声纹校验,以避免非法对电子设备进行唤醒,保证了电子设备的安全性。
118.请参阅图8,其示出了本技术实施例提供的一种语音唤醒装置400的结构框图。该语音唤醒装置400应用上述的电子设备,该语音唤醒装置400包括:状态获取模块410、语音采集模块420以及设备唤醒模块430。其中,所述状态获取模块410用于获取所述电子设备的屏幕状态;所述语音采集模块420用于若所述屏幕状态由熄屏状态变为亮屏状态,采集所述电子设备所处环境中的语音信号;所述设备唤醒模块430用于若所述语音信号对应的文本包括与预设唤醒词匹配的内容,对所述电子设备进行唤醒。
119.在一些实施方式中,状态获取模块410还可以用于在所述获取所述电子设备的屏幕状态之后,若所述屏幕状态为熄屏状态,检测所述电子设备的预设类型的设备状态,所述设备状态至少包括位姿信息以及产生的实时提醒事件。若所述设备状态中至少一个状态满足对应的预设状态条件,所述语音采集模块420可以采集所述电子设备所处环境中的语音信号;若所述语音信号对应的文本包括与预设唤醒词匹配的内容,所述设备唤醒模块430对所述电子设备进行唤醒。
120.在一种可能的实施方式中,所述位姿信息对应的预设状态条件包括:
121.所述位姿信息满足预设位姿条件;
122.所述实时提醒事件对应的预设状态条件包括:
123.所述实时提醒事件与预设提醒事件匹配。
124.在一种可能的实施方式中,所述设备状态满足预设状态条件,所述语音采集模块420可以采集所述电子设备所处环境中的语音信号;若所述语音信号对应的文本包括与预设唤醒词匹配的内容,所述设备唤醒模块430对所述电子设备进行唤醒,可以包括:若所述设备状态满足所述预设状态条件,在预设时长内执行所述采集所述电子设备所处环境中的
语音信号,以及若所述语音信号对应的文本包括与预设唤醒词匹配的内容,对所述电子设备进行唤醒。
125.在一些实施方式中,该语音唤醒装置400还可以包括采集终止模块。采集终止模块用于在所述屏幕状态由亮屏状态变为熄屏状态时,停止采集所述电子设备所处环境中的语音信号。
126.在一些实施方式中,设备唤醒模块430可以用于:唤醒所述电子设备的语音助手。
127.在一种可能的实施方式中,该设备唤醒装置400还可以包括解锁信息获取模块以及屏幕解锁模块。语音采集模块420还可以用于在所述唤醒所述电子设备的语音助手之后,采集输入的控制语音;解锁信息获取模块用于若所述控制语音为用于待解锁屏幕后的控制场景,获取输入的解锁信息;屏幕解锁模块用于若所述解锁信息与预设验证信息匹配,控制所述电子设备进行解锁后,执行所述控制语音对应的控制。
128.在一些实施方式中,设备唤醒模块430可以用于:若所述语音信号对应的文本包括与预设唤醒词匹配的内容,获取所述语音信号对应的声纹特征作为目标声纹特征;若目标声纹特征与预设声纹特征匹配,对所述电子设备进行唤醒。
129.在一些实施方式中,该语音唤醒装置400还可以包括回音消除模块以及匹配模块。回音消除模块用于在所述若所述语音信号对应的文本包括与预设唤醒词匹配的内容,对所述电子设备进行唤醒之前,若所述电子设备处于播放音频的状态,基于所述电子设备播放的音频对所述语音信号进行回音消除;匹配模块用于将所述回音消除后的语音信号对应的文本与所述预设唤醒词匹配。
130.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
131.在本技术所提供的几个实施例中,模块相互之间的耦合可以是电性,机械或其它形式的耦合。
132.另外,在本技术各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
133.综上所述,本技术提供的方案,通过获取电子设备的屏幕状态,在电子设备的屏幕状态由熄屏状态变为亮屏状态时,采集电子设备所处环境中的语音信号,若语音信号对应的文本包括与预设唤醒词匹配的内容,则对电子设备进行唤醒。由于电子设备在屏幕状态由熄屏变为亮屏时,触发执行语音唤醒的录音以及语音识别,并在识别的文本包括预设唤醒词时,对电子设备进行唤醒,降低了电子设备的功耗。
134.请参考图9,其示出了本技术实施例提供的一种电子设备的结构框图。该电子设备100可以是智能手机、平板电脑、智能手表、智能眼镜、笔记本电脑等能够运行应用程序的电子设备。本技术中的电子设备100可以包括一个或多个如下部件:处理器110、存储器120、以及一个或多个应用程序,其中一个或多个应用程序可以被存储在存储器120中并被配置为由一个或多个处理器110执行,一个或多个程序配置用于执行如前述方法实施例所描述的方法。
135.处理器110可以包括一个或者多个处理核。处理器110利用各种接口和线路连接整个电子设备100内的各个部分,通过运行或执行存储在存储器120内的指令、程序、代码集或
指令集,以及调用存储在存储器120内的数据,执行电子设备100的各种功能和处理数据。可选地,处理器110可以采用数字信号处理(digital signal processing,dsp)、现场可编程门阵列(field-programmable gate array,fpga)、可编程逻辑阵列(programmable logic array,pla)中的至少一种硬件形式来实现。处理器110可集成中央处理器(central processing unit,cpu)、图形处理器(graphics processing unit,gpu)和调制解调器等中的一种或几种的组合。其中,cpu主要处理操作系统、用户界面和应用程序等;gpu用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器110中,单独通过一块通信芯片进行实现。
136.存储器120可以包括随机存储器(random access memory,ram),也可以包括只读存储器(read

only memory)。存储器120可用于存储指令、程序、代码、代码集或指令集。存储器120可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储电子设备100在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。
137.请参考图10,其示出了本技术实施例提供的一种计算机可读存储介质的结构框图。该计算机可读介质800中存储有程序代码,所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。
138.计算机可读存储介质800可以是诸如闪存、eeprom(电可擦除可编程只读存储器)、eprom、硬盘或者rom之类的电子存储器。可选地,计算机可读存储介质800包括非易失性计算机可读介质(non

transitory computer

readable storage medium)。计算机可读存储介质800具有执行上述方法中的任何方法步骤的程序代码810的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码810可以例如以适当形式进行压缩。
139.最后应说明的是:以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。