首页 > 乐器声学 专利正文
一种语音唤醒的方法、电子设备、可穿戴设备和系统与流程

时间:2022-02-17 阅读: 作者:专利查询

一种语音唤醒的方法、电子设备、可穿戴设备和系统与流程

1.本技术涉及终端领域,并且更具体地,涉及一种语音唤醒的方法、电子设备和可穿戴设备。


背景技术:

2.当前市面上的智能语音设备,在语音唤醒、降噪、识别的准确率上,虽然已经有了非常大的进步,但在有背景噪声的情况下,对人声识别就会比较差。特别是在用户距离待唤醒设备较远并且有背景噪声时,唤醒率会更低,而且会产生比较高的误唤醒。


技术实现要素:

3.本技术提供一种语音唤醒的方法、电子设备、可穿戴设备和系统,有助于提升电子设备进行语音唤醒时的准确度。
4.第一方面,提供了一种系统,该系统包括电子设备和可穿戴设备,该电子设备通过近距离无线连接与该可穿戴设备通信,该电子设备,用于采集所处环境中的语音信号;该电子设备,还用于在该语音信号满足预设条件时,向该可穿戴设备发送查询请求,该查询请求用于请求用户正在说话的信息;该可穿戴设备,用于向该电子设备发送查询结果,该查询结果包括用户正在说话的信息;该电子设备,还用于在根据该用户正在说话的信息确定用户正在说话时,进入唤醒状态。
5.本技术实施例中,电子设备在确定语音信号中包含唤醒词且声纹信息与预置的声纹信息匹配后,可以向可穿戴设备查询用户正在说话的信息。当电子设备确定用户正在说话时进行唤醒操作,从而进入唤醒状态。通过可穿戴设备辅助电子设备进行语音唤醒,有助于提升语音唤醒的准确度。
6.在一些可能的实现方式中,该预设条件为该语音信号中包含唤醒词;或者,该预设条件为该语音信号的声纹信息与预置的声纹信息匹配;或者,该预设条件为该语音信号中包含唤醒词且该语音信号的声纹信息与预置的声纹信息匹配。
7.在一些可能的实现方式中,用户正在说话的信息中包括可穿戴设备的传感器检测到的数据,该电子设备,还用于根据可穿戴设备的传感器检测到的数据,确定用户正在说话。
8.本技术实施例中,可以利用电子设备具有较强计算能力的特点,可穿戴设备只需要将传感器检测到的数据发送给电子设备,由电子设备进行判断。这样有助于降低电子设备在语音唤醒过程中的时延,也有助于提升语音唤醒的准确度。
9.结合第一方面,在第一方面的某些实现方式中,该用户正在说话的信息用于指示第一置信度和第二置信度,该第一置信度为用户佩戴该可穿戴设备的置信度,该第二置信度为用户正在说话的置信度;该电子设备具体用于:在该第一置信度大于或者等于第一预设值且该第二置信度大于或者等于第二预设值时,进入唤醒状态。
10.本技术实施例中,电子设备可以通过用户正在说话的信息中指示的第一置信度和
第二置信度,来确定是否进行唤醒操作。电子设备可以在确定用户正在佩戴可穿戴设备且用户正在说话时,进行唤醒操作,从而进入唤醒状态。通过可穿戴设备辅助电子设备进行语音唤醒,有助于提升语音唤醒的准确度。
11.结合第一方面,在第一方面的某些实现方式中,该可穿戴设备包括声传感器,该可穿戴设备具体用于:根据该声传感器在预设检测周期内检测到的人体心跳或者呼吸的声音信号的频率,确定该第一置信度;根据该声音信号在预设频率范围内的强度,确定该第二置信度。
12.本技术实施例中,可穿戴设备可以利用声传感器检测人体心跳或者呼吸的声音信号,确定第一置信度和第二置信度。这样电子设备就可以通过第一置信度和第二置信度来判断用户是否正在说话。通过可穿戴设备辅助电子设备进行语音唤醒,有助于提升语音唤醒的准确度。
13.在一些可能的实现方式中,该用户正在说话的信息中可以包括可穿戴设备的声传感器在预设周期内检测到人体心跳或者呼吸的声音信号的频率,以及该声音信号在预设频率范围内的强度。电子设备可以根据用户正在说话的信息确定第一置信度和第二置信度。从而电子设备根据第一置信度和第二置信度确定用户是否正在说话。
14.结合第一方面,在第一方面的某些实现方式中,该可穿戴设备包括利用光电容积描记ppg传感器,该可穿戴设备具体用于:根据该ppg传感器在预设检测周期内检测到的ppg信号的频率,确定该第一置信度;根据该ppg信号在预设频率范围内的强度,确定该第二置信度。
15.本技术实施例中,可穿戴设备可以利用ppg传感器检测的ppg信号,确定第一置信度和第二置信度。这样电子设备就可以通过第一置信度和第二置信度来判断用户是否正在说话。通过可穿戴设备辅助电子设备进行语音唤醒,有助于提升语音唤醒的准确度。
16.在一些可能的实现方式中,该用户正在说话的信息中可以包括可穿戴设备的ppg传感器在预设检测周期内检测到的ppg信号的频率以及该ppg信号在预设频率范围内的强度。电子设备可以根据用户正在说话的信息确定第一置信度和第二置信度。从而电子设备根据第一置信度和第二置信度确定用户是否正在说话。
17.结合第一方面,在第一方面的某些实现方式中,该可穿戴设备中包括声传感器,该可穿戴设备具体用于:通过该声传感器采集人体心跳或者呼吸的声音信号;将该声音信号输入第一模型、第二模型和第三模型中,得到该第一置信度和该第二置信度,该第一模型通过采集用户未佩戴该可穿戴设备时的噪声信号得到,该第二模型通过采集用户佩戴该可穿戴设备且未说话时的声音信号得到,该第三模型通过采集用户佩戴该可穿戴设备且正在说话时的声音信号得到。
18.本技术实施例中,通过机器学习的方式,可穿戴设备可以将声传感器采集的声音信号输入第一模型、第二模型或者第三模型中,从而得到第一置信度和第二置信度。这样电子设备就可以通过第一置信度和第二置信度来判断用户是否正在说话。通过可穿戴设备辅助电子设备进行语音唤醒,有助于提升语音唤醒的准确度。
19.在一些可能的实现方式中,电子设备中保存该第一模型、第二模型和第三模型。该用户正在说话的信息包括可穿戴设备的声传感器采集的人体心跳或者呼吸的声音信号。电子设备可以将该声音信号输入第一模型、第二模型和第三模型中,从而得到第一置信度和
第二置信度。从而电子设备根据第一置信度和第二置信度确定用户是否正在说话。
20.结合第一方面,在第一方面的某些实现方式中,该可穿戴设备中包括ppg传感器,该可穿戴设备具体用于:通过该ppg传感器采集ppg信号;将该ppg信号输入第一模型、第二模型和第三模型中,得到该第一置信度和该第二置信度,该第一模型通过采集用户未佩戴该可穿戴设备时的噪声信号得到,该第二模型通过采集用户佩戴该可穿戴设备且未说话时的ppg信号得到,该第三模型通过采集用户佩戴该可穿戴设备且正在说话时的ppg信号得到。
21.本技术实施例中,通过机器学习的方式,可穿戴设备可以将ppg传感器采集的ppg信号输入第一模型、第二模型或者第三模型中,从而得到第一置信度和第二置信度。这样电子设备就可以通过第一置信度和第二置信度来判断用户是否正在说话。通过可穿戴设备辅助电子设备进行语音唤醒,有助于提升语音唤醒的准确度。
22.在一些可能的实现方式中,电子设备中保存该第一模型、第二模型和第三模型。该用户正在说话的信息包括可穿戴设备的ppg传感器采集的ppg信号。电子设备可以将该ppg信号输入第一模型、第二模型和第三模型中,从而得到第一置信度和第二置信度。从而电子设备根据第一置信度和第二置信度确定用户是否正在说话。
23.结合第一方面,在第一方面的某些实现方式中,该电子设备上登录的账号和该可穿戴设备上登录的账号相关联。
24.在一些可能的实现方式中,该电子设备上登录的账号和该可穿戴设备上登录的账号可以是相同的账号;或者,该电子设备上登录的账号和该可穿戴设备上登录的账号为同一家庭群组中的账号;或者,该可穿戴设备上登录的账号可以是该电子设备上登录的账号授权过的账号。
25.第二方面,提供了一种语音唤醒的方法,该方法应用于电子设备中,该电子设备通过近距离无线连接与可穿戴设备通信,该方法包括:该电子设备采集所处环境中的语音信号;在该语音信号满足预设条件时,该电子设备向该可穿戴设备发送查询请求,该查询请求用于请求用户正在说话的信息;该电子设备接收该可穿戴设备发送的查询结果,该查询结果包括用户正在说话的信息;在根据该用户正在说话的信息确定用户正在说话时,该电子设备进入唤醒状态。
26.本技术实施例中,电子设备在确定语音信号中包含唤醒词且声纹信息与预置的声纹信息匹配后,可以向可穿戴设备查询用户正在说话的信息。当电子设备确定用户正在说话时进行唤醒操作,从而进入唤醒状态。通过可穿戴设备辅助电子设备进行语音唤醒,有助于提升语音唤醒的准确度。
27.在一些可能的实现方式中,该预设条件为该语音信号中包含唤醒词;或者,该预设条件为该语音信号的声纹信息与预置的声纹信息匹配;或者,该预设条件为该语音信号中包含唤醒词且该语音信号的声纹信息与预置的声纹信息匹配。
28.在一些可能的实现方式中,用户正在说话的信息中包括可穿戴设备的传感器检测到的数据,该电子设备根据该用户正在说话的信息确定用户正在说话,包括:该电子设备根据可穿戴设备的传感器检测到的数据,确定用户正在说话。
29.在一些可能的实现方式中,该用户正在说话的信息用于指示用户正在说话。
30.结合第二方面,在第二方面的某些实现方式中,该用户正在说话的信息用于指示
第一置信度和第二置信度,该第一置信度为用户佩戴该可穿戴设备的置信度,该第二置信度为用户正在说话的置信度,该在根据该用户正在说话的信息确定用户正在说话时,进入唤醒状态,包括:在该第一置信度大于或者等于第一预设值且该第二置信度大于或者等于第二预设值时,进入唤醒状态。
31.本技术实施例中,电子设备可以通过用户正在说话的信息中指示的第一置信度和第二置信度,来确定是否进行唤醒操作。电子设备可以确定用户正在佩戴可穿戴设备且用户正在说话时,进行唤醒操作,从而进入唤醒状态。通过可穿戴设备辅助电子设备进行语音唤醒,有助于提升语音唤醒的准确度。
32.在一些可能的实现方式中,该用户正在说话的信息中可以包括可穿戴设备的声传感器在预设周期内检测到人体心跳或者呼吸的声音信号的频率,以及该声音信号在预设频率范围内的强度。该方法还包括:电子设备根据该声传感器在预设检测周期内检测到的人体心跳或者呼吸的声音信号的频率,确定该第一置信度;该电子设备根据该声音信号在预设频率范围内的强度,确定该第二置信度。
33.在一些可能的实现方式中,该用户正在说话的信息中可以包括可穿戴设备的ppg传感器在预设检测周期内检测到的ppg信号的频率以及该ppg信号在预设频率范围内的强度。该方法还包括:该电子设备根据该ppg传感器在预设检测周期内检测到的ppg信号的频率,确定该第一置信度;该电子设备根据该ppg信号在预设频率范围内的强度,确定该第二置信度。
34.在一些可能的实现方式中,电子设备中保存该第一模型、第二模型和第三模型。该第一模型通过采集用户未佩戴该可穿戴设备时的噪声信号得到,该第二模型通过采集用户佩戴该可穿戴设备且未说话时的声音信号得到,该第三模型通过采集用户佩戴该可穿戴设备且正在说话时的声音信号得到。该用户正在说话的信息包括可穿戴设备的声传感器采集的人体心跳或者呼吸的声音信号。该方法还包括:该电子设备将该声音信号输入第一模型、第二模型和第三模型中,得到第一置信度和第二置信度。
35.在一些可能的实现方式中,电子设备中保存该第一模型、第二模型和第三模型。该第一模型通过采集用户未佩戴该可穿戴设备时的噪声信号得到,该第二模型通过采集用户佩戴该可穿戴设备且未说话时的ppg信号得到,该第三模型通过采集用户佩戴该可穿戴设备且正在说话时的ppg信号得到。该用户正在说话的信息包括可穿戴设备的ppg传感器采集的ppg信号。该方法还包括:该电子设备将该ppg信号输入第一模型、第二模型和第三模型中,得到该第一置信度和该第二置信度。
36.结合第二方面,在第二方面的某些实现方式中,该电子设备上登录的账号和该可穿戴设备上登录的账号相关联。
37.在一些可能的实现方式中,该电子设备上登录的账号和该可穿戴设备上登录的账号可以是相同的账号;或者,该电子设备上登录的账号和该可穿戴设备上登录的账号为同一家庭群组中的账号;或者,该可穿戴设备上登录的账号可以是该电子设备上登录的账号授权过的账号。
38.第三方面,提供了一种语音唤醒的方法,该方法应用于可穿戴设备中,该可穿戴设备通过近距离无线连接与电子设备通信,该方法包括:接收该电子设备发送的查询请求,该查询请求用于请求用户正在说话的信息;向该电子设备发送查询结果,该查询结果包括用
户正在说话的信息。
39.结合第三方面,在第三方面的某些实现方式中,该用户正在说话的信息用于指示第一置信度和第二置信度,该第一置信度为用户佩戴该可穿戴设备的置信度,该第二置信度为用户正在说话的置信度。
40.结合第三方面,在第三方面的某些实现方式中,该可穿戴设备包括声传感器,该向该电子设备发送查询结果之前,该方法还包括:根据该声传感器在预设检测周期内检测到的人体心跳或者呼吸的声音信号的频率,确定该第一置信度;根据该声音信号在预设频率范围内的强度,确定该第二置信度。
41.结合第三方面,在第三方面的某些实现方式中,该可穿戴设备包括ppg传感器,该向该电子设备发送查询结果之前,该方法还包括:根据该ppg传感器在预设检测周期内检测到的ppg信号的频率,确定该第一置信度;根据该ppg信号在预设频率范围内的强度,确定该第二置信度。
42.结合第三方面,在第三方面的某些实现方式中,该可穿戴设备包括声传感器,该向该电子设备发送查询结果之前,该方法还包括:通过该声传感器采集人体心跳或者呼吸的声音信号;将该声音信号输入第一模型、第二模型和第三模型中,得到该第一置信度和该第二置信度,该第一模型通过采集用户未佩戴该可穿戴设备时的噪声信号得到,该第二模型通过采集用户佩戴该可穿戴设备且未说话时的声音信号得到,该第三模型通过采集用户佩戴该可穿戴设备且正在说话时的声音信号得到。
43.结合第三方面,在第三方面的某些实现方式中,该可穿戴设备包括ppg传感器,该向该电子设备发送查询结果之前,该方法还包括:通过该ppg传感器采集ppg信号;将该ppg信号输入第一模型、第二模型和第三模型中,得到该第一置信度和该第二置信度,该第一模型通过采集用户未佩戴该可穿戴设备时的噪声信号得到,该第二模型通过采集用户佩戴该可穿戴设备且未说话时的ppg信号得到,该第三模型通过采集用户佩戴该可穿戴设备且正在说话时的ppg信号得到。
44.结合第三方面,在第三方面的某些实现方式中,该电子设备上登录的账号和该可穿戴设备上登录的账号相关联。
45.第四方面,提供了一种语音唤醒的装置,该装置包含在电子设备中,该装置具有实现上述第二方面及上述第二方面的可能实现方式中电子设备的功能。功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块或单元。
46.第五方面,提供了一种语音唤醒的装置,该装置包含在可穿戴设备中,该装置具有实现上述第三方面及上述第三方面的可能实现方式中可穿戴设备的功能。功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块或单元。
47.第六方面,提供了一种电子设备,包括:一个或多个处理器;存储器;以及一个或多个计算机程序。其中,一个或多个计算机程序被存储在存储器中,一个或多个计算机程序包括指令。当指令被电子设备执行时,使得电子设备执行上述第二方面中任一项可能的实现中的语音唤醒的方法。
48.第七方面,提供了一种可穿戴设备,包括:一个或多个处理器;存储器;以及一个或
多个计算机程序。其中,一个或多个计算机程序被存储在存储器中,一个或多个计算机程序包括指令。当指令被可穿戴设备执行时,使得可穿戴设备执行上述第三方面中任一项可能的实现中的语音唤醒的方法。
49.第八方面,提供了一种芯片系统,所述芯片系统位于电子设备中,该芯片系统包括片上系统soc,该soc用于控制麦克风采集该电子设备所处环境中的语音信号;该soc,还用于在确定该语音信号满足预设条件时,控制无线通信模块向该可穿戴设备发送查询请求,该查询请求用于请求用户正在说话的信息;该soc,还用于控制该无线通信模块接收该可穿戴设备发送的查询结果,该查询结果包括用户正在说话的信息;该soc,还用于在根据该用户正在说话的信息确定用户正在说话时,进入唤醒状态。
50.第九方面,提供了一种芯片系统,该芯片系统位于可穿戴设备中,该可穿戴设备包括soc,该soc,用于控制无线通信模块接收电子设备发送的查询请求,该查询请求用于请求用户正在说话的信息;该soc,还用于控制无线通信模块向该电子设备发送查询结果,该查询结果包括用户正在说话的信息。
51.第十方面,提供了一种计算机存储介质,包括计算机指令,当计算机指令在电子设备上运行时,使得电子设备执行上述第二方面任一项可能的实现中的语音唤醒方法;或者,使得可穿戴设备执行上述第三方面任一项可能的实现中的语音唤醒方法。
52.第十一方面,提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行上述第二方面任一项可能的实现中的语音唤醒方法;或者,使得可穿戴设备执行上述第三方面任一项可能的实现中的语音唤醒方法。
附图说明
53.图1是本技术实施例提供的一种电子设备的硬件结构示意图。
54.图2是本技术实施例提供的一组图形用户界面。
55.图3是本技术实施例提供的语音唤醒的方法的示意性流程图。
56.图4是本技术实施例提供的可穿戴设备的示意图。
57.图5是本技术实施例提供的可穿戴设备的另一示意图。
58.图6是本技术实施例提供的语音唤醒的方法的另一示意性流程图。
59.图7是本技术实施例提供的可穿戴设备的示意性框图。
具体实施方式
60.以下实施例中所使用的术语只是为了描述特定实施例的目的,而并非旨在作为对本技术的限制。如在本技术的说明书和所附权利要求书中所使用的那样,单数表达形式“一个”、“一种”、“所述”、“上述”、“该”和“这一”旨在也包括例如“一个或多个”这种表达形式,除非其上下文中明确地有相反指示。还应当理解,在本技术以下各实施例中,“至少一个”、“一个或多个”是指一个、两个或两个以上。术语“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系;例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b的情况,其中a、b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。
61.在本说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本技术的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的
不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
62.以下介绍了本技术实施例提供设计的电子设备、用于这样的电子设备的用户界面、和用于使用这样的电子设备的实施例。在一些实施例中,电子设备可以是包含其它功能诸如便携式电子设备,诸如手机、平板电脑等。便携式电子设备的示例性实施例包括但不限于搭载或者其它操作系统的便携式电子设备。上述便携式电子设备也可以是其它便携式电子设备,诸如膝上型计算机(laptop)等。还应当理解的是,在其他一些实施例中,上述电子设备也可以不是便携式电子设备,而是台式计算机。在一些实施例中,电子设备可以是智能家电,诸如智能音箱、智能家居设备等等。
63.示例性的,图1示出了电子设备100的结构示意图。电子设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,usb)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170a,受话器170b,麦克风170c,耳机接口170d,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,sim)卡接口195等。其中传感器模块180可以包括压力传感器180a,陀螺仪传感器180b,气压传感器180c,磁传感器180d,加速度传感器180e,距离传感器180f,接近光传感器180g,指纹传感器180h,温度传感器180j,触摸传感器180k,环境光传感器180l,骨传导传感器180m等。
64.可以理解的是,本技术实施例示意的结构并不构成对电子设备100的具体限定。在本技术另一些实施例中,电子设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
65.处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,ap),调制解调处理器,图形处理器(graphics processing unit,gpu),图像信号处理器(image signal processor,isp),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,dsp),基带处理器,和/或神经网络处理器(neural-network processing unit,npu)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
66.其中,控制器可以是电子设备100的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
67.处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
68.本技术实施例中,处理器110可以包括以下实施例中描述的唤醒处理模块、声纹处理模块。
69.示例性的,处理器110中的唤醒处理模块可以分析环境中的语音信号中是否包含
唤醒词,从而确定是否是误唤醒。
70.示例性的,处理器110中的声纹处理模块可以分析语音信号中的声纹信息与用户预设的声纹的相似度。
71.在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,i2c)接口,集成电路内置音频(inter-integrated circuit sound,i2s)接口,脉冲编码调制(pulse code modulation,pcm)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,uart)接口,移动产业处理器接口(mobile industry processor interface,mipi),通用输入输出(general-purpose input/output,gpio)接口,用户标识模块(subscriber identity module,sim)接口,和/或通用串行总线(universal serial bus,usb)接口等。
72.i2c接口是一种双向同步串行总线,包括一根串行数据线(serial data line,sda)和一根串行时钟线(derail clock line,scl)。i2s接口可以用于音频通信。在一些实施例中,处理器110可以包含多组i2s总线。pcm接口也可以用于音频通信,将模拟信号抽样,量化和编码。uart接口是一种通用串行数据总线,用于异步通信。mipi接口可以被用于连接处理器110与显示屏194,摄像头193等外围器件。gpio接口可以通过软件配置。gpio接口可以被配置为控制信号,也可被配置为数据信号。usb接口130是符合usb标准规范的接口,具体可以是mini usb接口,micro usb接口,usb type c接口等。
73.可以理解的是,本技术实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对电子设备100的结构限定。在本技术另一些实施例中,电子设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
74.充电管理模块140用于从充电器接收充电输入。
75.电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,外部存储器,显示屏194,摄像头193,和无线通信模块160等供电。
76.电子设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
77.无线通信模块160可以提供应用在电子设备100上的包括无线局域网(wireless local area networks,wlan)(如无线保真(wireless fidelity,wi-fi)网络),蓝牙(bluetooth,bt),全球导航卫星系统(global navigation satellite system,gnss),调频(frequency modulation,fm),近距离无线通信技术(near field communication,nfc),红外技术(infrared,ir)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
78.本技术实施例中,电子设备100作可以通过无线通信模块160向可穿戴设备发送查询请求,该查询请求用于请求可穿戴设备判断用户是否正在说话;也可以通过无线通信模块160接收来自可穿戴设备的查询结果。
79.在一些实施例中,电子设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得电子设备100可以通过无线通信技术与网络以及其他设备通信。
80.电子设备100通过gpu,显示屏194,以及应用处理器等实现显示功能。显示屏194用于显示图像,视频等。电子设备100可以通过isp,摄像头193,视频编解码器,gpu,显示屏194以及应用处理器等实现拍摄功能。isp用于处理摄像头193反馈的数据。摄像头193用于捕获静态图像或视频。
81.npu为神经网络(neural-network,nn)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过npu可以实现电子设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
82.示例性的,上述唤醒处理模块和声纹处理模块也可以包含在npu计算处理器中。
83.外部存储器接口120可以用于连接外部存储卡,例如micro sd卡,实现扩展电子设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
84.内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器110通过运行存储在内部存储器121的指令,从而执行电子设备100的各种功能应用以及数据处理。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储电子设备100使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,ufs)等。
85.电子设备100可以通过音频模块170,扬声器170a,受话器170b,麦克风170c,耳机接口170d,以及应用处理器等实现音频功能。例如音乐播放,录音等。
86.麦克风170c,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170c发声,将声音信号输入到麦克风170c。电子设备100可以设置至少一个麦克风170c。在另一些实施例中,电子设备100可以设置两个麦克风170c,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,电子设备100还可以设置三个,四个或更多麦克风170c,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
87.本技术实施例中,电子设备100可以通过麦克风170c接收环境中的语音信号。
88.压力传感器180a用于感受压力信号,可以将压力信号转换成电信号。
89.陀螺仪传感器180b可以用于确定电子设备100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180b确定电子设备100围绕三个轴(即,x,y和z轴)的角速度。
90.气压传感器180c用于测量气压。在一些实施例中,电子设备100通过气压传感器180c测得的气压值计算海拔高度,辅助定位和导航。
91.磁传感器180d包括霍尔传感器。电子设备100可以利用磁传感器180d检测翻盖皮套的开合。
92.加速度传感器180e可检测电子设备100在各个方向上(一般为三轴)加速度的大小。当电子设备100静止时可检测出重力的大小及方向。还可以用于识别电子设备姿态,应用于横竖屏切换,计步器等应用。
93.距离传感器180f,用于测量距离。电子设备100可以通过红外或激光测量距离。在
一些实施例中,拍摄场景,电子设备100可以利用距离传感器180f测距以实现快速对焦。
94.接近光传感器180g可以包括例如发光二极管(led)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。电子设备100通过发光二极管向外发射红外光。电子设备100使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确定电子设备100附近有物体。当检测到不充分的反射光时,电子设备100可以确定电子设备100附近没有物体。电子设备100可以利用接近光传感器180g检测用户手持电子设备100贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器180g也可用于皮套模式,口袋模式自动解锁与锁屏。
95.环境光传感器180l用于感知环境光亮度。电子设备100可以根据感知的环境光亮度自适应调节显示屏194亮度。
96.指纹传感器180h用于采集指纹。电子设备100可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。
97.温度传感器180j用于检测温度。在一些实施例中,电子设备100利用温度传感器180j检测的温度,执行温度处理策略。
98.触摸传感器180k,也称“触控面板”。触摸传感器180k可以设置于显示屏194,由触摸传感器180k与显示屏194组成触摸屏,也称“触控屏”。
99.骨传导传感器180m可以获取振动信号。在一些实施例中,骨传导传感器180m可以获取人体声部振动骨块的振动信号。
100.在介绍本技术实施例之前,首先介绍几个语音唤醒中的概念。
101.唤醒词:用于唤醒电子设备的字符串。比如,唤醒词是“小艺小艺”等。
102.语音唤醒操作:语音唤醒操作包括唤醒操作和识别操作两个部分。
103.其中,唤醒操作是指用户说出唤醒词来唤醒电子设备,使得电子设备处于等待语音指令的状态;或者唤醒操作是指用户说出唤醒词,从而使得电子设备进入唤醒状态;或者唤醒操作可以是电子设备接收到的语音信号的声纹信息与预置声纹信息匹配,从而使得电子设备进入唤醒状态。
104.语音指令:语音控制电子设备执行相应的语音操作的指令。比如,语音操作可以是“帮我订一张明天上午从北京飞往上海的机票”,“导航回家”,“播放音乐”等等。
105.识别操作:电子设备被唤醒后,用户说出语音指令来控制电子设备执行相应的语音操作。
106.目前在进行设备唤醒时,存在以下问题:如果在播放设备播放音频的同时,用户对唤醒设备进行唤醒,播放设备的音频可能会对唤醒设备造成干扰,导致唤醒设备被误唤醒或者唤醒不了。例如,当智能设备(例如,手机)放在电视边上,由于电视剧中说出了“小姨小姨”,与智能设备的唤醒词“小艺小艺”同音,会带来智能设备的误唤醒。
107.本技术实施例中,利用人体也是声音导体的特性,通过可穿戴设备贴近人体皮肤的一侧的传感器,探测人体内的语音信号来判断用户是否正在说话,有助于提升电子设备进行语音唤醒时的准确性。
108.图2示出了本技术实施例提供的一组图形用户界面(graphical user interface,gui)。
109.如图2所示,用户向手机发出包含唤醒词的语音指令“小艺小艺”。手机在接收到用
户的语音指令后,可以确定语音指令中的是否包含唤醒词以及该语音指令中的声纹信息与手机中预置的声纹信息是否匹配。若手机确定语音指令中包含唤醒词且声纹信息与手机中预置的声纹信息匹配,那么手机可以向用户的可穿戴设备发送查询请求,该查询请求用于查询用户是否正在说话;可穿戴设备可以利用贴近人体一侧的传感器来确定用户是否正在说话;可穿戴设备可以将查询结果发送给手机,查询结果中包括了用户正在说话的信息;手机在根据用户正在说话的信息确定用户正在说话后,进行唤醒操作,从而进入唤醒状态。如图2所示,手机可以向用户回复“我听到有个动人的声音在呼唤我”。本技术实施例中,手机在向用户回复“我听到有个动人的声音在呼唤我”,就可以表示手机进入了唤醒状态。
110.本技术实施例中,在对电子设备进行唤醒操作时,电子设备可以在确定语音指令中包含唤醒词且语音指令的声纹信息与电子设备中预置的声纹信息匹配后,电子设备可以继续向可穿戴设备发送查询请求,可穿戴设备可以辅助电子设备判断用户是否正在说话,当电子设备根据该查询结果确定用户正在说话时,电子设备可以进行唤醒操作。通过可穿戴设备探测人体内声音的方式,有助于提升电子设备语音唤醒的准确度。
111.图3示出了本技术实施例提供的语音唤醒的方法300的示意性流程图。如图3所示,该方法300可以由电子设备和可穿戴设备执行,该方法300包括:
112.s301,电子设备接收环境中的语音指令。
113.示例性的,如图2所示,手机可以接收到环境中的语音指令“小艺小艺”。
114.s302,电子设备判断该语音指令中是否包含唤醒词。
115.示例性的,s302可以由图1中处理器110中的唤醒处理模块执行。
116.一个实施例中,该唤醒处理模块可以为数字信号处理器(digital signal processing,dsp)。dsp可以对语音指令进行处理,从而可以分析得到该语音指令中是否包含唤醒词。
117.一个实施例中,该唤醒处理模块可以包括语音识别(automatic speech recognition,asr)模块、语义理解(natural language understanding,nlu)模块。
118.其中,asr模块主要作用是将用户的语音识别为文字内容,nlu模块的主要作用是理解用户的意图(intent),进行槽位(slot)解析。
119.示例性的,如图2所示,用户发出语音指令“小艺小艺”,手机可以在接收到该语音指令后,将该语音指令发送给asr模块,asr模块将该语音转化为文字信息(例如,“小艺小艺”)。从而电子设备可以确定该语音指令中包含唤醒词。
120.s303,电子设备判断该语音指令的声纹信息与电子设备中预置的声纹信息是否匹配。
121.示例性的,s303可以由图1中处理器110中的声纹处理模块执行。
122.用户可以提前在电子设备中保存一段包含唤醒词的录音,电子设备在获取到录音后可以分析用户的声纹信息。在电子设备接收到包含唤醒词的语音指令后,电子设备可以将语音指令与录音的声纹进行对比,从而确定语音指令中声纹信息和录音中的声纹信息的相似度。若该相似度大于预设相似度,那么电子设备可以确定该语音指令的声纹信息与电子设备预置的声纹信息匹配。
123.应理解,上述s302与上述s303之间并没有实际的先后顺序,可以先执行s302后执行s303,也可以是先执行s303后执行s302。
124.还应理解,上述s302和s303可以参考现有技术中判断语音指令中是否包含唤醒词,以及语音指令的声纹信息和预置的声纹信息是否匹配的过程,本技术实施例对此并不作限定。示例性的,电子设备可以根据语音指令生成该语音指令对应的语音特征向量;电子设备可以将该语音特征向量与用户特征向量进行匹配。在匹配成功的情况下,电子设备向可穿戴设备发送查询请求。
125.还应理解,本技术实施例中,电子设备可以在确定语音信号满足预设条件后,向可穿戴设备发送查询请求。该预设条件可以是s302和s303中的语音指令中包含唤醒词且语音指令的声纹信息和预置的声纹信息匹配;或者,该预设条件也可以是语音指令中包含唤醒词;或者,该预设条件还可以是语音指令的声纹信息和预置的声纹信息匹配。
126.示例性的,手机处于锁屏状态且处于熄屏状态时,手机检测到用户的语音指令“打开相机”。此时,虽然语音指令中不包含唤醒词,但是手机可以确定该语音指令的声纹信息与预置的声纹信息匹配。手机可以确定用户希望先唤醒手机再打开相机。那么手机也可以在确定语音指令的声纹信息与预置的声纹信息匹配后,向可穿戴设备发送查询请求。
127.s304,若电子设备确定语音指令中包含唤醒词且语音指令的声纹信息和预置的声纹信息匹配,那么电子设备可以向可穿戴设备发送查询请求,可穿戴设备接收电子设备发送的查询请求,该查询请求用于请求用户正在说话的信息。
128.一个实施例中,电子设备在向可穿戴设备发送查询请求之前,电子设备与可穿戴设备通过近场通讯建立连接。近场通讯包括但不限于wi-fi,蓝牙(bluetooth,bt),近距离无线通信技术(near field communication,nfc)等等近场通讯技术。
129.本技术实施例中,对查询请求发送的方式并不作具体限定。例如,该查询请求可以是wi-fi协议或者蓝牙协议新定义的一条消息,该消息中可以携带字段,该字段用于请求用户正在说话的信息。
130.或者,该查询请求也可以携带在现有的wi-fi协议或者蓝牙协议的消息中。
131.例如,该查询请求可以携带在蓝牙低功耗(bluetooth low energy,ble)数据包中。该ble数据包可以为定向广播包,电子设备可以提前获知可穿戴设备的媒体接入控制(media access control,mac)地址。那么在电子设备确定语音指令中包含唤醒词且语音指令的声纹信息和预置的声纹信息匹配时,电子设备可以通过针对可穿戴设备的mac地址,向可穿戴设备发送ble数据包。该ble数据包中可以携带字段,该字段用于请求用户正在说话的信息。
132.一个实施例中,电子设备和可穿戴设备可以是同一账号下的设备。例如,电子设备上登录了华为账号a,可穿戴设备上也登录了华为账号a。那么电子设备可以提前获知可穿戴设备的地址信息,从而电子设备可以向可穿戴设备发送该查询请求。或者,电子设备也可以将该查询请求发送到云端服务器,由云端服务器转发给可穿戴设备。
133.s305,可穿戴设备根据该查询请求,确定用户正在说话的信息。
134.本技术实施例中,用户正在说话的信息可以为用户正在说话的置信度。可以通过可穿戴设备上的传感器来确定用户正在说话的置信度。在判断用户正在说话的置信度之前,可以先判断声音信号的置信度,其中声音信号的置信度也可以理解为用户佩戴着可穿戴设备的置信度。
135.一个实施例中,图4示出了一种可穿戴设备的示意图。可以在可穿戴设备贴近皮肤
的一侧设置一个声传感器,声传感器可以从皮肤探测体内声音。
136.本技术实施例中,声传感器的原理是利用人体也是声音导体的特性,通过声传感器确定人体心跳或者呼吸声音对应的参数,例如,心跳的频率等。
137.一种确定声音信号的置信度的方法可以是将人体心跳、呼吸声音的频率和幅度范围作为检测规则。比如成年人的静止心率在60-100次/分钟,运动时最高达200次/分钟,那么心跳声音发生的周期频率就在1hz~3.3hz;心跳声本身声音频率为20hz-500hz间,也就是说如果以1hz-3.3hz的周期,检测到20hz-500hz的声音,则电子设备可以确定声音信号的置信度是1。这种方法比较简单。
138.另一种确定声音信号的置信度的方法是机器学习的方法,以一个声音检测模型为基础,用可穿戴设备上声传感器采集到的心跳或者呼吸的声音作为训练数据,能够训练得到一个可检测心跳或者呼吸声音的模型。当输入的声音信号中存在心跳或者呼吸声音时,该模型可以输出人体心跳或者呼吸声音是否在输入声音信号中的置信度(该置信度即为声音信号的置信度)。该模型检测精度较高,抗干扰能力较强。
139.在判断完声音信号的置信度后,可穿戴设备可以继续判断用户正在说话的置信度。
140.一种确定正在说话的置信度的方法是将语音信号从人体背景声音(心跳或者呼吸声音等)提取出来,计算穿戴者当时正在说话的置信度。
141.例如,如果成年女性语音的基础频率为350hz至3khz,成年男性语音的基本频率为100hz至900hz。类似的,也可以使用声音检测规则,根据用户的性别,设置不同的声音检测频率。
142.一个实施例中,可穿戴设备可以设置声音检测频率范围为[a,b]。那么用户正在说话的置信度可以由以下公式(1)确定:
[0143]
s=p/p0ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0144]
其中,s为用户正在说话的置信度,p为检测周期内探测到的声音信号在[a,b]范围时的平均强度,p0为预置的基础声音强度。
[0145]
另一种确定正在说话的置信度的方法是机器学习方法,把声音信号的置信度(s1)和用户正在说话的置信度(s2)计算结合起来。可以使用可穿戴设备上声传感器采集到的用户佩戴着可穿戴设备且正在说话时的声音信号(包括心跳、呼吸声和说话声音)作为训练数据集a(s1=1,s2=1)、用户佩戴着可穿戴设备且未说话时采集到的声音信号(包括心跳、呼吸声)作为训练数据集b(s1=1,s2=0)、用户未佩戴可穿戴设备时采集到的噪声数据(不包含心跳、呼吸和说话声音)作为训练数据集c(s1=0、s2=0),能够训练得到一个可同时检测心跳、呼吸声音和说话声音的模型。当在该模型中输入声传感器检测到的声音信号或者噪声信号时,该模型可同时输出s1和s2。
[0146]
以上介绍了可穿戴设备通过在贴近皮肤的一侧设置声传感器的方式来确定用户正在说话的置信度的过程;下面介绍通过可穿戴设备中的利用光电容积描记(photo plethysmo graph,ppg)传感器来确定用户正在说话的置信度的过程。
[0147]
图5示出了ppg传感器的示意图,如图5所示,ppg传感器包括发射光组件501和接收光组件502。可穿戴设备的ppg传感器中的发射光组件501中绿色发光二极管(light emitting diode,led)灯搭配感光光电二极管照射血液,由于血管内不同容积的血液对绿
光吸收不同,在心脏跳动时,血液流速增多,绿光的吸收量会随之变大;处于心脏跳动的间隙时血流会减少,吸收的绿光也会随之降低。因此,根据血液的吸光度可以测量心率。
[0148]
具体而言,当一定波长的光束照射到皮肤表面时,光束将穿过皮肤传送到接收光组件502,在此过程中由于受到皮肤肌肉和血液吸收的衰减作用,接收光组件502检测到光的强度将减弱。其中,人体的皮肤、骨骼、肉、脂肪等对光的反射是固定值,而毛细血管在心脏的作用下随着脉搏容积不停地变大变小。当心脏收缩时,外周血容量最多,光吸收量也最大,接收光组件502检测到的光强度最小;而在心脏舒张时,正好相反,检测到的光强度最大,使接收光组件502接收到的光强度随之呈脉动性变化。
[0149]
由于ppg传感器已经广泛应用于探测心率,用户说话时也会导致血液细胞震动,导致说话时探测到的血液细胞震动频率和幅度和用户不说话时有差别,从而可以使得可穿戴设备确定用户正在说话的置信度。
[0150]
一个实施例中,在利用ppg传感器确定用户正在说话的置信度之前,可以先确定声音信号的置信度。
[0151]
一种确定声音信号的置信度的方法可以是将人体的血液细胞震动频率和幅度范围作为检测规则,具体过程可以参考上述利用声传感器确定声音信号的置信度的过程,为了简洁,在此不再赘述。
[0152]
另一种确定声音信号的置信度的方法是机器学习的方法,以一个ppg信号检测模型为基础,用实际可穿戴设备上ppg传感器采集到的ppg信号的频率和幅度(或者,血液细胞震动频率和幅度)作为训练数据,能够训练得到一个可检测ppg信号的频率和幅度的模型。当在该模型中输入ppg传感器检测到的ppg信号的频率和幅度时,该模型可以输出声音信号的置信度。该模型检测精度较高,抗干扰能力较强。
[0153]
在判断完声音信号的置信度后,可穿戴设备可以接着判断用户正在说话的置信度。
[0154]
一种确定正在说话的置信度的方法是将语音信号从ppg信号提取出来,计算输出穿戴者当时正在说话的置信度。
[0155]
通过语音信号的频率来确定用户正在说话的置信度的过程可以参考上述通过将语音信号从人体背景声音(心跳或者呼吸声音等)提取出来,计算输出穿戴者当时正在说话的置信度的过程,为了简洁,在此不再赘述。
[0156]
另一种确定用户正在说话的置信度的方法是机器学习方法,把声音信号的置信度(s1)和用户正在说话的置信度(s2)计算结合起来,即可以使用可穿戴设备上ppg传感器采集到的用户佩戴着可穿戴设备且正在说话时的ppg信号作为训练数据集d(s1=1,s2=1)、用户佩戴可穿戴设备且未说话时采集到的ppg信号作为训练数据集e(s1=1,s2=0)、用户未佩戴可穿戴设备时采集到的噪声数据(不包含ppg信号)作为训练数据集f(s1=0、s2=0),能够训练得到一个可同时检测ppg信号的模型。当在该模型中输入可穿戴设备检测到的ppg信号时,该模型可同时输出s1和s2。
[0157]
以上是通过可穿戴设备确定声音信号的置信度以及用户正在说话的置信度为例进行说明的。本技术实施例中,也可以由电子设备来确定声音信号的置信度以及用户正在说话的置信度。
[0158]
示例性的,可穿戴设备发送给电子设备的查询结果中可以包括可穿戴设备的传感
器(例如,声传感器或者ppg传感器)采集的数据。例如,查询结果中可以包括声传感器采集的声音信号。当电子设备接收到该声音信号后,电子设备可以将该声音信号输入电子设备中保存的训练数据集a、训练数据集b和训练数据集c中,从而电子设备可以获得声音信号的置信度以及用户正在说话的置信度。
[0159]
又例如,查询结果中可以包括ppg传感器采集的ppg信号。当电子设备接收到该ppg信号后,电子设备可以将该ppg信号输入电子设备中保存的训练数据集d、训练数据集e和训练数据集f中,从而电子设备可以获得声音信号的置信度以及用户正在说话的置信度。
[0160]
应理解,电子设备通过可穿戴设备的传感器采集的数据确定声音信号的置信度以及用户正在说话的置信度的过程还可以参考上述可穿戴设备确定声音信号的置信度以及用户正在说话的置信度的过程,为了简洁,在此不再赘述。
[0161]
s306,可穿戴设备向电子设备发送查询结果,电子设备接收可穿戴设备发送的查询结果,该查询结果中包括用户正在说话的信息。
[0162]
一个实施例中,用户正在说话的信息中包括上述声音信号的置信度以及用户正在说话的置信度。
[0163]
一个实施例中,如果可穿戴设备判断声音信号的置信度低于第一预设值时,可穿戴设备可以直接在查询结果中指示用户未佩戴可穿戴设备。此时电子设备可以按照现有技术来判断是否进入唤醒状态。或者,如果可穿戴设备判断声音信号的置信度低于第一预设值时,可穿戴设备可以在查询结果中指示用户正在说话的置信度为不可知,电子设备可以按照现有技术来判断是否进入唤醒状态。
[0164]
或者,如果可穿戴设备确定声音信号的置信度低于第一预设值时,可穿戴设备可以不向电子设备发送该查询结果。如果电子设备在预设时长内未收到该查询结果,那么电子设备可以确定用户未佩戴可穿戴设备。此时电子设备可以按照现有技术来判断是否进入唤醒状态。
[0165]
本技术实施例中,可穿戴设备在判断声音信号的置信度大于或者等于第一预设值且用户正在说话的置信度大于或者等于第二预设值后,可以在查询结果中指示用户正在说话;或者,可穿戴设备也可以将声音信号的置信度和用户正在说话的置信度携带在查询结果中发送给电子设备,由电子设备判断用户是否正在说话。例如,如果电子设备确定声音信号的置信度大于或者等于第一预设值且用户正在说话的置信度大于或者等于第二预设值,那么电子设备可以确定用户正在说话,从而进入唤醒状态。
[0166]
本技术实施例中,对查询结果发送的方式并不作具体限定。例如,该查询结果可以是wi-fi协议或者蓝牙协议新定义的一条消息,该消息中可以携带字段,该字段用于指示用户正在说话的信息。
[0167]
或者,该查询结果也可以携带在现有的wi-fi协议或者蓝牙协议的消息中。
[0168]
示例性的,该查询结果可以携带在ble数据包中。该ble数据包可以为定向广播包,可穿戴设备可以提前获知电子设备的mac地址。那么在可穿戴设备可以针对电子设备的mac地址,向电子设备发送ble数据包。该ble数据包中可以携带字段,该字段用于请求用户正在说话的信息。
[0169]
例如,用户正在说话的信息可以用2比特指示,“11”表示用户正在佩戴可穿戴设备且用户正在说话;“10”表示用户正在佩戴可穿戴设备且用户未说话;“00”表示用户未佩戴
可穿戴设备。
[0170]
又例如,用户正在说话的信息也可以用1比特指示,“1”表示用户正在说话;“0”表示用户未说话。
[0171]
一个实施例中,用户正在说话的信息中包括可穿戴设备的传感器(例如,声传感器或者ppg传感器)采集的数据。
[0172]
s307,若电子设备根据用户正在说话的信息确定用户正在说话,则电子设备进入唤醒状态。
[0173]
应理解,本技术实施例中,电子设备在确定用户正在说话时,可以执行唤醒操作,执行唤醒操作可以使得电子设备从非唤醒状态进入唤醒状态。
[0174]
一个实施例中,若电子设备接收到的查询结果中包括可穿戴设备发送的声音信号的置信度以及用户正在说话的置信度,那么电子设备可以在确定声音信号的置信度大于或者等于第一预设值且用户正在说话的置信度大于或者等于第二预设值时,进行唤醒操作,从而进入唤醒状态。
[0175]
一个实施例中,若电子设备接收到的查询结果中指示用户正在说话,那么电子设备可以直接进行唤醒操作,从而进入唤醒状态。
[0176]
应理解,若电子设备接收到的查询结果中包括可穿戴设备发送的声音信号的置信度以及用户正在说话的置信度,且声音信号的置信度小于第一预设值时,电子设备可以不进入唤醒状态。
[0177]
或者,若声音信号的置信度大于或者等于第一预设值且用户正在说话的置信度小于第二预设值时,电子设备也可以不进入唤醒状态。
[0178]
还应理解,若电子设备在预设时长内未接收到查询结果,那么电子设备可以获知用户未佩戴可穿戴设备,那么电子设备可以按照现有技术来判断是否进入唤醒状态。
[0179]
一个实施例中,用户正在说话的信息中包括可穿戴设备的传感器(例如,声传感器或者ppg传感器)采集的数据。电子设备在接收到可穿戴设备的传感器采集的数据后,可以通过可穿戴设备的传感器采集的数据来确定声音信号的置信度以及用户正在说话的置信度。进而可以根据这两个置信度来确定用户是否正在说话。
[0180]
本技术实施例中,通过探测人体声音的方式,可穿戴设备可以电子设备发送用户正在说话的信息,由电子设备通过用户正在说话的信息来判断用户是否正在说话,这样有助于提升语音唤醒准确率。
[0181]
图6示出了本技术实施例提供的另一语音唤醒的方法600的示意性流程图。如图6所示,该方法600可以由电子设备执行,该方法600包括:
[0182]
s601,接收环境中的语音指令。
[0183]
s602,若电子设备确定语音指令满足预设条件时,向可穿戴设备发送查询请求,该查询请求用于请求用户正在说话的信息。
[0184]
应理解,电子设备确定语音指令满足预设条件的过程可以参考上述方法300中s302-303的过程,为了简洁,在此不再赘述。
[0185]
还应理解,电子设备向可穿戴设备发送查询请求的过程可以参考上述方法300中的s304,为了简洁,在此不再赘述。
[0186]
s603,电子设备判断在预设时长内是否接收到查询结果。
[0187]
一个实施例中,若电子设备在预设时长内没有接收到查询结果,那么电子设备可以确定可穿戴设备距离电子设备较远,或者电子设备也可以确定用户未佩戴可穿戴设备,那么电子设备可以按照现有技术来判断是否进入唤醒状态。例如,电子设备在确定语音指令中包含唤醒词且语音指令的声纹信息与预置的声纹信息匹配时,进入唤醒状态。
[0188]
s604,若电子设备在预设时长内接收到了查询结果且该查询结果中包含用户正在说话的信息,那么电子设备根据该用户正在说话的信息判断用户是否正在说话。
[0189]
一个实施例中,用户正在说话的信息包括声音信号置信度以及用户正在说话的置信度。那么电子设备可以在确定声音信号的置信度大于或者等于第一预设值且用户正在说话的置信度大于或者等于第二预设值时,电子设备可以进入唤醒状态。
[0190]
一个实施例中,用户正在说话的信息直接指示用户是否正在说话。例如,用户正在说话的信息(例如,ble数据包中携带的字段取值为“1”)指示用户正在说话时,电子设备可以进入唤醒状态;用户正在说话的信息(例如,ble数据包中携带的字段取值为“0”)指示用户未说话时,电子设备可以不进入唤醒状态。
[0191]
一个实施例中,用户正在说话的信息也可以为可穿戴设备的传感器(例如,声传感器或者ppg传感器)采集的数据。那么电子设备可以根据可穿戴设备的传感器采集的数据来确定用户是否正在说话。例如,电子设备可以根据可穿戴设备的传感器采集的数据来确定声音信号的置信度以及用户正在说话的置信度,从而根据这两个置信度来确定用户是否正在说话。
[0192]
应理解,电子设备根据用户正在说话的信息判断用户是否正在说话的过程可以参考上述方法300中的s307的过程,为了简洁,在此不再赘述。
[0193]
s605,若电子设备确定用户正在说话,那么电子设备进入唤醒状态。
[0194]
一个实施例中,若电子设备根据用户正在说话的信息确定用户未说话,那么电子设备可以不进入唤醒状态。
[0195]
本技术实施例中,通过探测人体声音的方式,可穿戴设备可以电子设备发送用户正在说话的信息,由电子设备通过用户正在说话的信息来判断用户是否正在说话,这样有助于提升语音唤醒准确率。
[0196]
本技术实施例中还提供了一种电子设备,该电子设备可以包括如图1所示的处理器110以及无线通信模块160。其中,无线通信模块160可以用于上述s602中向可穿戴设备发送查询请求、s604中接收可穿戴设备发送的查询结果的步骤;处理器110可以用于执行s603、s604中根据该用户正在说话的信息判断用户是否正在说话以及s605的步骤。
[0197]
图7示出了本技术实施例提供的可穿戴设备的示意性框图。该可穿戴设备可以包括处理器710和无线通信模块720,该无线通信模块720可以用于执行上述s304中接收电子设备发送的查询请求以及s306中向电子设备发送查询结果的步骤。该处理器710可以用于执行s305中确定用户正在说话的信息的步骤。
[0198]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0199]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0200]
在本技术所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0201]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0202]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
[0203]
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0204]
以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以所述权利要求的保护范围为准。