首页 > 乐器声学 专利正文
一种智能设备的唤醒方法、装置、设备及存储介质与流程

时间:2022-01-23 阅读: 作者:专利查询

一种智能设备的唤醒方法、装置、设备及存储介质与流程

1.本技术涉及计算机技术领域,更具体地,涉及一种智能设备的唤醒方法、装置、设备及存储介质。


背景技术:

2.目前,智能设备语音唤醒十分普遍,无论是手机、智能家居还是汽车,都有采用语音唤醒的方式来对设备操作的应用。现有技术一般是预设置一套标准的唤醒词在相关设备或软件中,而不同的用户有不同的用语习惯,这样使得用户对智能设备的操作不方便。因此,在现有技术中,智能设备的唤醒,存在用户体验不佳的问题。


技术实现要素:

3.本发明提出了一种智能设备的唤醒方法、装置、设备及存储介质,以改善上述问题。
4.第一方面,本技术实施例提供了一种智能设备的唤醒方法,该方法包括:当检测到用户对智能设备的操作意图时,获取预先确定的第一唤醒词库和第二唤醒词库;接收语音指令,并将语音指令与第一唤醒词库和第二唤醒词库分别进行匹配;若语音指令与第一唤醒词库或第二唤醒词库匹配,唤醒智能设备。
5.第二方面,本技术实施例还提供了一种智能设备的唤醒装置,该装置包括:词库获取模块、语音获取模块以及设备唤醒模块。其中,词库获取模块用于在检测到用户对智能设备的操作意图时,获取预先确定的第一唤醒词库和第二唤醒词库;语音获取模块用于获取语音指令,并将语音指令与第一唤醒词库和第二唤醒词库分别进行匹配;设备唤醒模块用于在语音指令与第一唤醒词库或者第二唤醒词库匹配时,唤醒智能设备。
6.第三方面,本技术实施例还提供了一种电子设备,包括:一个或多个处理器、存储器、摄像头以及一个或多个应用程序。其中,所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置执行以实现如上述第一方面所述的方法。
7.第四方面,本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有程序代码,所述程序代码可被处理器调用执行如上述第一方面所述的方法。
8.本发明提供的技术方案,通过当检测到用户对智能设备的操作意图时,动态为识别到的用户添加与用户的身份信息对应的第二唤醒词库,接收用户的语音指令,基于预先确定的第一唤醒词库和第二唤醒词库匹配语音指令,若语音指令与第一唤醒词库或第二唤醒词库匹配,唤醒智能设备。因此,通过上述方法,可以动态为识别到的用户添加与其对应的唤醒词,使用户唤醒智能设备更加方便,从而提升用户的体验感。
附图说明
9.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
10.图1示出了本技术一实施例提出的一种智能设备的唤醒方法的流程示意图一;
11.图2示出了本技术的图1所示的实施例提供的一种智能设备的唤醒方法的步骤s110的流程示意图;
12.图3示出了本技术的图1所示的实施例提供的一种智能设备的唤醒方法的流程示意图二;
13.图4示出了本技术另一实施例提出的一种智能设备的唤醒方法的流程示意图;
14.图5示出了本技术另一实施例提出的一种智能设备的唤醒方法的流程示意图;
15.图6示出了本技术一实施例提出的一种智能设备的唤醒装置的结构框图;
16.图7示出了本技术一实施例提出的一种电子设备的结构框图;
17.图8示出了本技术一实施例提出的一种计算机可读存储介质的结构框图。
具体实施方式
18.下面详细描述本技术的实施方式,实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性地,仅用于解释本技术,而不能理解为对本技术的限制。
19.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
20.目前,语音唤醒技术具有广泛的应用领域,可以应用于例如机器人、手机、可穿戴设备、智能家居、车载等智能设备。语音唤醒技术作为人和智能设备互动的一个开始或入口,为智能化生活带来了无限的可能。
21.相关技术中,已出现利用特定语音指令唤醒智能设备的应用,唤醒智能设备的同时执行指令操作。例如,通过在设备或软件中预置唤醒词,当用户发出该语音指令时,设备从休眠状态中被唤醒,以响应控制指令,提高了人机交互的效率。不过现有技术一般是预置一套标准的唤醒词在设备或软件中来唤醒智能设备,有时可能会因为唤醒词较长,不符合用户的用语习惯,导致用户对智能设备的体验感不佳;例如,不同年龄段的用户有不同的用语习惯,不同用户使用一套标准的唤醒词唤醒智能设备,使得用户对智能设备的操作不方便。然而,添加过多的唤醒词,一方面会增大智能设备唤醒模块性能的消耗,另一方面,这些唤醒词大多是用户自定义,没有深度训练的数据集做支持,使得智能设备的误唤醒概率极高,最后也会使得用户对智能设备的体验不佳。
22.为了缓解上述问题,本技术的发明人提出了本技术提供的一种智能设备的唤醒方法、装置、设备及存储介质。通过当检测到用户对智能设备的操作意图时,动态为识别到的用户添加与用户的身份信息对应的第二唤醒词库,接收用户的语音指令,基于预先确定的
第一唤醒词库和第二唤醒词库匹配语音指令,若语音指令与第一唤醒词库或第二唤醒词库匹配,唤醒智能设备。因此,采用本技术的上述方法、装置、设备及存储介质,可以改善用户对智能设备的体验感。
23.下面将结合附图具体描述本技术的各实施例。请参阅图1,本技术一实施例提供了一种智能设备的唤醒方法,可应用于具有语音唤醒功能的智能设备,本实施例描述的是智能设备侧的步骤流程,所述唤醒方法可以包括步骤s110至步骤s130。
24.步骤s110:当检测到用户对所述智能设备的操作意图时,获取预先确定的第一唤醒词库和第二唤醒词库。
25.其中,所述智能设备可以有多种工作模式,例如休眠模式、唤醒模式、关机模式等。可以理解的是,在智能设备未被唤醒时,智能设备可处于休眠状态。在休眠状态下,智能设备可以用摄像头采集周围环境信息,也可以用语音模块监听周围的语音指令来检测用户对智能设备的操作意图。
26.在一些实施方式中,检测用户对所述智能设备的操作意图可以是,利用红外线技术检测、距离传感器检测、声波技术检测用户到达智能设备的距离或者根据摄像头采集到的图像计算用户到达智能设备的距离是否在预设距离范围内;若是,则确认该用户有操作所述智能设备的意图。
27.示例性的,智能设备利用摄像头检测用户对所述智能设备的操作意图,对比摄像头预览的照片中用户身体所占的比例,基于比例的大小,可以判断该用户操作智能设备的意图,当摄像头预览的照片中用户身体所占的比例满足预设比例时,则确认该用户有操作智能设备的意图。
28.在一些实施方式中,智能设备通过摄像头检测用户的手势是否满足预设手势,或者用户的姿势是否满足预设姿势,若是,则确认该用户有操作智能设备的意图;智能设备通过拾音设备检测周围声音的信噪比是否在预设信噪比范围内,若声音的信噪比在预设信噪比范围内,则确认该用户有操作智能设备的意图。
29.所述预设距离、预设比例、预设手势、预设姿势以及预设信噪比为预先设置好的,具体可以通过第三方实验数据得到。
30.应当理解,在本技术实施例提供的唤醒方法中,第一唤醒词库与第二唤醒词库不同,第一唤醒词库与第二唤醒词库分别包括多个唤醒词以及每个唤醒词对应的初始置信度阈值。其中,第一唤醒词库与第二唤醒词库可以存储于智能设备/服务器的存储器中,也可以存储于与智能设备相关联的云端。例如,第一唤醒词库为标准唤醒词库,第二唤醒词库为快捷唤醒词库,或者,第二唤醒词库为与用户对应的个性化唤醒词库,在此不作限制。
31.请参阅图2,在本技术一实施例提供的唤醒方法的步骤s110可以包括:
32.步骤s112:当检测到用户对所述智能设备的操作意图时,获取所述用户的身份信息。
33.其中,获取所述用户的身份信息可以是通过摄像头或者指纹采集器获取用户的生物信息,例如,通过摄像头采集面部信息或者瞳孔信息,通过指纹采集器采集指纹信息等,从而获取与生物信息对应的用户的身份信息;也可以是通过声音传感器,通过分析采集到的用户的声音的波形信息、音色信息,从而获取与波形信息以及音色信息对应的用户的身份信息。
34.步骤s114:获取预先确定的第一唤醒词库和与所述身份信息对应的第二唤醒词库。
35.在一些实施方式中,获取预先确定的第一唤醒词库可以是,从智能设备的存储器中获取预先存储的第一唤醒词库;也可以是利用互联网技术从与智能设备相关联的云端下载预先确定的第一唤醒词库。获取与所述身份信息对应的第二唤醒词库可以是,从智能设备的存储器中获取与身份信息对应的第二唤醒词库;也可以是利用互联网技术从与智能设备相关联的云端下载与身份信息对应的第二唤醒词库。下载第一唤醒词库/第二唤醒词库运用到的传输协议可以是http协议、ndp协议、stride协议、ltl协议和传统tcp协议中的任意一种;利用zigbee技术、蓝牙技术或者wifi技术中的任意一种技术从与智能设备相关联的云端或者电子设备下载第一唤醒词库及与身份信息对应的第二唤醒词库。
36.在一些实施方式中,所述第一唤醒词库包括:目前智能设备唤醒技术中普遍使用的标准唤醒词、标准唤醒词对应的标准音频、每个标准唤醒词对应的初始置信度阈值。
37.在一些实施方式中,所述第二唤醒词库可以是,通过第三方实验数据得来的与用户身份信息对应的唤醒词库,应当理解,不同用户对应的唤醒词库可以相同也可以不同。例如,儿童和成年人的唤醒词库不同;用语习惯不同的人对应的唤醒词库也不同。所述第二唤醒词库的内容包括:根据用户的用语习惯以及所述用户操作的设备分析出的所述用户常用的唤醒词、所述唤醒词对应的标准音频以及初始置信度阈值。
38.在一些实施方式中,获取预先确定的第一唤醒词库和第二唤醒词库之后,智能设备可以提示用户使用第二唤醒词库的唤醒词唤醒智能设备,提示可以采用声音、显示、灯光闪烁等方式。
39.步骤s120:接收语音指令,并将所述语音指令与所述第一唤醒词库和所述第二唤醒词库分别进行匹配。
40.其中,语音指令可以是由具有识别语音功能的器件或模块采集,如可以是由无线话筒、麦克风、功放模块、控制器、传输器以及识别系统等中的一种或多种构成。在一些实施方式中,智能设备通过自带的拾音设备(如麦克风)从周围环境中拾取语音指令。在另一些实施方式中,智能设备也可以从其他设备处获取语音指令。示例性的,智能设备从外设拾音设备拾取语音指令后,将语音指令发送至智能设备,从而智能设备获取到语音指令。
41.在一些实施方式中,语音指令与第一唤醒词库和第二唤醒词库分别进行匹配,包括:分析语音指令包含的音频,将音频分别与第一唤醒词库和第二唤醒词库的唤醒词对应的标准音频以及对应的初始置信度阈值进行匹配。
42.步骤s130:若所述语音指令与所述第一唤醒词库或所述第二唤醒词库匹配,唤醒所述智能设备。
43.在本技术实施例提供的唤醒方法中,语音指令与第一唤醒词库或第二唤醒词库匹配,包括语音指令与第一唤醒词库或第二唤醒词库的唤醒词、唤醒词对应的标准音频以及唤醒词对应的初始置信度阈值都匹配。
44.作为一种实施方式,语音指令包含的音频与第一唤醒词库中的唤醒词的标准音频的相似度大于或等于该唤醒词对应的初始置信度阈值,则语音指令与第一唤醒词库匹配,唤醒智能设备。
45.作为另一种实施方式,语音指令包含的音频与第二唤醒词库中的唤醒词的标准音
频的相似度大于或等于该唤醒词对应的初始置信度阈值,则语音指令与第二唤醒词库匹配,唤醒智能设备。
46.需要说明的是,语音指令的内容可以只包括唤醒智能设备的指令,也可以是包括唤醒智能设备的指令以及执行其他操作的设备控制指令的混合指令。例如,当第二唤醒词库中的唤醒词包括设备控制指令时,若语音指令的内容与第二唤醒词库中包括设备控制指令的唤醒词匹配,既要执行唤醒操作,也要进行设备功能控制操作,即,在完成唤醒后,还可以检测语音指令中是否包括控制指令,若包括,则执行控制指令对应的操作,如开灯、关灯、播放音乐、开窗帘、开空调以及回家模式等操作。可选地,智能设备与其他智能家居设备可以通过网络进行通信连接。可选地,所述网络通常为因特网、但也可以是任何网络,包括但不限于局域网、城域网、广域网、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合。
47.在一些实施方式中,当语音指令与第二唤醒词库匹配时,智能设备查找第二唤醒词库中与语音指令匹配的唤醒词,并更新第二唤醒词库中唤醒词对应的使用频次,将更新后的第二唤醒词库发送至关联的存储设备。所述关联的存储设备可以包括获得第二唤醒词库的设备以及其他与智能设备关联的设备。
48.本实施例提供的一种智能设备的唤醒方法,当检测到用户对智能设备的操作意图时,获取预先确定的第一唤醒词库和与用户的身份信息对应的第二唤醒词库;接收语音指令,并将语音指令与第一唤醒词库和第二唤醒词库分别进行匹配;若语音指令与第一唤醒词库或第二唤醒词库匹配,唤醒智能设备。通过在满足一定条件时才动态获取第二唤醒词库供用户进行唤醒操作,从而使得用户可以根据自身习惯对智能设备进行快捷唤醒,提高用户对智能设备的体验感。
49.请参阅图3,在本技术另一实施例提出的一种智能设备的唤醒方法中,所述唤醒所述智能设备之后,所述方法还包括:
50.步骤s140:当检测到所述用户对所述智能设备的操作意图消失时,将获取的所述第二唤醒词库移除。
51.在一些实施方式中,检测用户对所述智能设备的操作意图,可以利用红外线技术检测、距离传感器检测、声波技术检测所述用户到达智能设备的距离或者根据摄像头采集到的图像计算所述用户到达智能设备的距离是否超过预设距离,若是,则确认该用户对所述智能设备的操作意图消失;也可以是通过摄像头检测所述用户的手势是否满足预设结束操作手势或者姿势是否满足预设结束操作姿势,若是,则确认该用户对所述智能设备的操作意图消失;还可以是通过拾音设备检测周围声音的信噪比是否在预设结束操作信噪比范围内,若是,则确认该用户对所述智能设备的操作意图消失。
52.需要说明的是,在获取到第二唤醒词库后,会对第二唤醒词库进行缓存,然而,若检测到所述用户对所述智能设备的操作意图消失,则缓存的第二唤醒词库需要被释放,从而减少资源占用。即,将获取的第二唤醒词库移除,使用户只能基于第一唤醒词库进行唤醒操作。所述移除可以是将第二唤醒词库从缓存中删除,也可以是将第二唤醒词库清空,在此不作限制。
53.请参阅图4,本技术另一实施例提供出的一种智能设备的唤醒方法,包括步骤s210至步骤s250。
54.步骤s210:当检测到用户对所述智能设备的操作意图时,获取预先确定的第一唤醒词库和第二唤醒词库。
55.步骤s220:接收语音指令,提取所述语音指令中的关键词并确定所述关键词对应的置信度。
56.在一些实施方式中,提取所述语音指令中的关键词可以是,使用自然语言处理(nlp)、textrank算法、ie(信息提取)、pagerank算法、工作流(asw)等方法提取关键词。
57.示例性的,通过工作流(asw)进行语音指令关键词提取的操作,工作原理:异步调用语音识别(asr)能力进行离线语音文字识别,并采用轮询(check)方式等待语音识别任务执行结束;将语音识别的结果传递给关键词提取任务,输出提取出的关键词。
58.在一些实施方式中,在提取出语音指令中的关键词后,将关键词分别与第一唤醒词库和第二唤醒词库中的唤醒词匹配,匹配的顺序可以是按照唤醒词对应的使用频次的排序结果、唤醒词的字符长度的排序结果、唤醒词的字符音节顺序的排序结果等。
59.示例性的,关键词与第一唤醒词库和第二唤醒词库中的唤醒词的匹配顺序可以是将唤醒词对应的使用频次按照高的在前的顺序进行排序,关键词按照所述排序结果与唤醒词进行匹配,排序越靠前,用户使用的频率越高,语音指令中的关键词与唤醒词匹配的概率就越大,在一定程度上可以提高关键词匹配效率,从而提高语音唤醒的效率。
60.示例性的,关键词与第一唤醒词库和第二唤醒词库中的唤醒词的匹配顺序可以是将唤醒词的字符长度按照短的在前的顺序进行排序,关键词按照所述排序的结果与唤醒词进行匹配,排序越靠前,唤醒词越简短,用户操作越方便,语音指令中的关键词与唤醒词匹配的概率就越大,在一定程度上可以提高关键词匹配效率,从而提高语音唤醒的效率。
61.作为一种实施方式,确定关键词对应的置信度可以是,计算语音指令中关键词对应的音频与目标唤醒词的标准音频的相似度,所述相似度可以理解为所述关键词对应的置信度。
62.步骤s230:从所述第一唤醒词库或所述第二唤醒词库中筛选出与所述关键词对应的目标唤醒词及该目标唤醒词对应的目标置信度阈值。
63.具体的,在一些实施方式中,第一唤醒词库可以包括:目前智能设备唤醒技术中普遍使用的标准唤醒词、标准唤醒词对应的标准音频、每个标准唤醒词对应的初始置信度阈值及每个标准唤醒词在不同使用频次下对应的预设置信度阈值调整系数;第二唤醒词库中包括:每个唤醒词的使用频次以及每个唤醒词在不同使用频次下对应的预设置信度阈值调整系数。
64.在接收语音指令之前,智能设备可以根据第一唤醒词库和第二唤醒词库中各唤醒词的使用频次、初始置信度阈值以及预设置信度阈值调整系数,获得各唤醒词的置信度阈值。从而可以执行上述步骤s230以得到与所述关键词对应的目标唤醒词及该目标唤醒词对应的目标置信度阈值。
65.其中,预设置信度阈值调整系数用于修正唤醒词的置信度阈值,唤醒词的使用频次越高,对应的预设置信度阈值调整系数越小,相应的,该当使用该唤醒词执行唤醒操作时,智能设备越容易被唤醒。可以理解的是,当某个唤醒词的使用频次很高时,说明用户经常需要通过该唤醒词唤醒智能设备,因此,需要提高用户的使用体验。
66.示例性的,用户使用唤醒词a、唤醒词b、唤醒词c的使用频次最高,使用频次依次为
f1,f2,f3,其中f1》f2》f3,其中,对于使用频次排序前三的唤醒词对应的预设置信度阈值调整系数分别为0.8,0.9,1,唤醒词a、唤醒词b、唤醒词c的初始置信度阈值分别为s1,s2,s3,根据所述使用频次的排序结果与所述预设置信度阈值调整系数的对应关系,利用如下计算式对以上三个唤醒词的置信度阈值进行修正,获得三个唤醒词的目标置信度阈值s1’,s2’,s3’:
67.s1’=s1*0.8;
68.s2’=s2*0.9;
69.s3’=s3。
70.以上,通过根据各唤醒词的使用频次确定其对应的置信度阈值调整系数,以对初始置信度阈值进行修正,从而降低使用频次较高的唤醒词对应的置信度阈值,使智能唤醒设备更容易被唤醒。
71.需要说明的是,调整唤醒词的置信度阈值的步骤可以在接收语音指令前完成,也可在接收完语音指令后进行,在此不作限制。
72.步骤s240:若所述关键词对应的置信度大于或等于所述目标唤醒词对应的目标置信度阈值,则所述语音指令与所述第一唤醒词库或所述第二唤醒词库匹配。
73.在一些实施方式中,在筛选出与关键词对应的唤醒词并确认所述唤醒词为目标唤醒词时,计算出的语音指令中关键词对应的音频与目标唤醒词的标准音频的相似度,可以理解为所述关键词的置信度。
74.作为一种实施方式,关键词与第一唤醒词库中或第二唤醒词库中的唤醒词匹配,同时在筛选出与关键词对应的唤醒词并确认所述唤醒词为目标唤醒词时,计算出语音指令中关键词对应的音频与第一唤醒词库或第二唤醒词库中的所述目标唤醒词的标准音频的相似度;当所述相似度大于或等于所述目标唤醒词对应的目标置信度阈值,则所述语音指令与所述第一唤醒词库或第二唤醒词库匹配,唤醒所述智能设备。
75.在一些实施方式中,在基于第二唤醒词库中的目标唤醒词唤醒智能设备后,更新目标唤醒词的使用频次,并更新第二唤醒词库,将更新后的第二唤醒词库发送至关联的存储设备。关联的存储设备可以包括获得第二唤醒词库的设备以及其他与智能设备关联的设备。
76.在一些实施方式中,所述唤醒智能设备之后,所述方法还包括:
77.步骤s250:当检测到所述用户对所述智能设备的操作意图消失时,将获取的所述第二唤醒词库移除。
78.其中,步骤s250的具体实施方式与前述实施例中步骤s140的具体实施方式大致相同,在此不作赘述。
79.本实施例提供的一种智能设备的唤醒方法,当检测到用户对智能设备的操作意图时,获取预先确定的第一唤醒词库和与用户的身份信息对应的第二唤醒词库;接收语音指令,提取语音指令中的关键词并计算关键词的置信度;若关键词与第一唤醒词库或第二唤醒词库匹配,且置信度大于或等于所述关键词对应的唤醒词的置信度阈值,唤醒智能设备。通过在满足一定条件时才动态获取第二唤醒词库同时调整用户使用频次高的唤醒词的置信度阈值供用户进行唤醒操作,从而使得用户可以根据自身习惯对智能设备进行快捷唤醒,提高用户对智能设备的体验感。
80.请参阅图5,本技术另一实施例提出的一种智能设备的唤醒方法,包括步骤s310至步骤s390。
81.步骤s310:当检测到用户对所述智能设备的操作意图时,获取预先确定的第一唤醒词库和第二唤醒词库。
82.步骤s320:接收语音指令,提取所述语音指令中的关键词并确定所述关键词对应的置信度。
83.步骤s330:根据所述第一唤醒词库和所述第二唤醒词库,生成目标唤醒词库,所述目标唤醒词库包括多个唤醒词以及每个所述唤醒词对应的初始置信度阈值及使用频次。
84.应当理解,在本技术实施例提供的唤醒方法中,第一唤醒词库与第二唤醒词库不同,所述根据所述第一唤醒词库和所述第二唤醒词库,生成目标唤醒词库可以是,直接将第一唤醒词库和第二唤醒词库合并,生成目标唤醒词库,即,所述目标唤醒词库包括的多个唤醒词以及每个唤醒词对应的初始置信度阈值及使用频次分别为第一唤醒词库与第二唤醒词库分别包括的多个唤醒词以及每个唤醒词对应的初始置信度阈值及使用频次。例如,第一唤醒词库为标准唤醒词库,第二唤醒词库为快捷唤醒词库,或者,第二唤醒词库为与用户对应的唤醒词库,通过对第一唤醒词库和第二唤醒词库进行去重合并,生成目标唤醒词库,所述目标唤醒词库包括所述标准唤醒词库与所述快捷唤醒词库或者与用户对应的唤醒词库的内容。
85.步骤s340:获取所述多个唤醒词对应的使用频次,基于使用频次对所述多个唤醒词进行排序。
86.步骤s350:根据排序结果与预设置信度阈值调整系数的对应关系,确定每个所述唤醒词对应的预设置信度阈值调整系数。
87.步骤s360:获取每个所述唤醒词的初始置信度阈值,基于所述初始置信度阈值及所述预设置信度阈值调整系数,确定每个所述唤醒词的目标置信度阈值。
88.需要说明的是,唤醒词的使用频次越高,对应的预设置信度阈值调整系数越小。当某个唤醒词的使用频次很高时,说明用户经常需要通过该唤醒词唤醒智能设备,通过根据各唤醒词的使用频次确定其对应的置信度阈值调整系数,以对初始置信度阈值进行修正,从而降低使用频次较高的唤醒词对应的置信度阈值,使智能唤醒设备更容易被唤醒。具体实施方式参见前述实施例,在此不作赘述。
89.需要说明的是,本实施例对步骤s330至s360与步骤s320的执行顺序不作限制,即,步骤s320可在步骤s360后执行,也可在步骤s330前执行,在此不作赘述。
90.步骤s370:从所述目标唤醒词库中查找与所述关键词对应的目标唤醒词及对应的目标置信度阈值。
91.步骤s380:若所述关键词对应的置信度大于或等于所述目标唤醒词对应的目标置信度阈值,则所述语音指令与所述第一唤醒词库或所述第二唤醒词库匹配。
92.作为一种实施方式,关键词与目标唤醒词库中的唤醒词匹配,从目标唤醒词库中筛选出所述唤醒词,确认所述唤醒词为目标唤醒词、所述唤醒词对应的置信度阈值为目标置信度阈值,计算出所述语音指令中所述关键词对应的音频与目标唤醒词库中的所述目标唤醒词的标准音频的相似度;当所述相似度大于或等于所述目标唤醒词对应的目标置信度阈值,则所述语音指令与第一唤醒词库或第二唤醒词库匹配匹配,唤醒智能设备。
93.在基于第二唤醒词库中的唤醒词唤醒智能设备后,更新所述唤醒词的使用频次,并更新第二唤醒词库,将更新后的第二唤醒词库发送至关联的存储设备。关联的存储设备可以包括获得第二唤醒词库的设备以及其他与智能设备关联的设备。
94.在一些实施方式中,所述唤醒所述智能设备之后,所述方法还包括:
95.步骤s390:当检测到所述用户对所述智能设备的操作意图消失时,将获取的所述第二唤醒词库移除。
96.以本技术提供一种内置摄像头的超级智能开关为例进行说明,该超级智能开关的处理器存储有上述智能设备的唤醒方法对应的软件程序,该超级智能开关的唤醒过程如下:
97.超级智能开关的摄像头可以在采集到的图像包括用户图像时,计算采集到的图像中用户身体在整个图像中所占比例的大小,当所述比例满足预设比例时,则确认该用户有操作超级智能开关的意图,摄像头获取该用户的面部信息识别出所述用户的身份信息,超级智能开关通过无线网络技术从与超级智能开关相关联的云端获取与所述身份信息对应的的第二唤醒词库,根据第二唤醒词库与超级智能开关预先设置的的第一唤醒词库生成目标唤醒词库;目标唤醒词库包括多个唤醒词、多个预设置信度阈值调整系数以及每个唤醒词对应的初始置信度阈值和使用频次,根据唤醒词对应的使用频次对唤醒词进行排序,根据排序结果与预设置信度阈值调整系数的对应关系,确定每个唤醒词对应的预设置信度阈值调整系数;根据每个目标唤醒词对应的初始置信度阈值和预设置信度阈值调整系数,获得每个唤醒词的置信度阈值,同时语音提示所述用户可以基于目标唤醒词库唤醒超级智能开关。
98.当所述用户发出语音指令时,超级智能开关通过麦克风采集语音指令,并利用nlp(自然语言处理)技术处理语音指令,提取出语音指令的关键词,将关键词按照唤醒词对应的使用频次多的在先匹配的顺序与唤醒词进行匹配,并计算语音指令中关键词的音频与唤醒词对应的标准音频的相似度,确定关键词的置信度,若关键词对应的置信度大于或等于确定关键词的该置信度的唤醒词对应的置信度阈值,则语音指令与所述第一唤醒词库或第二唤醒词库匹配,唤醒超级智能开关。
99.当基于第二唤醒词库的唤醒词唤醒超级智能开关后,超级智能开关查找第二唤醒词库中与语音指令匹配的唤醒词,并更新第二唤醒词库中唤醒词对应的使用频次,将更新后的第二唤醒词库发送至获得第二唤醒词库的云端。
100.在唤醒超级智能开关后,当超级智能开关的摄像头采集到的图像中所述用户的身体在整个图像中所占的比例在预设比例范围以外时,则确认用户对超级智能开关结束操作,超级智能开关将获取的第二唤醒词库清空。
101.本实施例提供的一种智能设备的唤醒方法,当检测到用户对智能设备的操作意图时,获取预先确定的第一唤醒词库和与用户的身份信息对应的第二唤醒词库;根据第一唤醒词库和第二唤醒词库生成目标唤醒词库;接收语音指令,提取语音指令中的关键词并确定所述关键词对应的置信度;若所述置信度大于或等于关键词对应的目标唤醒词的目标置信度阈值,则所述语音指令与目标唤醒词库匹配,唤醒智能设备。通过在满足一定条件时才动态获取第二唤醒词库,将第二唤醒词库与第一唤醒词库合并生成目标唤醒词库,并调整目标唤醒词库中唤醒词的置信度阈值供用户进行唤醒操作,从而使得用户可以根据自身习
惯对智能设备进行快捷唤醒,提高用户对智能设备的体验感。
102.请参阅图6,其示出了本发明的一实施例提出的一种智能设备的唤醒装置,所述唤醒装置400包括:词库获取模块410、语音获取模块420以及设备唤醒模块430。具体地,词库获取模块410用于在检测到用户对智能设备的操作意图时,获取预先确定的第一唤醒词库和第二唤醒词库;语音获取模块420用于获取语音指令,并将所述语音指令与所述第一唤醒词库和所述第二唤醒词库分别进行匹配;设备唤醒模块430用于在所述语音指令与所述第一唤醒词库或者所述第二唤醒词库匹配时,唤醒所述智能设备。
103.作为一种实施方式,所述词库获取模块410用于在摄像头检测到用户到所述智能设备的距离在预设距离范围内,且确认所述用户对所述智能设备的操作意图时,获取所述用户的身份信息,通过无线网络技术获取与所述智能设备相关联的存储器中与所述用户的身份信息对应的第二唤醒词库。所述语音获取模块420用于获取利用拾音器采集到的语音指令,提取所述语音指令中的关键词并确定所述关键词对应的置信度;从所述第一唤醒词库或所述第二唤醒词库中筛选出与所述关键词对应的目标唤醒词及对应的目标置信度阈值;若所述关键词对应的置信度大于或等于所述目标唤醒词对应的目标置信度阈值,则所述语音指令与所述第一唤醒词库或所述第二唤醒词库匹配;在所述语音指令与所述第二唤醒词库匹配时更新所述第二唤醒词库,并将更新后的第二唤醒词库传往与所述智能设备相关联的存储器。所述设备唤醒模块430在所述语音指令与所述第一唤醒词库或第二唤醒词库匹配时,唤醒所述智能设备;唤醒所述智能设备后,所述词库获取模块410利用摄像头检测到所述用户到所述智能设备的距离超过所述预设距离时,将所述第二唤醒词库移除。
104.需要说明的是,本说明书的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。对于方法实施例中的所描述的任意的处理方式,在装置实施例中均可以通过相应的处理模块实现,装置实施例中不再一一赘述。
105.请参阅图7,基于上述的一种智能设备的唤醒方法,本技术还提供了另一种包括可以执行前述一种智能设备的唤醒方法的处理器的电子设备500,电子设备500可以是智能控制面板。
106.电子设备500还包括一个或多个处理器510、存储器520、摄像头530以及一个或多个应用程序。其中,该存储器520中存储有可以执行前述实施例中内容的程序,摄像头530可以采集前述实施例中的内容的数据,而处理器510可以执行该存储器520中存储的程序。其中,电子设备500可以是智能控制面板、智能手机、智能穿戴设备、智能语音导航设备、智能机器人、平板电脑、个人计算机等。
107.其中,处理器510可以包括一个或者多个用于处理数据的核以及消息矩阵单元。处理器510利用各种接口和线路连接整个电子设备内的各个部分,通过运行或执行存储在存储器520内的指令、程序、代码集或指令集,以及调用存储在存储器520内的数据,执行电子设备500的各种功能和处理数据。可选地,处理器510可以采用数字信号处理(digitalsignal processing,dsp)、现场可编程门阵列(field-programmable gate array,fpga)、可编程逻辑阵列(programmable logic array,pla)中的至少一种硬件形式来实现。处理器510可集成中央处理器(central processing unit,cpu)、图像处理器
(graphics processingunit,gpu)和调制解调器等中的一种或几种的组合。其中,cpu主要处理操作系统、用户界面和应用程序等;gpu用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器510中,单独通过一块通信芯片进行实现。
108.存储器520可以包括随机存储器(random access memory,ram),也可以包括只读存储器(read-only memory)。存储器520可用于存储指令、程序、代码、代码集或指令集。存储器520可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如接收语音等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储终端在使用中所创建的数据(比如当前环境状态信息、置信度阈值、语音信号)等。
109.摄像头530可以包括镜头部分、led部分、芯片部分、pcb及元件部分,景物通过镜头生成的光学图像投射到图像传感器表面上,然后转为电信号经过a/d转换后变为数字图像信号,再送到数字信号处理芯片中加工处理,在通过usb接口传输到电脑等处理器中。
110.请参阅图8,其示出了本技术实施例提供的一种计算机可读存储介质600的结构框图。该计算机可读存储介质600中存储有程序代码610,所述程序代码610可被处理器调用执行上述方法实施例中所描述的方法。
111.计算机可读存储介质600可以是诸如闪存、eeprom(电可擦除可编程只读存储器)、eprom、硬盘或者rom之类的电子存储器。可选地,计算机可读存储介质600包括非易失性计算机可读介质。计算机可读存储介质600具有执行上述方法中的任何方法步骤的程序代码610的存储空间。这些程序代码610可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码可以例如以适当形式进行压缩。
112.最后应说明的是:以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。