基于用户习惯的智能家居语音控制方法、系统及存储介质与流程

1.本发明涉及智能家居技术领域，尤其涉及一种基于用户习惯的智能家居语音控制方法、系统及存储介质。

背景技术：

2.当前智能家居语音控制逻辑主要是通过asr(语音转文字)以及nlu(自然语言理解)能力获取用户控制意图，并由云端下发固定的设备逻辑至智能设备。
3.因此，当前智能家居语音控制逻辑无法按照用户维度进行千人千面的定制，参考图1所示，比如用户说“打开空调”的时候，一般由云端统一定义打开的是哪些类型的灯，然后将此逻辑应用于所有试图执行“打开空调”指令的用户意图。而实际生活场景中，用户a的“打开空调”意图与用户b的“打开空调”意图很有可能是不一致的，比如用户a说“打开空调”实际意图是“打开空调至22℃”，而用户b说“打开空调”实际意图是“打开空调至26℃”，这是因为用户a和用户b可能年龄、体质、喜好或生活习惯等不同，用户a喜欢把空调温度开到较低，而用户b则喜欢把空调温度开到较高。

技术实现要素：

4.鉴于上述问题，本发明提供了一种基于用户习惯的智能家居语音控制方法、系统、设备及计算机存储介质，解决智能家居场景下，用户无法根据自己的生活习惯自定义语音控制逻辑的问题。
5.为实现上述技术效果，本发明采用的技术方案为：
6.一方面，本发明提供了一种基于用户习惯的智能家居语音控制方法，所述方法包括首次建立语料库以及后续反复基于所述语料库进行智能家居的语音控制；
7.建立语料库包括：
8.录入用户的声纹信息；
9.收集所述用户对每个语音指令自定义配置的语音控制逻辑，所述语音控制逻辑包括与所述语音指令匹配的目标设备所需执行的目标操作；
10.将所有所述语音指令、对应匹配的语音控制逻辑，与所述用户的声纹信息绑定后上传云端；
11.在云端建立语料库，保存所有用户上传的信息；
12.语音控制包括：
13.接收拾音设备发送的用户语音指令；
14.对所述语音指令进行声纹识别，得到所述用户的声纹信息并上传所述云端；
15.在云端的所述预料库中查询与所述声纹信息相符的所述用户对所述语音指令自定义配置的语音控制逻辑；
16.将所述语音控制逻辑下发至对应的目标设备，供执行所述目标操作。
17.作为优选方案，所述语音控制逻辑还包括与所述语音指令匹配的目标设备的类型
或名称，以及所述目标设备所处空间信息。
18.作为优选方案，在对所述语音指令进行声纹识别后，还对所述语音指令进行asr语音识别以及nlu意图处理，得到所述语音指令的语料信息，所述预料信息至少包括以下一种信息：目标设备的类型或名称；目标设备所处空间；目标操作。
19.另一方面，本发明提供了一种基于用户习惯的智能家居语音控制系统，所述系统包括：
20.声纹管理模块，用于录入用户的声纹信息；
21.语音控制逻辑模块，用于对所述用户的每个语音指令自定义配置对应的语音控制逻辑，所述语音控制逻辑包括与所述语音指令匹配的目标设备所需执行的目标操作；
22.信息传输模块，用于将所有所述语音指令、对应匹配的语音控制逻辑，与所述用户的声纹信息绑定后上传云端，存入语料库；
23.声纹识别模块，用于对拾音设备发送的用户语音指令进行声纹识别，得到所述用户的声纹信息并通过所述信息传输模块上传所述云端；
24.逻辑查询模块，用于在所述云端的所述预料库中查询与所述声纹信息相符的所述用户对所述语音指令自定义配置的语音控制逻辑，并通过所述信息传输模块将所述语音控制逻辑下发至对应的目标设备，供执行所述目标操作。
25.作为优选方案，所述语音控制逻辑还包括与所述语音指令匹配的目标设备的类型或名称，以及所述目标设备所处空间信息。
26.作为优选方案，所述系统还包括asr语音识别模块，用于将所述用户的语音指令转换为文字。
27.作为优选方案，所述系统还包括nlu自然语言理解模块，用于对所述asr语音识别模块识别的结果进行理解与处理，得到所述语音指令的语料信息，所述预料信息至少包括以下一种信息：目标设备的类型或名称；目标设备所处空间；目标操作。
28.再一方面，本发明提供了一种计算机存储介质，其上存储有计算机程序，其中，该程序被处理器执行时实现如上所述的智能家居语音控制方法的步骤。
29.与现有技术相比，本发明的有益效果包括：
30.本发明从实际生活场景出发，针对不同用户在不同场景下的同一句语言表达所对应的真实意图可能不一样的情况，通过将语音控制家居设备的逻辑由原来的统一下发改为按照用户维度隔离，每个用户根据各自的语言表达习惯可定制专属设备控制逻辑。实现在当前nul技术尚未能完全精准识别用户意图的前提下，将语音控制家居设备的逻辑由过去的千人一面变成千人千面。
附图说明
31.本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：
32.图1为当前智能家居语音控制逻辑的系统架构图。
33.图2为本发明实施例的基于用户习惯的智能家居语音控制方法的系统架构图。
34.图3为本发明实施例的智能家居语音控制方法中建立语料库的步骤流程图。
35.图4为本发明实施例的智能家居语音控制方法中语音控制的步骤流程图。
36.图5为本发明实施例的基于用户习惯的智能家居语音控制系统的结构框图。
具体实施方式
37.为使本发明的目的、特征和优点能够更加明显易懂，下面结合附图对本发明的具体实施方式做详细的说明。附图中给出了本发明的若干实施例。但是，本发明可以以许多不同的形式来实现，并不限于本文所描述的实施例。相反地，提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
38.本发明实施例中的术语解释如下：
39.asr：automatic speech recognition(自动语音识别技术)，是一种将人的语音转换为文本的技术。
40.nlp：natural language processing(自然语言处理)，是使用自然语言同计算机进行通讯的技术。研究用电子计算机模拟人的语言交际过程，使计算机能理解和运用人类社会的自然语言如汉语、英语等，实现人机之间的自然语言通信，以代替人的部分脑力劳动，包括查询资料、解答问题、摘录文献、汇编资料以及一切有关自然语言信息的加工处理。
41.本发明提供一种基于用户习惯的智能家居语音控制方法，应用在智慧家庭生态系统中，所述智慧家庭生态系统包括智能家居应用(app)、语音采集设备和多个智能家居设备，语音采集设备与智能家居应用之间通过无线或有线的方式进行通讯，智能家居设备与智能家居应用之间也通过无线或有线的方式进行通讯，当用户想要通过语音控制某个智能家居设备时，用户发出语音信息，然后由语音采集设备采集用户发出的语音信息，当语音采集设备采集到用户发出的语音信息时，将该语音信息发送给智能家居应用。
42.本发明实施例中提供了一种基于用户习惯的智能家居语音控制方法及系统，系统用于实现该智能家居语音控制方法，可以理解的是，该系统即为上述智能家居应用(app)，本实施例中的语音采集设备采用拾音设备(智能音箱、语音助手等)。
43.请参照图2～4所示，本发明实施例中提供了一种基于用户习惯的智能家居语音控制方法，该方法包括首次建立语料库以及后续反复基于该语料库进行智能家居的语音控制；
44.其中，建立语料库的过程，包括以下步骤：
45.步骤s11：录入用户的声纹信息；
46.具体地，在该步骤中，可以使用电声学仪器来对用户的声音进行声纹识别，声纹信息同指纹一样具有身份识别的作用。根据预设的语音识别算法，可以识别语音指令中用户的声纹信息。
47.步骤s12：收集用户对每个语音指令自定义配置的语音控制逻辑，每个语音控制逻辑包括与对应语音指令匹配的目标设备所需执行的目标操作；
48.具体地，在该步骤中，用户在系统中根据自身生活习惯自定义配置每个语音指令所需执行的对应目标设备类型或者设备id，其中目标设备类型或id为目标智能家居设备的类型或id，目标操作是通过该用户的语音指令控制该目标智能家居设备所执行的操作；与上一步骤中该用户在系统中录入的声纹信息进行绑定，可以用于后续通过声纹识别不同用户并找到对应的自定义配置的语音控制逻辑。如用户a可设置语音指令“打开灯”的语音控制逻辑为“打开所有吸顶灯”；用户b设置语音指令“打开灯”的语音控制逻辑为“打开玄关
灯”。
49.步骤s13：将所有语音指令、对应匹配的语音控制逻辑，与用户的声纹信息绑定后上传云端；
50.步骤s14：在云端建立语料库，保存所有用户上传的信息；
51.其次，基于上述已建立的语料库进行智能家居的语音控制的过程，包括以下步骤：
52.步骤21：接收拾音设备发送的用户语音指令；
53.需要说明的是，拾音设备可以为智能音箱、语音助手等，在拾音设备登录系统后，在系统上自动存储对应拾音设备的信息，包括id信息、所在空间信息等，因此当系统获取到该拾音设备的语音指令时，可以自动识别出该拾音设备所在空间信息，从广义上来说，就是在获取语音指令的同时也获取了拾音设备所在空间信息。用户语音指令例如用户说“打开灯”、“打开空调”、“打开电视”，而其中的“灯”、“空调”、“电视”应当是具有智能控制能力的智能家居设备。
54.步骤22：对该语音指令进行声纹识别，得到该用户的声纹信息并上传云端；
55.进一步地，在该步骤中，在对该语音指令进行声纹识别后，还可以对该语音指令进行asr语音识别以及nlu意图处理，得到该语音指令的语料信息，该预料信息至少包括以下一种信息：目标设备的类型或名称；目标设备所处空间；目标操作。
56.步骤23：在云端已经建立的上述预料库中查询与该声纹信息相符的用户对该语音指令自定义配置的语音控制逻辑；
57.比如：当识别的声纹信息属于用户a，asr语音识别以及nlu意图处理后得到用户a的语音指令的内容是“打开灯”，此时就可以在语料库中查询到该用户a的该语音指令“打开灯”所对应的自定义配置的语音控制逻辑“打开所有吸顶灯”。
58.步骤24：将该语音控制逻辑下发至对应的目标设备，供执行该目标操作。
59.请参考图5所示，本发明实施例提供了一种基于用户习惯的智能家居语音控制系统，该系统包括：
60.声纹管理模块31，用于录入用户的声纹信息；
61.语音控制逻辑模块32，用于对该用户的每个语音指令自定义配置对应的语音控制逻辑，该语音控制逻辑包括与该语音指令匹配的目标设备所需执行的目标操作；
62.信息传输模块33，用于将所有所有语音指令、对应匹配的语音控制逻辑，与用户的声纹信息绑定后上传云端，存入语料库；
63.声纹识别模块34，用于对拾音设备发送的用户语音指令进行声纹识别，得到该用户的声纹信息并通过信息传输模块33上传云端；
64.逻辑查询模块35，用于在云端的语料库中查询与声纹信息相符的该用户对该语音指令自定义配置的语音控制逻辑，并通过信息传输模块33将该语音控制逻辑下发至对应的目标设备，供执行目标操作。
65.其中，语音控制逻辑32进一步还可包括与语音指令匹配的目标设备的类型或名称(id)，以及目标设备所处空间信息(有时可通过拾音设备所处位置信息获取)。
66.进一步地，本实施例的基于用户习惯的智能家居语音控制系统还可包括：asr语音识别模块36和nlu自然语言理解模块37。其中，asr语音识别模块36，利用ai能力，用于将该用户的语音指令转换为文字；nlu自然语言理解模块37，利用ai能力，用于对asr语音识别模
块36识别的结果进行理解与处理，得到语音指令的语料信息，该语料信息至少包括以下一种信息：目标设备的类型或名称；目标设备所处空间；目标操作。
67.此外，本发明的实施例还提供一种计算机存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述各实施例的方法的步骤。
68.本发明从实际生活场景出发，针对不同用户在不同场景下的同一句语言表达所对应的真实意图可能不一样的情况，通过将语音控制家居设备的逻辑由原来的统一下发改为按照用户维度隔离，每个用户根据各自的语言表达习惯可定制专属设备控制逻辑。实现在当前nul技术尚未能完全精准识别用户意图的前提下，将语音控制家居设备的逻辑由过去的千人一面变成千人千面。
69.以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。另外，本发明中未涉及部分均与现有技术相同或可采用现有技术加以实现。