智能设备的控制方法及其装置、智能设备和可读存储介质与流程

1.本技术涉及智能家电技术领域，特别涉及一种智能设备的控制方法及其装置、智能设备和可读存储介质。

背景技术：

2.相关技术中，对于具有语音功能的智能设备，在使用其语音功能时，部分设备通过特定的唤醒词来唤醒设备，然而，由于环境因素可能导致设备无法准确识别唤醒词而使得设备唤醒失败。部分设备则保持语音功能始终开启来监听环境音频，对于这部分设备虽然无需特定的唤醒词来进行唤醒，却对用户的隐私造成一定的困扰，用户体验不佳。

技术实现要素：

3.有鉴于此，本发明旨在至少在一定程度上解决相关技术中的问题之一。为此，本技术的目的在于提供一种智能设备的控制方法及其装置、智能设备和可读存储介质。
4.本技术一种智能设备的控制方法。所述控制方法包括：检测所述智能设备的预定范围内是否存在目标物；在存在所述目标物的情况下，检测所述目标物是否为人物；在所述目标物为人物的情况下，激活语音唤醒功能以使得所述智能设备的语音功能可用。
5.在某些实施方式中，所述检测所述智能设备的预定范围内是否存在目标物包括：根据距离传感器的检测数据检测所述智能设备的预定范围内是否存在目标物。
6.在某些实施方式中，所述检测所述目标物是否为人物包括：根据热红外成像传感器的检测数据检测所述目标物是否为人物。
7.在某些实施方式中，所述检测所述目标物是否为人物包括：根据获取的所述预定范围的图像，检测所述目标物是否为人物。
8.在某些实施方式中，所述在所述目标物为人物的情况下，激活语音唤醒功能以使得所述智能设备的语音功能可用包括：检测所述人物的身份信息是否为预定用户；在所述人物为所述预定用户的情况下，激活语音唤醒功能。
9.在某些实施方式中，所述激活语音唤醒功能以使得所述智能设备的语音功能可用包括：响应于接收到的预设唤醒词，激活所述语音功能；响应于接收到的语音指令，控制所述智能设备执行与所述语音指令对应的操作。
10.在某些实施方式中，所述激活语音唤醒功能以使得所述智能设备的语音功能可用包括：响应于接收到的语音指令，控制所述智能设备执行与所述语音指令对应的操作。
11.本技术还提供一种智能设备的控制装置。所述控制装置包括第一检测模块、第二检测模块和语音唤醒模块。所述第一检测模块用于检测所述智能设备的预定范围内是否存在目标物；所述第二检测模块用于在存在所述目标物的情况下，检测所述目标物是否为人物；所述语音唤醒模块用于在所述目标物为人物的情况下，激活语音唤醒功能以使得所述智能设备的语音功能可用。
12.本技术还提供一种智能设备。所述智能设备包括处理器和存储器，所述存储器用
于存储计算机程序，所述处理器在执行所述计算机程序时上述实施方式中任一项所述的控制方法。
13.本技术还提供一种计算机程序的非易失性计算机可读存储介质。当所述计算机程序被一个或多个处理器执行时，实现上述实施方式中任一项所述的控制方法。
14.本技术的智能设备的控制方法及其装置、智能设备和可读存储介质在检测到智能设备的预设范围内有目标物出现且目标物为人物时，启动语音唤醒功能，如此，用户无需担心智能设备的语音功能模块在后台始终开启监听环境音频的情况发生，也可以减少环境声音对语音模块唤醒的干扰。
15.本技术的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本技术的实践了解到。
附图说明
16.本技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：
17.图1是本技术某些实施方式的智能设备的控制方法的流程示意图；
18.图2是本技术某些实施方式的智能设备的控制装置的结构示意图；
19.图3是本技术某些实施方式的智能设备的控制方法的场景示意图；
20.图4是本技术某些实施方式的智能设备的控制方法的流程示意图；
21.图5是本技术某些实施方式的智能设备的控制装置中第一检测模块的结构示意图；
22.图6是本技术某些实施方式的智能设备的控制方法的流程示意图；
23.图7是本技术某些实施方式的智能设备的控制装置中第二检测模块的结构示意图；
24.图8是本技术某些实施方式的智能设备的控制方法的流程示意图；
25.图9是本技术某些实施方式的智能设备的控制装置中第二检测模块的结构示意图；
26.图10是本技术某些实施方式的智能设备的控制方法的流程示意图；
27.图11是本技术某些实施方式的智能设备的控制装置中语音唤醒模块的结构示意图；
28.图12是本技术某些实施方式的智能设备的控制方法的流程示意图；
29.图13是本技术某些实施方式的智能设备的控制方法的流程示意图；
30.图14是本技术某些实施方式的智能设备的结构示意图；
31.图15是本技术某些实施方式的计算机可读存储介质的结构示意图。
具体实施方式
32.下面详细描述本技术的实施方式，所述实施方式的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的，仅用于解释本技术，而不能理解为对本技术的限制。
33.在本技术的描述中，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗
示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本技术的描述中，“多个”的含义是两个或两个以上，除非另有明确具体地限定。
34.在本技术的描述中，需要说明的是，除非另外写有明确的限定和规定，其中的术语“安装”、“连接”、“相连”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接或可以相互通信；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本技术中的具体含义。
35.下文的公开提供了许多不同的实施方式或例子用来实现本技术的不同结构。为了简化本技术的公开，下文中对特定例子的部件和设置进行描述。当然，它们仅仅为示例，并且目的不在于限制本技术。另外，本技术可以在不同例子中重复参考数字和/或参考字母，这种重复是为了简化和清楚的目的，其本身不指示所讨论各种实施方式和/或设置之间的关系。
36.下面详细描述本技术的实施方式，所述实施方式的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的，仅用于解释本技术，而不能理解为对本技术的限制。
37.请参阅图1，本技术提供一种智能设备的控制方法。该控制方法包括：
38.01：检测智能设备的预定范围内是否存在目标物；
39.02：在存在目标物的情况下，检测目标物是否为人物；
40.03：在目标物为人物的情况下，激活语音唤醒功能以使得智能设备的语音功能可用。
41.请结合图2，本技术还提供一种智能设备的控制装置10。控制装置10包括：第一检测模块11、第二检测模块12和语音唤醒模块13。控制装置10可以内接设置在智能设备内部，也可以与智能设备外接设置。智能设备可以是手机、ipad、电脑等电子设备。
42.步骤11可以由第一检测模块11实现，步骤12可以由第二检测模块12实现，步骤13可以由语音唤醒模块13实现。也即是说，第一检测模块11用于检测智能设备的预定范围内是否存在目标物；第二检测模块12用于在存在目标物的情况下，检测目标物是否为人物；语音唤醒模块13用于在目标物为人物的情况下，激活语音唤醒功能以使得智能设备的语音功能可用。第一检测模块11可以包括距离传感器、接近传感器、红外传感器或其他检测设备。第二检测模块12可以是安装在智能设备上的摄像头，也可以是红外传感器或其他人脸检测设备，以确定目标物是否为人物。
43.具体地，预定范围可以指的是在距离智能设备的前端或后端的一定距离范围内，该距离范围可以是智能设备默认设置的距离值，也可以是用户自定义设置的距离值，在此不作限制。
44.目标物包括人物和动物，即本技术的控制方法在智能设备的存在目标物的情况下，检测目标物为人物还是动物。检测目标物为人物的方式可以为通过前置摄像头或后置摄像头采集智能设备前端或后端的图像，根据采集的图像进行检测是否具有人脸，从而判断目标物为人物还是动物。若判断采集的图像中具有人脸，则判断目标物为人物。
45.在检测到智能设备前端或后端的预定范围内有人物出现时，启动语音唤醒功能，
用户可以通过唤醒词激活语音功能。可以理解地，由于通常智能设备的麦克风设置在前端，因此，例如，当预定范围为人物与智能设备的摄像头之间的距离为1米如图3所示，可以在检测到目标物在距离智能设备摄像头前端60cm处，处于预定范围内，且人脸正对智能设备时，启动语音唤醒功能。
46.可以理解地，由于摄像头无需联网也可以进行人物检测，用户无需担心日常生活被监控，也无需收到环境音的影响导致语音设备被误唤醒或唤醒失败。
47.本技术的智能设备的控制方法在检测到智能设备的预设范围内有目标物出现，且目标物为人物时，启动语音唤醒功能，如此，用户不用担心智能设备的语音功能模块在后台始终开启监听环境音频的情况发生，也可以减少环境声音对语音模块唤醒的干扰。
48.请参阅图4，在某些实施方式中，步骤01包括：
49.011：根据距离传感器的检测数据检测智能设备的预定范围内是否存在目标物。
50.请参阅图5，第一检测模块11包括第一检测单元111。
51.步骤011可以由第一检测单元111实现，也即是，第一检测单元111用于根据距离传感器的检测数据检测智能设备的预定范围内是否存在目标物。
52.具体地，检测数据可以指的是目标物距离智能设备的直线距离。
53.在一个示例中，预定范围为目标物距离智能设备的直线距离为30cm时，检测数据得到目标物距离智能设备的直线距离等于或小于30cm，则表示在智能设备的预定范围内存在目标物。检测数据得到目标物距离智能设备的直线距离大于30cm，则表示在智能设备的预定范围内不存在目标物。相反地，若距离传感器的检测数据目标物距离智能设备的直线距离为20cm小于30cm，则表示在智能设备的预定范围内存在目标物。
54.其中，检测数据可以包含用户与智能设备之间的具体距离值，还可以包括用户的脸部与智能设备之间的角度。例如，检测到用户的脸部在智能设备前端的智能设备的正前端方向的预定角度a范围内，或检测到用户的脸部在智能设备前端的智能设备的正后端方向的预定角度b范围内。
55.在本技术的其他实施方式中，还可以通过红外传感器检测目标物距离智能设备的直线距离，或者，通过超声波传感器检测目标物距离智能设备的直线距离，且可以通过超声波传感器定位目标物的位置。具体检测的方式可以根据实际应用场景及情况选择合适的方式检测距离数据。
56.请参阅图6，在某些实施方式中，步骤02包括：
57.021：根据热红外成像传感器的检测数据检测目标物是否为人物。
58.请参阅图7，第二检测模块12包括第二检测单元121。
59.步骤021可以由第二检测单元121实现。也即是，第二检测单元121用于根据热红外成像传感器的检测数据检测目标物是否为人物。热红外成像传感器均设置在智能设备上，第二检测单元121与热红外成像传感器电连接，第二检测单元121可以接收热红外成像传感器的检测数据。第二检测单元121可以设置在智能设备上，也可以与智能设备外接连接。
60.具体地，热红外成像传感器的检测数据包括：检测到目标物发出的红外线能量转换而成的温度数据及由该温度数据形成的温度分布图像，通过该温度数据和形成的温度分布图像可以判断目标物为人物还是动物。
61.可以理解地，当该温度数据和温度分布图像处于人类的标准温度范围内，且温度
分布图像符合人类的图像，则可以判断出该目标物为人物。另外，由于热红外成像传感器不受恶劣环境与天气，如夜晚无光、反光，大雾大雨天气的影响，因此，热红外成像传感器适用的场景更多，适用的范围更广。
62.当利用热红外成像传感器进行检测，检测得到的结果为目标物为人物，且该人物在靠近该智能设备，该人物与智能设备的距离较短时，可以唤醒智能设备的语音唤醒功能。
63.此时，热红外成像传感器也不用联网即可使用，用户也无需担心日常生活被监控，也无需收到环境音的影响导致语音设备被误唤醒或唤醒失败。
64.请参阅图8，在某些实施方式中，步骤02包括：
65.022：根据获取的预定范围的图像，检测目标物是否为人物。
66.请参阅图9，第二检测模块12包括第三检测单元122。
67.步骤022可以由第三检测单元122实现。也即是，第三检测单元122用于根据获取的预定范围的图像，检测目标物是否为人物。第三检测单元122与智能设备的前端摄像头或后端摄像头电连接。第三检测单元122可以设置在智能设备上，也可以与智能设备外接连接。其中，第二检测单元121和第三检测单元122可以为同一个检测单元，也可以为分别的两个独立的检测单元。
68.具体地，获取预定范围的图像可以是通过智能设备的前端摄像头或后置摄像头获取智能设备的前端或后端预定范围的图像。
69.预定范围可以指的是目标物距离智能设备的前端摄像头的预设直线距离和预设角度范围内，或目标物距离智能设备的后端摄像头的预设直线距离和预设角度范围内。其中，预设直线距离可以为30cm、40cm、45cm、50cm、60cm、65cm、70cm、75cm、80cm或100cm。预设角度可以指的是前端摄像头或后端摄像头的最大视场角的角度，也可以是根据用户身高设定的角度，用户身高越高，则对应的预设角度越大，用户身高越矮，则对应的预设角度越小。
70.然后，可以对获取到的图像进行特征识别，若识别出人类的脸部特征或肢体特征或其他身体部位特征，则可以确定检测的目标物为人物。其中，脸部特征指的是人脸中的鼻子、眼睛、耳朵、嘴巴或脸颊等脸部特征。肢体特征包括人类的四肢特征。其他身体部位特征比如肚子部位特征或胸部特征。
71.更具体地，智能设备中可以预先设置有人脸检测模型。预先设置好的人脸检测模型可以是基于深度学习目标检测的方法对图像进行人脸搜索得到的模型，还可以是基于hog特征提取进行人脸检测得到的模型。此时，检测目标物为人物的原理可以为：通过摄像头对智能设备前端或后端的场景进行图像采集，并实时传输至预先设置好的人脸检测模型进行人脸检测，当检测到人脸则从而判断出该目标物为人物。
72.请参阅图10，在某些实施方式中，步骤03包括：
73.031：检测人物的身份信息是否为预定用户；
74.032：在人物为预定用户的情况下，激活语音唤醒功能。
75.请参阅图11，语音唤醒模块13包括身份验证单元131和激活唤醒单元132。
76.步骤031可以由身份验证单元131实现，步骤032可以由激活唤醒单元132实现。也即是说，身份验证单元131用于检测人物的身份信息是否为预定用户；激活唤醒单元132用于在人物为预定用户的情况下，激活语音唤醒功能。
77.具体地，智能设备中可以预先存储有预定用户的身份验证信息，身份验证信息可
以包括预定用户的人脸图像、该预定用户的声音或其他可识别预定用户的身份信息。
78.身份验证单元131可以检测人物的身份信息，身份验证单元131可以将第二检测模块12中摄像头获取的人脸图像与预先存储的用户人脸图像相匹配相似度。若两个人脸图像相似度大于或等于预设数值，例如预设数值为80％，则认为该人物的身份为预定用户。相反地，若两个人脸图像的相似度小于预设数值，则认为该人物的身份不是该预定用户。其中，相似度的预设数值可以是默认设置的数值，也可以是用户自定义设置的数值，在此不作限制。
79.通过摄像头获取的人脸图像验证人物为预定用户后，激活智能设备的语音唤醒功能，可以确保智能设备智能识别人物身份的前提下才能激活开启语音唤醒功能，保证预定用户使用智能设备的语音唤醒功能时的安全性及隐私性。
80.请参阅图12，步骤03包括：
81.033：响应于接收到的预设唤醒词，激活语音功能；
82.034：响应于接收到的语音指令，控制智能设备执行与语音指令对应的操作。
83.请结合图11，步骤033和步骤034可以由激活唤醒单元132实现。也即是说，激活唤醒单元132用于响应于接收到的预设唤醒词，激活语音功能；响应于接收到的语音指令，控制智能设备执行与语音指令对应的操作。
84.具体地，预设唤醒词可以为智能设备默认设置的词汇，也可以是用户预先设定的词汇，例如，预设唤醒词可以为中文词汇“小美小美”，也可以为英文词汇或其他语言词汇，在此不作限制。
85.此时，用户可以提前设置好唤醒词，用户通过说出指定唤醒词来唤醒语音功能。然后，在唤醒智能设备的语音功能后，激活唤醒单元132根据接收到的语音指令，控制智能设备执行与语音指令对应的操作。
86.请参阅图13，步骤03包括：
87.035：响应于接收到的语音指令，控制智能设备执行与语音指令对应的操作。
88.请结合图11，步骤035可以由激活唤醒单元132实现。也即是说，激活唤醒单元132用于响应于接收到的语音指令，控制智能设备执行与语音指令对应的操作。
89.具体地，在检测到为预定用户的人脸的信息，语音唤醒模块此时可以直接启动工作，不需要唤醒词，预定用户可以直接下达需要设备完成的语音指令，激活语音功能模块，从而控制智能设备执行与语音指令对应的操作。
90.请参阅图14，本技术还提供一种智能设备100。智能设备100包括处理器110和存储器120，存储器120用于存储计算机程序，处理器110在执行计算机程序时上述任意一项实施方式的控制方法。
91.智能设备100可以为手机、电脑、ipad、冰箱或空调等安装有传感器和摄像头的电子设备。本技术的上述实施方式中的智能设备为以手机为例进行的说明。
92.本技术的智能设备在检测到智能设备的预设范围内有目标物出现，且目标物为人物时，启动语音唤醒功能，如此，用户不需要担心智能设备的语音功能模块在后台始终开启监听环境音频的情况发生，也可以减少环境声音对语音模块唤醒的干扰。
93.请参阅图15，本技术还提供一种计算机程序的非易失性计算机可读存储介质200。当计算机程序210被一个或多个处理器220执行时，实现上述任意一项实施方式的控制方
法。
94.本技术的计算机可读存储介质在检测到智能设备的预设范围内有目标物出现，且目标物为人物时，启动语音唤醒功能，如此，用户不用担心智能设备的语音功能模块在后台始终开启监听环境音频的情况发生，也可以减少环境声音对语音模块唤醒的干扰。
95.以上实施例仅表达了本技术的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本技术专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本技术构思的前提下，还可以做出若干变形和改进，这些都属于本技术的保护范围。因此，本技术专利的保护范围应以所附权利要求为准。