1.本技术实施例涉及计算机技术领域,尤其涉及一种声音能量值的校准及设备唤醒方法、设备及存储介质。
背景技术:2.随着语音识别技术的发展,越来越多的智能设备可以通过语音来控制。智能设备在进行语音控制之前,首先需要用户通过语言输入唤醒词来唤醒智能设备的语音识别功能。
3.目前同一个厂家的智能设备的唤醒词通常相同,这样当一个场景中存在一个厂家的多个智能设备时,用户语言输入唤醒词时,存在多个智能设备同时唤醒的问题,无法实现精准唤醒。
技术实现要素:4.本技术实施例提供一种声音能量值的校准及设备唤醒方法、设备及存储介质,以准确唤醒目标智能设备。
5.第一方面,本技术实施例提供一种声音能量值的校准方法,包括:
6.接收校准声源发出的n个校准声音信号,所述被校准设备与所述校准声源之间的距离为预设距离,所述n为正整数;
7.获取所述被校准设备中的麦克风在接收到所述n个校准声音信号中每个校准声音信号时所产生的振幅;
8.根据所述麦克风对于每个所述校准声音所产生的振幅,确定所述被校准设备所检测到的每个所述校准声音信号的能量值;
9.根据所述被校准设备所检测到的每个所述校准声音信号的能量值,确定所述被校准设备的声能校准系数。
10.第二方面,本技术实施例提供一种设备唤醒方法,包括:
11.接收唤醒声音信号,所述唤醒声音信号用于唤醒m个第一设备中的目标设备,所述终端设备为所述m个第一设备中的一个第一设备,所述m个第一设备中每个第一设备的唤醒声音信号相同,所述m为正整数;
12.获取所述终端设备中的麦克风在接收到所述唤醒声音信号时所产生的振幅;
13.根据所述振幅,确定所述终端设备所检测到的所述唤醒声音信号的第一能量值;
14.根据所述终端设备的声能校准系数,对所述终端设备的第一能量值进行校正,得到所述终端设备的第二能量值;
15.根据所述终端设备的第二能量值,确定所述终端设备是否唤醒。
16.第三方面,本技术实施例提供一种声音能量值的校准装置,用于执行上述第一方面任一项所述的方法。
17.第四方面,本技术实施例提供一种设备唤醒装置,用于执行上述第二方面任一项
所述的方法。
18.第五方面,本技术实施例提供一种电子设备,包括处理器和存储器,用于执行上述第一方面和/或第二方面任一项所述的方法。
19.第六方面,本技术实施例提供了一种计算机可读存储介质,所述存储介质包括计算机指令,当所述指令被计算机执行时,使得所述计算机实现如第一方面和/或第二方面任一项所述的方法。
20.第七方面,本技术实施例提供一种计算机程序产品,所述程序产品包括计算机程序,所述计算机程序存储在可读存储介质中,计算机的n个处理器可以从所述可读存储介质读取所述计算机程序,所述n个处理器执行所述计算机程序使得计算机实施第一方面和/或第二方面任一项所述的方法。
21.基于本技术提供的技术方案,通过接收标注声源发出的n个校准声音,并获取被校准设备中的麦克风在接收到n个校准声音时所产生的振幅,根据麦克风对于每个校准声音产生的振幅,确定被校准设备所检测到的每个校准声音信号的能量值,根据每个校准声音信号的能量值确定被校准设备的声能校准系数。即本技术通过检查被校准设备接收到n个校准声音信号时所产生的能量值,来确定被校准设备的能量校准系数,整个校准过程简单,且可以实现对被校准设备的准确校准,提高被校准设备在后期唤醒过程中的唤醒准确性。
附图说明
22.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。
23.图1为本技术实施例涉及的校准场景示意图;
24.图2为本技术实施例涉及的被校准设备的结构示意图;
25.图3为本技术一实施例提供的声音能量值的校准方法的流程示意图;
26.图4为本技术一实施例提供的声音能量值的校准方法的流程示意图;
27.图5为本技术一实施例提供的声音能量值的校准方法的流程示意图;
28.图6为本技术一实施例提供的设备唤醒方法的流程示意图;
29.图7为本技术实施例的一种应用场景示意图;
30.图8为本技术一实施例提供的设备唤醒方法的流程示意图;
31.图9为本技术一实施例提供的设备唤醒方法的流程示意图;
32.图10为本技术实施例提供的声音能量值的校准装置的一种结构示意图;
33.图11为本技术实施例提供的声音能量值的校准装置的一种结构示意图;
34.图12为本技术实施例提供的声音能量值的校准装置的一种结构示意图;
35.图13为本技术实施例提供的声音能量值的校准装置的一种结构示意图;
36.图14为本技术实施例提供的声音能量值的校准装置的一种结构示意图;
37.图15为本技术实施例提供的设备唤醒装置的一种结构示意图;
38.图16为本技术实施例提供的设备唤醒装置的一种结构示意图;
39.图17为本技术实施例提供的设备唤醒装置的一种结构示意图;
40.图18为本技术实施例提供的设备唤醒装置的一种结构示意图;
41.图19为本技术实施例提供的设备唤醒装置的一种结构示意图;
42.图20为本技术实施例涉及的电子设备的框图。
具体实施方式
43.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行描述。
44.应理解,在本发明实施例中,“与a对应的b”表示b与a相关联。在一种实现方式中,可以根据a确定b。但还应理解,根据a确定b并不意味着仅仅根据a确定b,还可以根据a和/或其它信息确定b。
45.在本技术的描述中,除非另有说明,“多个”是指两个或多于两个。
46.另外,为了便于清楚描述本技术实施例的技术方案,在本技术的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。
47.为了便于理解本技术的实施例,首先对本技术实施例涉及到的相关概念进行如下简单介绍:
48.声音(sound)是由物体振动产生的声波,是通过介质(空气或固体、液体)传播并能被人或动物听觉器官所感知的波动现象。可以被人耳识别的声音的频率在20hz~20000hz之间。
49.声音的传播必须具备三要素:声源、传播媒介和接受器。
50.声源是产生振动的物体。
51.传播媒介是能量流动的渠道。
52.接受器是感受声音的装置。比如在弹奏乐器时,乐器是声源,空气是传播媒介,耳朵是感受声音的接受装置。
53.声能是能量的一种表现形式,其实质是物体振动后,通过传播媒介并以波的形式发生的机械能的转移和转化,反过来,其他能量的转移和转化也可以还原成机械能而产生声音。变化是可以逆向的。
54.声音的强度单位是“分贝”,数值越大,振幅就越大,声音就越大,大到一定程度时就变成了噪音。小到一定程度时,则感受不到该声音。不同的声音可以代数叠加。
55.声能即声音的能量值,是以波的形式存在,具有频率(f)、声速(c)、和波长(λ)三个物理量,三者之间的关系可用下列公式表示:c=f
×
λ。
56.频率(f)是单位时间内质点振动的次数,一般以每秒振动次数表示,以hz为单位,每秒振动一次为1hz。
57.声速(c)是单位时间波动传播的距离,常用单位为m/s。在不同的媒介中,传播速度也不同,例如,在真空中声速为0m/s(也就是不能传播),在空气(15℃)中声速为340m/s,在空气(25℃)中声速为346m/s,在软木中声速为500m/s,在煤油(25℃)中声速为1324m/s,在蒸馏水(25℃)中声速为1497m/s,在海水(25℃)中声速为1531m/s,在铜(棒)中声速为3750m/s,大理石中声速为3810m/s,在铝(棒)中声速为5000m/s。
58.波长(λ)是波动传播过程中相邻的两个周期中,对应点的距离或相邻的两个波峰或波谷间的距离,常用单位为mm。
59.在本技术的一些实施例中,通过在不同终端设备上拾取的声音的能量值,并根据
声音的能量值决定该唤醒的设备。但是,在该实施例中,由于设备的硬件差异,例如电路和器件等的差异导致在相同的环境条件下,各设备计算出的声音能量值存在较大的差异。例如,嵌入式开关和带屏音箱之间,在1m的位置对这两个设备输入唤醒声音信号,计算出来嵌入式开关的声音能量值是128.21,带屏音箱的声音能量值是180.43,这导致基于此声音能量值决定应该唤醒哪个设备时,存在严重的误差。
60.为了解决上述技术问题,本技术实施例对终端设备的声音能量值进行校准,得到终端设备的声能校准系数。这样在后期唤醒时,可以根据终端设备的声能校准系数对终端设备所检测到的声音能量值进行校准,并基于校准后的声音能量值判断是否唤醒,进而提高了唤醒的准确性。
61.下面通过一些实施例对本技术实施例的技术方案进行详细说明。下面这几个实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
62.首先对本技术实施例涉及的声音能量值的校准方法进行校准。
63.在本技术实施例中确定终端设备的声能校准系数的执行设备可以是终端设备本身,也可以是服务器,例如云端服务器。
64.首先结合图1、图2、图3和图4,以服务器确定自身的声能校准系数为例,对本技术实施例的校准方法进行介绍。
65.图1为本技术实施例涉及的校准场景示意图,如图1所示,包括校准声源300、被校准设备100、服务器200。
66.其中,校准声源300与被校准设备100之间的距离为预设距离。可选的,预设距离在0.3至5m之间选取,例如为1.5m。
67.校准声源300用于发出校准声音信号。其中,标准声音信号的频率为人声范围内频率,即300
‑
3400hz范围内的频率,可选的,标准声音信号的频率为1000hz。其中,标准声音信号声压级的为预设的声压级,例如为在参考点(mouth reference point,mrp)的声压级为94dbspl。
68.被校准设备100可以为终端设备,被校准设备100可以通过声音信号唤醒。其中,终端设备包括智能家电设备、智能家居、用户终端设备、车载终端设备等等。
69.图2为本技术实施例涉及的被校准设备的结构示意图,如图2所示,被校准设备100包括处理器110、麦克风120和收发器130。其中麦克风120和收发器130分别与处理器110连接。
70.处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,ap),调制解调处理器,图形处理器(graphics processing unit,gpu),图像信号处理器(image signal processor,isp),控制器,视频编解码器,数字信号处理器(digital signal processor,dsp),基带处理器,显示处理单元(display process unit,dpu),和/或神经网络处理器(neural
‑
network processing unit,npu)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。在一些实施例中,被校准设备100也可以包括一个或多个处理器110。其中,控制器可以是被校准设备100的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚
用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。这就避免了重复存取,减少了处理器110的等待时间,因而提高了被校准设备100系统的效率。
71.在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter
‑
integrated circuit,i2c)接口,集成电路内置音频(inter
‑
integrated circuit sound,i2s)接口,脉冲编码调制(pulse code modulation,pcm)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,uart)接口,移动产业处理器接口(mobile industry processor interface,mipi),通用输入输出(general
‑
purpose input/output,gpio)接口,用户标识模块(subscriber identity module,sim)接口,和/或通用串行总线(universal serial bus,usb)接口等。其中,usb接口是符合usb标准规范的接口,具体可以是mini usb接口,micro usb接口,usb type c接口等。usb接口可以用于连接充电器为被校准设备100充电,也可以用于被校准设备100与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。
72.麦克风120,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风120发声,将声音信号输入到麦克风120。被校准设备100可以设置至少一个麦克风120。在另一些实施例中,被校准设备100可以设置两个麦克风120,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,被校准设备100还可以设置三个,四个或更多麦克风120,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。也就是说,在一些实施例中,上述麦克风120为麦克风阵列,麦克风阵列由多个声学传感器组成,用来对声场的空间特性进行采样并处理的系统。麦克风阵列可以将多个声学传感器检测到的信号耦合为一个信号,信号强度高,可以消除环境中的各种干扰,例如可以消除回音。
73.收发器130,用于与其他通信设备之间进行通信。当然,收发器130还可以用于与通信网络通信,如以太网,无线接入网(radio access network,ran),无线局域网(wireless local area networks,wlan)等。收发器130可以包括接收单元实现接收功能,以及发送单元实现发送功能。
74.在一些实施例中,上述服务器200可以是云端服务器。可选的,上述服务器可以为被校准设备的后台服务器。
75.图3为本技术一实施例提供的声音能量值的校准方法的流程示意图,如图3所示,包括:
76.s301、被校准设备接收校准声源发出的n个校准声音信号。
77.上述被校准设备可以理解为被校准的终端设备。
78.其中,被校准设备与校准声源之间的距离为预设距离,例如为1.5m。
79.上述n为正整数。
80.也就是说,通过采集校准声源发出的一次校准声音信号来对被校准设备进行校准,以提高校准速度。
81.可选的,通过采集校准声源发出的多次校准声音信号来对被校准设备进行校准,以提高校准准确性。例如,在5s内采样7次校准声音信号,使用该采集的7个校准声音信号对被校准设备进行校准。
82.可选的,上述n个校准声音信号的频率可以相同,也可以不同,本技术对此不做限制。
83.s302、被校准设备获取被校准设备中的麦克风在接收到n个校准声音信号中每个校准声音信号时所产生的振幅。
84.如图2所示,校准源发出的校准声音信号可以被被校准设备中的麦克风接收到,且麦克风接收到校准声音信号时可以产生振动,被校准设备中的处理器可以获取麦克风所产生的振荡的振幅。
85.s303、被校准设备根据麦克风对于每个校准声音所产生的振幅,确定被校准设备所检测到的每个校准声音信号的能量值。
86.其中校准声音信号的能量值与麦克风产生的振幅呈正相关,这样可以根据麦克风对于每个校准声音所产生的振幅,确定被校准设备所检测到的每个校准声音信号的能量值。
87.在一些实施例中,根据麦克风对于每个校准声音信号所产生的振幅,以及每个校准声音信号的物理参数,确定被校准设备所检测到的每个校准声音信号的能量值。
88.可选的,校准声音信号的物理参数包括校准声音信号的频率、校准声音信号的波速、以及校准声音信号的传输介质的密度中的至少一个。
89.需要说明的是,被校准设备确定n个校准声音信号中的每个校准声音信号的能量值的过程相同,下面以确定一个校准声音信号的能量值的过程为例进行说明。
90.在一种可能的实现方式中,可以将麦克风对于该校准声音信号所产生的振幅,以及该校准声音信号的频率的乘积,确定为该校准声音信号的能量值。
91.在另一种可能的实现方式中,根据如下公式(1)确定校准声音信号的能量值:
92.v=(ρ*w*w*u*a*a)/2
ꢀꢀꢀꢀꢀ
(1)
93.其中,v为校准声音信号的能量值,ρ为介质密度,即校准声音信号的传播介质的密度,例如空气的密度为ρ=1.29kg/m3=1.29
×
10
‑3g/cm3,w校准声音信号的频率,例如为1000hz,a为麦克风对于该校准声音信号所产生的振幅,u为该校准声音信号的波速,即声速,例如在空气(25℃)中声速为346m/s,“*”为乘号,“/”为相除。
94.需要说明的是,上述公式只是一种示例,上述公式(1)的任何等价变形、或者在上述公式(1)的基础相加、相减、相除或相乘某一个参数时,也属于本技术实施例的范围。
95.s304、被校准设备将n个校准声音信号中每个校准声音信号的能量值发送给服务器。
96.例如图2所示,被校准设备中的处理器将计算出的n个校准声音信号中每个校准声音信号的能量值通过收发器发送给服务器,使得服务器根据各校准声音信号的能量值,确定被校准设备的声能校准系数。
97.s305、服务器根据n个校准声音信号中每个校准声音信号的能量值,确定被校准设备的声能校准系数。
98.在一些实施例中,上述s305包括s305
‑
1:服务器根据每个校准声音信号的能量值和每个校准声音信号对应的参考能量值,确定被校准设备的声能校准系数。
99.其中,校准声音信号对应的参考能量值可以理解为不同的被校准设备距离校准源相同的预设距离时,各被校准设备理应接收到的相同的能量值。
100.可选的,上述校准声音信号对应的参考能量值可以为通过实验测量的能量值。
101.可选的,上述校准声音信号对应的参考能量值可以为预设值。
102.需要说明的,当校准声音信号的物理参数相同时,则校准声音信号对应的参考能量值相同。当校准声音信号的物理参数不相同时,则校准声音信号对应的参考能量值可能不相同。
103.情况1,若n个校准声音信号的频率相同,则上述s305
‑
1包括:s305
‑
a1和s305
‑
a1:
104.s305
‑
a1、服务器根据n个校准声音信号中每个校准声音信号的能量值,确定n个校准声音信号的能量值的平均值。
105.在一种示例中,服务器将n个校准声音信号中每个校准声音信号的能量值的平均值,确定n个校准声音信号的能量值的平均值。
106.在一种示例中,服务器剔除n个校准声音信号的能量值中的最小能量值和最大能量值,将剔除后的n
‑
2个校准声音信号的能量值的平均值,确定为n个校准声音信号的能量值的平均值。
107.s305
‑
a1、服务器根据n个校准声音信号的能量值的平均值和校准声音信号对应的参考能量值,确定被校准设备的声能校准系数。
108.举例说明,预设有3挡不同频率的声音信号,其中第一档声音信号的频率为a1,第二档声音信号的频率为a2,第三档声音信号的频率为a3,该情况1中,选取第二档声音信号为校准声音信号,将校准声源设备的声音信号的频率调至第二档,控制校准声源设备在该第二档频率下发出n个校准声音信号。n个校准声音信号可以被被校准设备中的麦克风接收到,且麦克风接收到n个校准声音信号中的每个校准声音时可以产生振动。需要说明的是,由于这n个校准声音信号的频率相同,因此,同一个被校准设备接收到的这n个校准声音信号的能量值基本相同,且这n个校准声音信号的参考能量值相同,进而可以根据n个校准声音信号的能量值的平均值和校准声音信号对应的参考能量值,确定被校准设备的声能校准系数。
109.在一种示例中,服务器将校准声音信号对应的参考能量值与n个校准声音信号的能量值的平均值的比值,确定为被校准设备的声能校准系数。
110.例如,服务器根据如下公式(2)确定为被校准设备的声能校准系数:
111.p=v0/v1
ꢀꢀꢀ
(2)
112.其中,p为被校准设备的声能校准系数,v0为校准声音信号对应的参考能量值,v1为n个校准声音信号的能量值的平均值。
113.在一种示例中,服务器将校准声音信号对应的参考能量值与n个校准声音信号的能量值的平均值的差值,确定为被校准设备的声能校准系数。
114.情况2、若n个校准声音信号的频率不完全相同,则上述s305
‑
1包括:s305
‑
b1和s305
‑
b1:
115.s305
‑
b1、针对n个校准声音信号中每个校准声音信号,服务器根据校准声音信号的能量值和校准声音信号的参考能量值,确定被校准设备对于校准声音信号的声能校准系数。
116.在一种示例中,针对n个校准声音信号中每个校准声音信号,服务器将该校准声音信号对应的参考能量值与该校准声音信号的能量值的比值,确定为被校准设备对于该校准
声音信号的声能校准系数。
117.举例说明,预设有3挡不同频率的声音信号,其中第一档声音信号的频率为900hz,第二档声音信号的频率为1000hz,第三档声音信号的频率为1100hz,第一档声音信号的参考能量值为b1,第二档声音信号的参考能量值为b2,第三档声音信号的参考能量值为b3,其中b1<b2<b3。该情况2中,10个校准声音信号中,3个校准声音信号为第一档声音信号,5个校准声音信号为第二档声音信号,2个校准声音信号为第三档声音信号。在实际校准过程中,先将校准声源设备的声音信号的频率调至第一档,控制校准声源设备在该第一档频率下发出3个校准声音信号,分别计算被校准设备接收到这3个校准声音信号中的每一校准声音信号的能量值,记为w1、w2和w3。根据w1、w2、w3和b1,计算被校准设备关于这3个校准声音信号的声能校准系数分别为β1、β2和β3,例如β1=w1/b1,β2=w2/b1,β3=w3/b1。
118.接着,将校准声源设备的声音信号的频率调至第二档,控制校准声源设备在该第二档频率下发出5个校准声音信号,分别计算被校准设备接收到第二档的5个校准声音信号中的每一校准声音信号的能量值,记为w4、w5、w6、w7和w8。根据w4、w5、w6、w7、w8和b2,计算被校准设备关于第二档的5个校准声音信号的声能校准系数分别为β4、β5、β6、β7和β8,例如β4=w4/b2,β5=w5/b2,β6=w6/b2,β7=w7/b2,β8=w8/b2。
119.接着,将校准声源设备的声音信号的频率调至第三档,控制校准声源设备在该第三档频率下发出2个校准声音信号,分别计算被校准设备接收到第三档的2个校准声音信号中的每一校准声音信号的能量值,记为w9和w10。根据w9、w10和b3,计算被校准设备关于第三档的2个校准声音信号的声能校准系数分别为β9和β10,例如β9=w9/b3,β10=w10/b3。
120.需要说明的是,上述β1、β2、β3、β4、β5、β6、β7、β8、β9和β10之间的差异较小。
121.本技术实施例对获取上述不同档位校准声音信号对应的参考能量值的方式不做限制。可选的,将某一个被校准设备接收到的关于不同档位的校准声音信号的能量值,确定为不同档位校准声音信号对应的参考能量值。可选的,上述不同档位校准声音信号对应的参考能量值是理论能量值。
122.在一种示例中,服务器将该校准声音信号对应的参考能量值与该校准声音信号的能量值的差值,确定为被校准设备对于该校准声音信号的声能校准系数。
123.s305
‑
b1、服务器根据被校准设备对于n个校准声音信号中每个校准声音信号的声能校准系数,确定被校准设备的声能校准系数。
124.在一些实施例中,服务器将被校准设备对于n个校准声音信号中每个校准声音信号的声能校准系数的加权平均值,确定被校准设备的声能校准系数。
125.在一些实施例中,上述s305
‑
b1包括s305
‑
b11和s305
‑
b12:
126.s305
‑
b11、服务器根据被校准设备对于n个校准声音信号中每个校准声音信号的声能校准系数,确定被校准设备对于n个校准声音信号的声能校准系数的平均值。
127.在一种示例中,服务器将被校准设备对于n个校准声音信号中每个校准声音信号的声能校准系数的平均值,确定为被校准设备对于n个校准声音信号的声能校准系数的平均值。
128.在另一种示例中,服务器剔除被校准设备对于n个校准声音信号中每个校准声音信号的声能校准系数中的最小声能校准系数和最大声能校准系数;将被校准设备对于剔除后的n
‑
2个校准声音信号的声能校准系数的平均值,确定为被校准设备对于n个校准声音信
号的声能校准系数的平均值。
129.s305
‑
b12、服务器将被校准设备对于n个校准声音信号的声能校准系数的平均值,确定为被校准设备的声能校准系数。
130.在一些实施例中,服务器在根据上述方法确定出被校准设备的声能校准系数后,将确定被校准设备的声能校准系数发送给被校准设备。
131.本技术实施例的校准方法,通过检查被校准设备接收到n个校准声音信号时所产生的能量值,来确定被校准设备的能量校准系数,整个校准过程简单,且可以实现对被校准设备的准确校准,提高被校准设备在后期唤醒过程中的唤醒准确性。
132.下面结合图4,对服务器确定校准声音信号的能量值,以及根据确定的校准声音信号的能量值确定被校准设备的声能校准系数的过程进行介绍。
133.图4为本技术一实施例提供的声音能量值的校准方法的流程示意图,如图4所示,包括:
134.s401、被校准设备接收校准声源发出的n个校准声音信号。
135.其中,被校准设备与校准声源之间的距离为预设距离,n为正整数;
136.s402、被校准设备获取被校准设备中的麦克风在接收到n个校准声音信号中每个校准声音信号时所产生的振幅;
137.s403、被校准设备将麦克风在接收到n个校准声音信号中每个校准声音信号时所产生的振幅,发送给服务器。
138.s404、服务器根据麦克风对于每个校准声音所产生的振幅,确定被校准设备所检测到的每个校准声音信号的能量值。
139.在一些实施例中,服务器根据麦克风对于每个校准声音所产生的振幅,以及每个校准声音信号的物理参数,确定被校准设备所检测到的每个校准声音信号的能量值。
140.可选的,校准声音信号的物理参数包括校准声音信号的频率、校准声音信号的波速、以及校准声音信号的传输介质的密度中的至少一个。
141.s405、服务器根据被校准设备所检测到的每个校准声音信号的能量值,确定被校准设备的声能校准系数。
142.在一些实施例中,上述s405包括s405
‑
1:服务器根据每个校准声音信号的能量值和每个校准声音信号对应的参考能量值,确定被校准设备的声能校准系数。
143.情况1,若n个校准声音信号的频率相同,则上述s405
‑
1包括:
144.s405
‑
a1、服务器根据n个校准声音信号中每个校准声音信号的能量值,确定n个校准声音信号的能量值的平均值。
145.在一种示例中,服务器将n个校准声音信号中每个校准声音信号的能量值,确定为n个校准声音信号的能量值的平均值。
146.在另一种示例中,服务器剔除n个校准声音信号的能量值中的最小能量值和最大能量值,将剔除后的n
‑
2个校准声音信号的能量值的平均值,确定为n个校准声音信号的能量值的平均值。
147.s405
‑
a2、服务器根据n个校准声音信号的能量值的平均值和校准声音信号对应的参考能量值,确定被校准设备的声能校准系数。
148.在一种示例中,服务器将校准声音信号对应的参考能量值与n个校准声音信号的
能量值的平均值的比值,确定为被校准设备的声能校准系数。
149.在另一种示例中,服务器将校准声音信号对应的参考能量值与n个校准声音信号的能量值的平均值的差值,确定为被校准设备的声能校准系数。
150.情况2,若n个校准声音信号的频率不完全相同,则上述s405
‑
1包括:
151.s405
‑
b1、针对n个校准声音信号中每个校准声音信号,服务器根据校准声音信号的能量值和校准声音信号的参考能量值,确定被校准设备对于校准声音信号的声能校准系数;
152.在一种示例中,服务器将校准声音信号对应的参考能量值与校准声音信号的能量值的比值,确定为被校准设备对于校准声音信号的声能校准系数。
153.在另一种示例中,服务器将校准声音信号对应的参考能量值与校准声音信号的能量值的差值,确定为被校准设备对于校准声音信号的声能校准系数。
154.s405
‑
b2、服务器根据被校准设备对于n个校准声音信号中每个校准声音信号的声能校准系数,确定被校准设备的声能校准系数。
155.在一些实施例中,s405
‑
b2包括s405
‑
b21和s405
‑
b22:
156.s405
‑
b21、服务器根据被校准设备对于n个校准声音信号中每个校准声音信号的声能校准系数,确定被校准设备对于n个校准声音信号的声能校准系数的平均值。
157.在一种示例中,服务器将被校准设备对于n个校准声音信号中每个校准声音信号的声能校准系数,确定为被校准设备对于n个校准声音信号的声能校准系数的平均值。
158.在另一种示例中,服务器剔除被校准设备对于n个校准声音信号中每个校准声音信号的声能校准系数中的最小声能校准系数和最大声能校准系数;将被校准设备对于剔除后的n
‑
2个校准声音信号的声能校准系数的平均值,确定为被校准设备对于n个校准声音信号的声能校准系数的平均值。
159.s405
‑
b22、服务器将被校准设备对于n个校准声音信号的声能校准系数的平均值,确定为被校准设备的声能校准系数。
160.在一些实施例中,本技术实施例还包括:服务器将确定被校准设备的声能校准系数发送给被校准设备。
161.本技术实施例的校准方法,通过检查被校准设备接收到n个校准声音信号时所产生的能量值,来确定被校准设备的能量校准系数,整个校准过程简单,且可以实现对被校准设备的准确校准,提高被校准设备在后期唤醒过程中的唤醒准确性。
162.在一些实施例中,本技术实施例的被校准设备可以独立完成校准方法。
163.图5为本技术一实施例提供的声音能量值的校准方法的流程示意图,如图5所示,包括:
164.s501、被校准设备接收校准声源发出的n个校准声音信号。
165.其中,被校准设备与校准声源之间的距离为预设距离,n为正整数。
166.s502、被校准设备获取被校准设备中的麦克风在接收到n个校准声音信号中每个校准声音信号时所产生的振幅。
167.s503、被校准设备根据麦克风对于每个校准声音所产生的振幅,确定被校准设备所检测到的每个校准声音信号的能量值。
168.在一些实施例中,被校准设备根据麦克风对于每个校准声音所产生的振幅,以及
每个校准声音信号的物理参数,确定被校准设备所检测到的每个校准声音信号的能量值。
169.可选的,校准声音信号的物理参数包括校准声音信号的频率、校准声音信号的波速、以及校准声音信号的传输介质的密度中的至少一个。
170.s504、被校准设备根据被校准设备所检测到的每个校准声音信号的能量值,确定被校准设备的声能校准系数。
171.在一些实施例中,上述s504包括:s504
‑
1:被校准设备根据每个校准声音信号的能量值和每个校准声音信号对应的参考能量值,确定被校准设备的声能校准系数。
172.情况1,若n个校准声音信号的频率相同,则上述s504
‑
1包括:
173.s504
‑
a1、被校准设备根据n个校准声音信号中每个校准声音信号的能量值,确定n个校准声音信号的能量值的平均值。
174.在一种示例中,被校准设备将n个校准声音信号中每个校准声音信号的能量值,确定为n个校准声音信号的能量值的平均值。
175.在另一种示例中,被校准设备剔除n个校准声音信号的能量值中的最小能量值和最大能量值,将剔除后的n
‑
2个校准声音信号的能量值的平均值,确定为n个校准声音信号的能量值的平均值。
176.s504
‑
a2、被校准设备根据n个校准声音信号的能量值的平均值和校准声音信号对应的参考能量值,确定被校准设备的声能校准系数。
177.在一种示例中,被校准设备将校准声音信号对应的参考能量值与n个校准声音信号的能量值的平均值的比值,确定为被校准设备的声能校准系数。
178.在另一种示例中,被校准设备将校准声音信号对应的参考能量值与n个校准声音信号的能量值的平均值的差值,确定为被校准设备的声能校准系数。
179.情况2,若n个校准声音信号的频率不完全相同,则上述s504
‑
1包括:
180.s504
‑
b1、针对n个校准声音信号中每个校准声音信号,被校准设备根据校准声音信号的能量值和校准声音信号的参考能量值,确定被校准设备对于校准声音信号的声能校准系数。
181.在一种示例中,被校准设备将校准声音信号对应的参考能量值与校准声音信号的能量值的比值,确定为被校准设备对于校准声音信号的声能校准系数。
182.在另一种示例中,被校准设备将校准声音信号对应的参考能量值与校准声音信号的能量值的差值,确定为被校准设备对于校准声音信号的声能校准系数。
183.s504
‑
b2、被校准设备根据被校准设备对于n个校准声音信号中每个校准声音信号的声能校准系数,确定被校准设备的声能校准系数。
184.在一些实施例中,s504
‑
b2包括s504
‑
b21和s504
‑
b22:
185.s504
‑
b21、被校准设备根据被校准设备对于n个校准声音信号中每个校准声音信号的声能校准系数,确定被校准设备对于n个校准声音信号的声能校准系数的平均值。
186.在一种示例中,被校准设备将被校准设备对于n个校准声音信号中每个校准声音信号的声能校准系数,确定为被校准设备对于n个校准声音信号的声能校准系数的平均值。
187.在另一种示例中,被校准设备剔除被校准设备对于n个校准声音信号中每个校准声音信号的声能校准系数中的最小声能校准系数和最大声能校准系数;将被校准设备对于剔除后的n
‑
2个校准声音信号的声能校准系数的平均值,确定为被校准设备对于n个校准声
音信号的声能校准系数的平均值。
188.s504
‑
b22、被校准设备将被校准设备对于n个校准声音信号的声能校准系数的平均值,确定为被校准设备的声能校准系数。
189.本技术实施例的校准方法,通过检查被校准设备接收到n个校准声音信号时所产生的能量值,来确定被校准设备的能量校准系数,整个校准过程简单,且可以实现对被校准设备的准确校准,提高被校准设备在后期唤醒过程中的唤醒准确性。
190.上文对本技术实施例涉及的校准方法进行介绍,下面对本技术实施例涉及的唤醒方法进行介绍。
191.在一些实施例中,服务器可以根据终端设备确定的第一能量值,确定终端设备是否唤醒,具体如图8所示。
192.图6为本技术一实施例提供的设备唤醒方法的流程示意图,如图6所示,包括:
193.s601、终端设备接收唤醒声音信号。
194.需要说明的是,该终端设备可以理解为上述被校准设备,即经过上述方法校准后的设备。
195.在一些实施例中,上述唤醒声音是用户发出的。
196.其中,上述唤醒声音信号用于唤醒m个第一设备中的目标设备,终端设备为m个第一设备中的一个第一设备,m个第一设备中每个第一设备的唤醒声音信号相同,m为正整数。
197.图7为本技术实施例的一种应用场景示意图,如图7所示,该场景中包括唤醒声音信号相同的m个第一设备,其中上述终端设备为m个第一设备中的一个设备。用户期望唤醒这m个第一设备中接收到唤醒语言信号的能量值最大的设备唤醒,通常距离用户最近的第一设备接收到的唤醒声音信号的能量值最大。此时,如图7所示,用户输出唤醒声音信号,这m个第一设备中的每一个第一设备均能接收到该唤醒声音信号,且每个第一设备是否唤醒的过程相同,为了便于描述,本实施例以m个第一设备中的终端设备为例进行说明。
198.s602、终端设备获取终端设备中的麦克风在接收到唤醒声音信号时所产生的振幅。
199.终端设备的结构如图2所示,终端设备中的麦克风在接收到用户输出的唤醒声音信号时产生的振荡,终端设备中的处理器获取麦克风产生的振荡的振幅。
200.s603、终端设备根据振幅,确定终端设备所检测到的唤醒声音信号的第一能量值。
201.在一些实施例中,终端设备根据麦克风所产生的振幅,以及唤醒声音信号的物理参数,确定终端设备所检测到的唤醒声音信号的第一能量值。
202.在一种可能的实现方式中,可以将麦克风对于该唤醒声音信号所产生的振幅,以及该唤醒声音信号的频率的乘积,确定终端设备所检测到的唤醒声音信号的第一能量值。
203.在另一种可能的实现方式中,可以根据上述公式(2)确定终端设备所检测到的唤醒声音信号的第一能量值。
204.s604、终端设备将第一能量值发送给服务器。
205.具体的,终端设备的收发器将终端设备的第一能量值发送给服务器,以使服务器对终端设备的第一能量值进行校准得到第二能量值,并根据第二能量值确定终端设备是否唤醒。
206.需要说明的是,终端设备还将终端设备的标识信息发送给服务器,使得服务器根
据终端设备的标识信息,查询得到终端设备对应的声能校准系数。
207.s605、服务器根据终端设备的声能校准系数,对终端设备的第一能量值进行校正,得到终端设备的第二能量值。
208.在一种示例中,将终端设备的声能校准系数与终端设备的第一能量值的乘积,确定为终端设备的第二能量值。
209.在另一示例中,将终端设备的声能校准系数与终端设备的第一能量值的和,确定为终端设备的第二能量值。
210.s606、服务器根据终端设备的第二能量值,确定终端设备是否唤醒。
211.在一些实施例中,若终端设备的第二能量值大于预设值时,服务器确定终端设备唤醒。
212.在一种实施例中,服务器根据接收到的m个第一设备中每个第一设备的第二能量值,在确定终端设备的第二能量值为m个第一设备的第二能量值中的最大能量值时,确定终端设备唤醒。
213.服务器在确定终端设备唤醒时,向终端设备发送唤醒指令,该唤醒指令用于指示终端设备唤醒。终端设备在接收到唤醒指令时,唤醒。
214.本技术实施例,通过上述校准方法,确定出终端设备的能量值校准系数,在实际唤醒过程中,根据终端设备的能量值校准系数对终端设备的第一能量值进行校准,得到第二能量值,并根据第二能量值确定终端设备是否唤醒,进而消除了由于终端设备之间的硬件差异造成的唤醒不准确的问题。
215.在一些实施例中,服务器还可以根据终端设备的麦克风的振幅,确定终端设备是否唤醒,具体如图8所示。
216.图8为本技术一实施例提供的设备唤醒方法的流程示意图,如图8所示,包括:
217.s801、终端设备接收唤醒声音信号,唤醒声音信号用于唤醒m个第一设备中的目标设备,终端设备为m个第一设备中的一个第一设备,m个第一设备中每个第一设备的唤醒声音信号相同,m为正整数;
218.s802、终端设备获取终端设备中的麦克风在接收到唤醒声音信号时所产生的振幅。
219.s803、终端设备将麦克风在接收到唤醒声音信号时所产生的振幅发送给服务器。
220.具体的,终端设备的收发器将终端设备中在接收到唤醒声音信号时所产生的振幅发送给服务器,以使服务器根据振幅,确定终端设备是否唤醒。
221.s804、服务器根据振幅,确定终端设备所检测到的唤醒声音信号的第一能量值。
222.在一些实施例中,服务器根据麦克风所产生的振幅,以及唤醒声音信号的物理参数,确定终端设备所检测到的唤醒声音信号的第一能量值。
223.在一种可能的实现方式中,服务器可以将麦克风对于该唤醒声音信号所产生的振幅,以及该唤醒声音信号的频率的乘积,确定终端设备所检测到的唤醒声音信号的第一能量值。
224.在另一种可能的实现方式中,服务器可以根据上述公式(2)确定终端设备所检测到的唤醒声音信号的第一能量值。
225.s805、服务器根据终端设备的声能校准系数,对终端设备的第一能量值进行校正,
得到终端设备的第二能量值。
226.在一种示例中,服务器将终端设备的声能校准系数与终端设备的第一能量值的乘积,确定为终端设备的第二能量值。
227.在一种示例中,服务器将终端设备的声能校准系数与终端设备的第一能量值的和,确定为终端设备的第二能量值。
228.s806、服务器根据终端设备的第二能量值,确定终端设备是否唤醒。
229.在一些实施例中,若终端设备的第二能量值大于预设值时,服务器确定终端设备唤醒。
230.在一种实施例中,服务器根据接收到的m个第一设备中每个第一设备的第二能量值,在确定终端设备的第二能量值为m个第一设备的第二能量值中的最大能量值时,确定终端设备唤醒。
231.服务器在确定终端设备唤醒时,向终端设备发送唤醒指令,该唤醒指令用于指示终端设备唤醒。终端设备在接收到唤醒指令时,唤醒。
232.本技术实施例,通过上述校准方法,确定出终端设备的能量值校准系数,在实际唤醒过程中,根据终端设备的能量值校准系数对终端设备的第一能量值进行校准,得到第二能量值,并根据第二能量值确定终端设备是否唤醒,进而消除了由于终端设备之间的硬件差异造成的唤醒不准确的问题。
233.在一些实施例中,终端设备自身可以确定是否唤醒,具体如图9所示。
234.图9为本技术一实施例提供的设备唤醒方法的流程示意图,如图9所示,包括:
235.s901、终端设备接收唤醒声音信号。
236.其中,唤醒声音信号用于唤醒m个第一设备中的目标设备,终端设备为m个第一设备中的一个第一设备,m个第一设备中每个第一设备的唤醒声音信号相同,m为正整数。
237.s902、终端设备获取终端设备中的麦克风在接收到唤醒声音信号时所产生的振幅。
238.s903、终端设备根据振幅,确定终端设备所检测到的唤醒声音信号的第一能量值。
239.在一些实施例中,终端设备根据麦克风所产生的振幅,以及唤醒声音信号的物理参数,确定终端设备所检测到的唤醒声音信号的第一能量值。
240.在一种可能的实现方式中,终端设备可以将麦克风对于该唤醒声音信号所产生的振幅,以及该唤醒声音信号的频率的乘积,确定终端设备所检测到的唤醒声音信号的第一能量值。
241.在另一种可能的实现方式中,终端设备可以根据上述公式(2)确定终端设备所检测到的唤醒声音信号的第一能量值。
242.s904、终端设备根据终端设备的声能校准系数,对终端设备的第一能量值进行校正,得到终端设备的第二能量值。
243.在一种示例中,终端设备将终端设备的声能校准系数与终端设备的第一能量值的乘积,确定为终端设备的第二能量值。
244.在另一种示例中,终端设备将终端设备的声能校准系数与终端设备的第一能量值的和,确定为终端设备的第二能量值。
245.s905、终端设备根据终端设备的第二能量值,确定终端设备是否唤醒。
246.在一种实施例中,s905包括s905
‑
a1和s905
‑
a2:
247.s905
‑
a1、终端设备获取m个第一设备中除终端设备之外的第一设备的第二能量值;
248.s905
‑
a2、终端设备在确定终端设备的第二能量值为m个第一设备的第二能量值中的最大能量值时,确定终端设备唤醒。
249.本技术实施例,通过上述校准方法,确定出终端设备的能量值校准系数,在实际唤醒过程中,根据终端设备的能量值校准系数对终端设备的第一能量值进行校准,得到第二能量值,并根据第二能量值确定终端设备是否唤醒,进而消除了由于终端设备之间的硬件差异造成的唤醒不准确的问题。
250.以上结合附图详细描述了本技术的优选实施方式,但是,本技术并不限于上述实施方式中的具体细节,在本技术的技术构思范围内,可以对本技术的技术方案进行多种简单变型,这些简单变型均属于本技术的保护范围。例如,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本技术对各种可能的组合方式不再另行说明。又例如,本技术的各种不同的实施方式之间也可以进行任意组合,只要其不违背本技术的思想,其同样应当视为本技术所公开的内容。
251.还应理解,在本技术的各种方法实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术实施例的实施过程构成任何限定。
252.上文结合图2至图9,详细描述了本技术的方法实施例,下文结合图10至图20,详细描述本技术的装置实施例。
253.图10为本技术实施例提供的声音能量值的校准装置的一种结构示意图。声音能量值的校准装置10可以为上述的被校准设备,或者为被校准设备中的部件,例如为被校准设备中的处理器。
254.如图10所示,声音能量值的校准装置10包括:
255.接收单元11,用于接收校准声源发出的n个校准声音信号,所述被校准设备与所述校准声源之间的距离为预设距离,所述n为正整数;
256.处理单元12,用于获取所述被校准设备中的麦克风在接收到所述n个校准声音信号中每个校准声音信号时所产生的振幅;根据所述麦克风对于每个所述校准声音所产生的振幅,确定所述被校准设备所检测到的每个所述校准声音信号的能量值;根据所述被校准设备所检测到的每个所述校准声音信号的能量值,确定所述被校准设备的声能校准系数。
257.在一些实施例中,处理单元12,具体用于根据每个所述校准声音信号的能量值和每个所述校准声音信号对应的参考能量值,确定所述被校准设备的声能校准系数。
258.在一些实施例中,若所述n个校准声音信号的频率相同,处理单元12,具体用于根据所述n个校准声音信号中每个所述校准声音信号的能量值,确定所述n个校准声音信号的能量值的平均值;根据所述n个校准声音信号的能量值的平均值和所述校准声音信号对应的参考能量值,确定所述被校准设备的声能校准系数。
259.在一些实施例中,处理单元12,具体用于将所述校准声音信号对应的参考能量值与所述n个校准声音信号的能量值的平均值的比值,确定为所述被校准设备的声能校准系
数。
260.在一些实施例中,处理单元12,具体用于剔除所述n个校准声音信号的能量值中的最小能量值和最大能量值,将剔除后的n
‑
2个校准声音信号的能量值的平均值,确定为所述n个校准声音信号的能量值的平均值。
261.在一些实施例中,若所述n个校准声音信号的频率不完全相同,处理单元12,具体用于针对所述n个校准声音信号中每个所述校准声音信号,根据所述校准声音信号的能量值和所述校准声音信号的参考能量值,确定所述被校准设备对于所述校准声音信号的声能校准系数;根据所述被校准设备对于所述n个校准声音信号中每个所述校准声音信号的声能校准系数,确定所述被校准设备的声能校准系数。
262.在一些实施例中,处理单元12,具体用于根据所述被校准设备对于所述n个校准声音信号中每个所述校准声音信号的声能校准系数,确定所述被校准设备对于所述n个校准声音信号的声能校准系数的平均值;将所述被校准设备对于所述n个校准声音信号的声能校准系数的平均值,确定为所述被校准设备的声能校准系数。
263.在一些实施例中,处理单元12,具体用于剔除所述被校准设备对于所述n个校准声音信号中每个所述校准声音信号的声能校准系数中的最小声能校准系数和最大声能校准系数;将所述被校准设备对于剔除后的n
‑
2个校准声音信号的声能校准系数的平均值,确定为所述被校准设备对于所述n个校准声音信号的声能校准系数的平均值。
264.在一些实施例中,处理单元12,具体用于将所述校准声音信号对应的参考能量值与所述校准声音信号的能量值的比值,确定为所述被校准设备对于所述校准声音信号的声能校准系数。
265.在一些实施例中,处理单元12,具体用于根据所述麦克风对于每个所述校准声音所产生的振幅,以及每个所述校准声音信号的物理参数,确定所述被校准设备所检测到的每个所述校准声音信号的能量值。
266.在一些实施例中,所述校准声音信号的物理参数包括所述校准声音信号的频率、所述校准声音信号的波速、以及所述校准声音信号的传输介质的密度中的至少一个。
267.应理解,装置实施例与方法实施例可以相互对应,类似的描述可以参照方法实施例。为避免重复,此处不再赘述。具体地,图10所示的声音能量值的校准装置可以对应于执行本技术实施例的方法中的相应主体,并且声音能量值的校准装置10中的各个模块的前述和其它操作和/或功能分别为了实现图5中的各个方法中被校准设备的相应流程,为了简洁,在此不再赘述。
268.图11为本技术实施例提供的声音能量值的校准装置的一种结构示意图。声音能量值的校准装置20可以为上述的被校准设备,或者为被校准设备中的部件,例如为被校准设备中的处理器。
269.如图11所示,声音能量值的校准装置20包括:
270.接收单元21,用于接收校准声源发出的n个校准声音信号,所述被校准设备与所述校准声源之间的距离为预设距离,所述n为正整数;
271.处理单元22,用于获取所述被校准设备中的麦克风在接收到所述n个校准声音信号中每个校准声音信号时所产生的振幅;根据所述麦克风对于每个所述校准声音所产生的振幅,确定所述被校准设备所检测到的每个所述校准声音信号的能量值;
272.发送单元23,用于将所述n个校准声音信号中每个校准声音信号的能量值发送给服务器,以使所述服务器根据每个所述校准声音信号的能量值和每个所述校准声音信号对应的参考能量值,确定所述被校准设备的声能校准系数。
273.在一些实施例中,接收单元21,还用于接收所述服务器发送的所述被校准设备的声能校准系数。
274.在一些实施例中,处理单元22,具体用于根据所述麦克风对于每个所述校准声音信号所产生的振幅,以及每个所述校准声音信号的物理参数,确定所述被校准设备所检测到的每个所述校准声音信号的能量值。
275.在一些实施例中,所述校准声音信号的物理参数包括所述校准声音信号的频率、所述校准声音信号的波速、以及所述校准声音信号的传输介质的密度中的至少一个。
276.应理解,装置实施例与方法实施例可以相互对应,类似的描述可以参照方法实施例。为避免重复,此处不再赘述。具体地,图11所示的装置可以对应于执行本技术实施例的方法中的相应主体,并且声音能量值的校准装置20中的各个模块的前述和其它操作和/或功能分别为了实现图3中的各个方法中被校准设备的相应流程,为了简洁,在此不再赘述。
277.图12为本技术实施例提供的声音能量值的校准装置的一种结构示意图。声音能量值的校准装置30可以为上述的被校准设备,或者为被校准设备中的部件,例如为被校准设备中的处理器。
278.如图12所示,声音能量值的校准装置30包括:
279.接收单元31,用于接收校准声源发出的n个校准声音信号,所述被校准设备与所述校准声源之间的距离为预设距离,所述n为正整数;
280.处理单元32,用于获取所述被校准设备中的麦克风在接收到所述n个校准声音信号中每个校准声音信号时所产生的振幅;
281.发送单元33,用于将所述麦克风在接收到所述n个校准声音信号中每个校准声音信号时所产生的振幅,发送给所述服务器,以使所述服务器根据所述振幅,确定所述被校准设备的声能校准系数。
282.在一些实施例中,接收单元31,还用于接收所述服务器发送的所述被校准设备的声能校准系数。
283.应理解,装置实施例与方法实施例可以相互对应,类似的描述可以参照方法实施例。为避免重复,此处不再赘述。具体地,图12所示的装置可以对应于执行本技术实施例的方法中的相应主体,并且声音能量值的校准装置30中的各个模块的前述和其它操作和/或功能分别为了实现图4中的各个方法中被校准设备的相应流程,为了简洁,在此不再赘述。
284.图13为本技术实施例提供的声音能量值的校准装置的一种结构示意图。声音能量值的校准装置40可以为上述的服务器,或者为服务器中的部件,例如为服务器中的处理器。
285.如图13所示,声音能量值的校准装置40包括:
286.接收单元41,用于接收所述被校准设备发送的n个校准声音信号中每个校准声音信号的能量值,所述校准声音信号是校准声源发出的,所述被校准设备与所述校准声源之间的距离为预设距离,所述n为正整数;
287.处理单元42,用于根据所述n个校准声音信号中每个校准声音信号的能量值,确定所述被校准设备的声能校准系数。
288.在一些实施例中,处理单元42,具体用于根据每个所述校准声音信号的能量值和每个所述校准声音信号对应的参考能量值,确定所述被校准设备的声能校准系数。
289.在一些实施例中,若所述n个校准声音信号的频率相同,则处理单元42,具体用于根据所述n个校准声音信号中每个所述校准声音信号的能量值,确定所述n个校准声音信号的能量值的平均值;根据所述n个校准声音信号的能量值的平均值和所述校准声音信号对应的参考能量值,确定所述被校准设备的声能校准系数。
290.在一些实施例中,处理单元42,具体用于将所述校准声音信号对应的参考能量值与所述n个校准声音信号的能量值的平均值的比值,确定为所述被校准设备的声能校准系数。
291.在一些实施例中,处理单元42,具体用于剔除所述n个校准声音信号的能量值中的最小能量值和最大能量值,将剔除后的n
‑
2个校准声音信号的能量值的平均值,确定为所述n个校准声音信号的能量值的平均值。
292.在一些实施例中,若所述n个校准声音信号的频率不完全相同,处理单元42,具体用于针对所述n个校准声音信号中每个所述校准声音信号,根据所述校准声音信号的能量值和所述校准声音信号的参考能量值,确定所述被校准设备对于所述校准声音信号的声能校准系数;根据所述被校准设备对于所述n个校准声音信号中每个所述校准声音信号的声能校准系数,确定所述被校准设备的声能校准系数。
293.在一些实施例中,处理单元42,具体用于根据所述被校准设备对于所述n个校准声音信号中每个所述校准声音信号的声能校准系数,确定所述被校准设备对于所述n个校准声音信号的声能校准系数的平均值;将所述被校准设备对于所述n个校准声音信号的声能校准系数的平均值,确定为所述被校准设备的声能校准系数。
294.在一些实施例中,处理单元42,具体用于剔除所述被校准设备对于所述n个校准声音信号中每个所述校准声音信号的声能校准系数中的最小声能校准系数和最大声能校准系数;将所述被校准设备对于剔除后的n
‑
2个校准声音信号的声能校准系数的平均值,确定为所述被校准设备对于所述n个校准声音信号的声能校准系数的平均值。
295.在一些实施例中,处理单元42,具体用于将所述校准声音信号对应的参考能量值与所述校准声音信号的能量值的比值,确定为所述被校准设备对于所述校准声音信号的声能校准系数。
296.在一些实施例中,声音能量值的校准装置还包括发送单元43,发送单元43,还用于将确定所述被校准设备的声能校准系数发送给所述被校准设备。
297.应理解,装置实施例与方法实施例可以相互对应,类似的描述可以参照方法实施例。为避免重复,此处不再赘述。具体地,图13所示的装置可以对应于执行本技术实施例的方法中的相应主体,并且声音能量值的校准装置40中的各个模块的前述和其它操作和/或功能分别为了实现图3中的各个方法中服务器的相应流程,为了简洁,在此不再赘述。
298.图14为本技术实施例提供的声音能量值的校准装置的一种结构示意图。声音能量值的校准装置50可以为上述的服务器,或者为服务器中的部件,例如为服务器中的处理器。
299.如图14所示,声音能量值的校准装置50包括:
300.接收单元51,用于接收被校准设备发送的所述被校准设备中的麦克风在接收到所述n个校准声音信号中每个校准声音信号时所产生的振幅,其中所述校准声音信号是校准
声源发出的,所述被校准设备与所述校准声源之间的距离为预设距离,所述n为正整数;
301.处理单元52,用于根据所述麦克风对于每个所述校准声音所产生的振幅,确定所述被校准设备所检测到的每个所述校准声音信号的能量值;根据所述被校准设备所检测到的每个所述校准声音信号的能量值,确定所述被校准设备的声能校准系数。
302.在一些实施例中,处理单元52,具体用于根据每个所述校准声音信号的能量值和每个所述校准声音信号对应的参考能量值,确定所述被校准设备的声能校准系数。
303.在一些实施例中,若所述n个校准声音信号的频率相同,则处理单元52,具体用于根据所述n个校准声音信号中每个所述校准声音信号的能量值,确定所述n个校准声音信号的能量值的平均值;根据所述n个校准声音信号的能量值的平均值和所述校准声音信号对应的参考能量值,确定所述被校准设备的声能校准系数。
304.在一些实施例中,处理单元52,具体用于将所述校准声音信号对应的参考能量值与所述n个校准声音信号的能量值的平均值的比值,确定为所述被校准设备的声能校准系数。
305.在一些实施例中,处理单元52,具体用于剔除所述n个校准声音信号的能量值中的最小能量值和最大能量值,将剔除后的n
‑
2个校准声音信号的能量值的平均值,确定为所述n个校准声音信号的能量值的平均值。
306.在一些实施例中,若所述n个校准声音信号的频率不完全相同,则处理单元52,具体用于针对所述n个校准声音信号中每个所述校准声音信号,根据所述校准声音信号的能量值和所述校准声音信号的参考能量值,确定所述被校准设备对于所述校准声音信号的声能校准系数;根据所述被校准设备对于所述n个校准声音信号中每个所述校准声音信号的声能校准系数,确定所述被校准设备的声能校准系数。
307.在一些实施例中,处理单元52,具体用于根据所述被校准设备对于所述n个校准声音信号中每个所述校准声音信号的声能校准系数,确定所述被校准设备对于所述n个校准声音信号的声能校准系数的平均值;将所述被校准设备对于所述n个校准声音信号的声能校准系数的平均值,确定为所述被校准设备的声能校准系数。
308.在一些实施例中,处理单元52,具体用于剔除所述被校准设备对于所述n个校准声音信号中每个所述校准声音信号的声能校准系数中的最小声能校准系数和最大声能校准系数;将所述被校准设备对于剔除后的n
‑
2个校准声音信号的声能校准系数的平均值,确定为所述被校准设备对于所述n个校准声音信号的声能校准系数的平均值。
309.在一些实施例中,处理单元52,具体用于将所述校准声音信号对应的参考能量值与所述校准声音信号的能量值的比值,确定为所述被校准设备对于所述校准声音信号的声能校准系数。
310.在一些实施例中,处理单元52,具体用于根据所述麦克风对于每个所述校准声音所产生的振幅,以及每个所述校准声音信号的物理参数,确定所述被校准设备所检测到的每个所述校准声音信号的能量值。
311.在一些实施例中,所述校准声音信号的物理参数包括所述校准声音信号的频率、所述校准声音信号的波速、以及所述校准声音信号的传输介质的密度中的至少一个。
312.在一些实施例中,声音能量值的校准装置50还包括发送单元53,发送单元53,具体用于将确定所述被校准设备的声能校准系数发送给所述被校准设备。
313.应理解,装置实施例与方法实施例可以相互对应,类似的描述可以参照方法实施例。为避免重复,此处不再赘述。具体地,图14所示的装置可以对应于执行本技术实施例的方法中的相应主体,并且声音能量值的校准装置50中的各个模块的前述和其它操作和/或功能分别为了实现图4中的各个方法中服务器的相应流程,为了简洁,在此不再赘述。
314.图15为本技术实施例提供的设备唤醒装置的一种结构示意图。设备唤醒装置60可以为上述的终端设备,或者为终端设备中的部件,例如为终端设备中的处理器。
315.如图15所示,设备唤醒装置60包括:
316.接收单元61,用于接收唤醒声音信号,所述唤醒声音信号用于唤醒m个第一设备中的目标设备,所述终端设备为所述m个第一设备中的一个第一设备,所述m个第一设备中每个第一设备的唤醒声音信号相同,所述m为正整数;
317.处理单元62,用于获取所述终端设备中的麦克风在接收到所述唤醒声音信号时所产生的振幅;根据所述振幅,确定所述终端设备所检测到的所述唤醒声音信号的第一能量值;根据所述终端设备的声能校准系数,对所述终端设备的第一能量值进行校正,得到所述终端设备的第二能量值;根据所述终端设备的第二能量值,确定所述终端设备是否唤醒。
318.在一些实施例中,处理单元62,具体用于获取所述m个第一设备中除所述终端设备之外的第一设备的第二能量值;在确定所述终端设备的第二能量值为所述m个第一设备的第二能量值中的最大能量值时,确定所述终端设备唤醒。
319.在一些实施例中,处理单元62,具体用于将所述终端设备的声能校准系数与所述终端设备的第一能量值的乘积,确定为所述终端设备的第二能量值。
320.应理解,装置实施例与方法实施例可以相互对应,类似的描述可以参照方法实施例。为避免重复,此处不再赘述。具体地,图15所示的装置可以对应于执行本技术实施例的方法中的相应主体,并且设备唤醒装置60中的各个模块的前述和其它操作和/或功能分别为了实现图6中的各个方法中终端设备的相应流程,为了简洁,在此不再赘述。
321.图16为本技术实施例提供的设备唤醒装置的一种结构示意图。设备唤醒装置70可以为上述的终端设备,或者为终端设备中的部件,例如为终端设备中的处理器。
322.如图16所示,设备唤醒装置70包括:
323.接收单元71,用于接收唤醒声音信号,所述唤醒声音信号用于唤醒m个第一设备中的目标设备,所述终端设备为所述m个第一设备中的一个第一设备,所述m个第一设备中每个第一设备的唤醒声音信号相同,所述m为正整数;
324.处理单元72,用于获取所述终端设备中的麦克风在接收到所述唤醒声音信号时所产生的振幅;根据所述振幅,确定所述终端设备所检测到的所述唤醒声音信号的第一能量值;
325.发送单元73,用于将所述第一能量值发送给所述服务器,以使所述服务器对所述终端设备的第一能量值进行校准得到第二能量值,并根据所述第二能量值确定所述终端设备是否唤醒。
326.在一些实施例中,接收单元71,具体用于接收所述服务器发送的唤醒指令,所述唤醒指令是所述服务器在确定所述终端设备的第二能量值为所述终端设备所属的m个第一设备的第二能量值中最大的能量值时发送的;
327.处理单元72,用于根据所述唤醒指令唤醒。
328.应理解,装置实施例与方法实施例可以相互对应,类似的描述可以参照方法实施例。为避免重复,此处不再赘述。具体地,图15所示的装置可以对应于执行本技术实施例的方法中的相应主体,并且设备唤醒装置70中的各个模块的前述和其它操作和/或功能分别为了实现图8中的各个方法中终端设备的相应流程,为了简洁,在此不再赘述。
329.图17为本技术实施例提供的设备唤醒装置的一种结构示意图。设备唤醒装置80可以为上述的终端设备,或者为终端设备中的部件,例如为终端设备中的处理器。
330.如图17所示,设备唤醒装置80包括:
331.接收单元81,用于接收唤醒声音信号,所述唤醒声音信号用于唤醒m个第一设备中的目标设备,所述终端设备为所述m个第一设备中的一个第一设备,所述m个第一设备中每个第一设备的唤醒声音信号相同,所述m为正整数;
332.处理单元82,用于获取所述终端设备中的麦克风在接收到所述唤醒声音信号时所产生的振幅;
333.发送单元83,用于将所述麦克风在接收到所述唤醒声音信号时所产生的振幅发送给所述服务器,以使所述服务器根据所述振幅,确定所述终端设备是否唤醒。
334.在一些实施例中,接收单元81,还用于接收所述服务器发送的唤醒指令,所述唤醒指令是所述服务器根据所述振幅确定所述终端设备的第一能量值,并使用所述终端设备的声能校准系数,对所述终端设备的第一能量值进行校正,得到所述终端设备的第二能量值,在确定所述终端设备的第二能量值为所述m个第一设备的第二能量值中最大的能量值时发送的。
335.处理单元82,还用于根据所述唤醒指令唤醒。
336.应理解,装置实施例与方法实施例可以相互对应,类似的描述可以参照方法实施例。为避免重复,此处不再赘述。具体地,图17所示的装置可以对应于执行本技术实施例的方法中的相应主体,并且设备唤醒装置80中的各个模块的前述和其它操作和/或功能分别为了实现图9中的各个方法中终端设备的相应流程,为了简洁,在此不再赘述。
337.图18为本技术实施例提供的设备唤醒装置的一种结构示意图。设备唤醒装置90可以为上述的服务器,或者为服务器中的部件,例如为服务器中的处理器。
338.如图18所示,设备唤醒装置90包括:
339.接收单元91,用于接收终端设备发送的第一能量值,所述第一能量值是所述终端设备根据麦克风在接收到所述唤醒声音信号时所产生的振幅确定的;
340.处理单元92,用于根据所述终端设备的声能校准系数,对所述终端设备的第一能量值进行校正,得到所述终端设备的第二能量值;根据所述终端设备的第二能量值,确定所述终端设备是否唤醒。
341.在一些实施例中,设备唤醒装置90还包括发送单元93;处理单元92,具体用于根据接收到的m个第一设备中每个第一设备的第二能量值,在确定所述终端设备的第二能量值为所述m个第一设备的第二能量值中的最大能量值时,确定所述终端设备唤醒;
342.发送单元93,用于向所述终端设备发送唤醒指令;
343.其中,所述终端设备为所述m个第一设备中的一个第一设备,所述m个第一设备中每个第一设备的唤醒声音信号相同,所述m为正整数。
344.在一些实施例中,处理单元92,具体用于将所述终端设备的声能校准系数与所述
终端设备的第一能量值的乘积,确定为所述终端设备的第二能量值。
345.应理解,装置实施例与方法实施例可以相互对应,类似的描述可以参照方法实施例。为避免重复,此处不再赘述。具体地,图18所示的装置可以对应于执行本技术实施例的方法中的相应主体,并且设备唤醒装置90中的各个模块的前述和其它操作和/或功能分别为了实现图8中的各个方法中服务器的相应流程,为了简洁,在此不再赘述。
346.图19为本技术实施例提供的设备唤醒装置的一种结构示意图。设备唤醒装置400可以为上述的服务器,或者为服务器中的部件,例如为服务器中的处理器。
347.如图19所示,设备唤醒装置400包括:
348.接收单元410,用于接收终端设备发送的终端设备中的麦克风在接收到所述唤醒声音信号时所产生的振幅;
349.处理单元420,用于根据所述振幅,确定所述终端设备所检测到的所述唤醒声音信号的第一能量值;根据所述终端设备的声能校准系数,对所述终端设备的第一能量值进行校正,得到所述终端设备的第二能量值;根据所述终端设备的第二能量值,确定所述终端设备是否唤醒。
350.在一些实施例中,设备唤醒装置400还包括发送单元430;
351.处理单元420,具体用于根据接收到的m个第一设备中每个第一设备的第二能量值,在确定所述终端设备的第二能量值为所述m个第一设备的第二能量值中的最大能量值时,确定所述终端设备唤醒;
352.发送单元430,用于向所述终端设备发送唤醒指令;
353.其中,所述终端设备为所述m个第一设备中的一个第一设备,所述m个第一设备中每个第一设备的唤醒声音信号相同,所述m为正整数。
354.在一些实施例中,处理单元420,具体用于将所述终端设备的声能校准系数与所述终端设备的第一能量值的乘积,确定为所述终端设备的第二能量值。
355.应理解,装置实施例与方法实施例可以相互对应,类似的描述可以参照方法实施例。为避免重复,此处不再赘述。具体地,图19所示的装置可以对应于执行本技术实施例的方法中的相应主体,并且设备唤醒装置400中的各个模块的前述和其它操作和/或功能分别为了实现图9中的各个方法中服务器的相应流程,为了简洁,在此不再赘述。
356.上文中结合附图从功能模块的角度描述了本技术实施例的装置。应理解,该功能模块可以通过硬件形式实现,也可以通过软件形式的指令实现,还可以通过硬件和软件模块组合实现。具体地,本技术实施例中的方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路和/或软件形式的指令完成,结合本技术实施例公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。可选地,软件模块可以位于随机存储器,闪存、只读存储器、可编程只读存储器、电可擦写可编程存储器、寄存器等本领域的成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法实施例中的步骤。
357.图20为本技术实施例涉及的电子设备的框图,该设备可以是上述被校准设备、终端设备或服务器。
358.图20所示的电子设备500包括存储器501、处理器502、通信接口503。存储器501、处理器502、通信接口503之间彼此通信连接。例如,存储器501、处理器502、通信接口503之间
可以采用网络连接的方式,实现通信连接。或者,上述电子设备500还可以包括总线504。存储器501、处理器502、通信接口503通过总线504实现彼此之间的通信连接。图20是以存储器501、处理器502、通信接口503通过总线504实现彼此之间的通信连接的电子设备500。
359.存储器501可以是只读存储器(read only memory,rom),静态存储设备,动态存储设备或者随机存取存储器(random access memory,ram)。存储器501可以存储程序,当存储器501中存储的程序被处理器502执行时,处理器502和通信接口503用于执行上述方法。
360.处理器502可以采用通用的中央处理器(central processing unit,cpu),微处理器,应用专用集成电路(application specific integrated circuit,asic),图形处理器(graphics processing unit,gpu)或者一个或多个集成电路。
361.处理器502还可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,本技术的方法可以通过处理器502中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器502还可以是通用处理器、数字信号处理器(digital signal processing,dsp)、专用集成电路(asic)、现成可编程门阵列(field programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器501,处理器502读取存储器501中的信息,结合其硬件完成本技术实施例的方法。
362.通信接口503使用例如但不限于收发器一类的收发模块,来实现电子设备500与其他设备或通信网络之间的通信。例如,可以通过通信接口503获取数据集。
363.当上述电子设备500包括总线504时,总线504可包括在电子设备500各个部件(例如,存储器501、处理器502、通信接口503)之间传送信息的通路。
364.根据本技术的还提供了一种计算机存储介质,其上存储有计算机程序,该计算机程序被计算机执行时使得该计算机能够执行上述方法实施例的方法。或者说,本技术实施例还提供一种包含指令的计算机程序产品,该指令被计算机执行时使得计算机执行上述方法实施例的方法。
365.根据本技术的还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方法实施例的方法。
366.换言之,当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时,全部或部分地产生按照本技术实施例该的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储
设备。该可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如数字视频光盘(digital video disc,dvd))、或者半导体介质(例如固态硬盘(solid state disk,ssd))等。
367.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的模块及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
368.在本技术所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,该模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
369.作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。例如,在本技术各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。
370.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。另外,各个方法实施例之间、各个装置实施例之间也可以互相参考,在不同实施例中的相同或对应内容可以互相引用,不做赘述。