首页 > 乐器声学 专利正文
语音处理方法、装置、电子设备和存储介质与流程

时间:2022-02-20 阅读: 作者:专利查询

语音处理方法、装置、电子设备和存储介质与流程

1.本发明涉及家用电器技术领域,尤其涉及一种语音处理方法、装置、电子设备和存储介质。


背景技术:

2.随着科技发展,家用电器越来越智能化。目前,许多家用电器都配备有语音交互功能,用户能够通过语音交互功能实现对家电电器的控制。
3.但在有些情况下,智能设备的语音唤醒功能容易出现误唤醒的问题。例如,电视在播放时,智能设备会将电视播放的声音当做用户的声音来进行识别处理,并在电视播放的声音包含唤醒语句时,持续地进行语义交互,产生误唤醒的问题。


技术实现要素:

4.为解决智能设备容易发生误唤醒的问题,本发明实施例提供一种语音处理方法、装置、电子设备和存储介质。
5.本发明实施例的技术方案是这样实现的:
6.本发明实施例提供了一种语音处理方法,方法包括:
7.在识别到唤醒语句后,将设备从静默状态切换至唤醒状态,并接收所述唤醒语句之后的第一语音信息;
8.判断所述第一语音信息是否包含有效指示;
9.在判断所述语音信息不包含有效指示时,将所述设备从所述唤醒状态切换成所述静默状态。
10.上述方案中,在识别到唤醒语句之后,所述方法还包括:
11.回复预设反馈语。
12.上述方案中,所述方法包括:
13.采用全双工模式在接收线路接收语音信息,在发送线路发送所述预设反馈语。
14.上述方案中,所述将设备从静默状态切换至唤醒状态包括:
15.激活所述设备的在线模块;其中,所述在线模块用于解析语音信息中的语义信息,从语义信息中获取控制指令和执行所述控制指令。
16.上述方案中,所述判断所述第一语音信息是否包含有效指示,包括:
17.使用所述在线模块判断所述第一语音信息是否包含有效指示。
18.上述方案中,在识别到唤醒语句之前,所述方法还包括:
19.使用离线模块识别是否包含唤醒语句。
20.本发明实施例还提供了一种语音处理装置,语音处理装置包括:
21.离线模块,用于识别唤醒语句;
22.在线模块,用于在识别到唤醒语句后,将设备从静默状态切换至唤醒状态,接收所述唤醒语句之后的第一语音信息;判断所述第一语音信息是否包含有效指示;并在判断所
述语音信息不包含有效指示时,将所述设备从所述唤醒状态切换成所述静默状态。
23.上述方案中,所述在线模块包含第一接收器和第一发送器;所述离线模块包括第二接收器和第二发送器;所述第一接收器和所述第二接收器用于接收语音信息;所述第一发送器和所述第二发送器用于发送预设反馈语。
24.本发明实施例还提供了一种电子设备,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器;其中,
25.处理器用于运行计算机程序时,执行上述任一方法的步骤。
26.本发明实施例还提供了一种存储介质,存储介质中存储有计算机程序,计算机程序被处理器执行时,实现上述任一方法的步骤。
27.本发明实施例提供的语音处理方法、装置、电子设备和存储介质,在识别到唤醒语句后,将设备从静默状态切换至唤醒状态,并接收所述唤醒语句之后的第一语音信息;判断所述第一语音信息是否包含有效指示;在判断所述语音信息不包含有效指示时,将所述设备从所述唤醒状态切换成所述静默状态。采用本发明提供的方案能有效避免智能设备误唤醒。
附图说明
28.图1为本发明实施例一语音处理方法的流程示意图;
29.图2为本发明实施例全双工模式示意图;
30.图3为本发明实施例全双工模式与其他语音交互模式对比示意图;
31.图4为本发明实施例一智能设备部分结构示意图;
32.图5为本发明实施例一语音处理装置的结构示意图;
33.图6为本发明实施例计算机设备的内部结构图。
具体实施方式
34.下面将结合附图及实施例对本发明作进一步详细的描述。
35.本发明实施例提供了一种语音处理方法,如图1所示,该方法包括:
36.步骤101:在识别到唤醒语句后,将设备从静默状态切换至唤醒状态,并接收所述唤醒语句之后的第一语音信息;
37.步骤102:判断所述第一语音信息是否包含有效指示;
38.步骤103:在判断所述语音信息不包含有效指示时,将所述设备从所述唤醒状态切换成所述静默状态。
39.目前,在有些情况下,智能设备的语音唤醒功能容易出现误唤醒的问题。针对这一问题,现有技术中有一种解决办法,就是在终端硬件上设置降噪处理、通过在算法上对语音信息进行滤波降噪的优化,来实现排除非用户本身发出的声音所引起误唤醒的问题。但这种通过降噪处理来解决误唤醒问题的方式有时也会处理有误,例如有时也会对人本身发出的声音进行一部分的过滤,从而在需要正常的唤醒时无法被唤醒。因此,现有技术中的解决方法存在缺陷。
40.而本技术提供的方案,能在接收到的语音信息中识别到唤醒语句后,唤醒设备并继续接收所述唤醒语句之后的第一语音信息;判断所述第一语音信息是否包含有效指示;
在判断所述语音信息不包含有效指示时,结束这次唤醒。既能通过判断语音信息是否包含有效指示来有效避免误唤醒,同时在识别到唤醒语句后,继续接收语音信息,能避免遗漏用户语音信息,避免因为遗漏用户语音信息而导致判断有误,提高判断准确率。
41.这里,本实施例中的方法可应用于智能设备,包括智能电视机、智能冰箱、智能空调、智能电饭煲等。且该智能设备具有语音交互功能,能与用户进行语音交互。即该智能设备应具有语音采集、语音识别功能。
42.进一步地,本实施例中的唤醒语句可以根据使用需要进行设定。例如,设定为格力电器为唤醒语句,也可以设定格力冰箱为唤醒语句等。
43.具体地,本实施例中的唤醒状态指运行设备的所有功能,包括识别语音信息中是否包含唤醒语句、解析语音信息中的语义信息、从语义信息中获取控制指令和执行控制指令等。静默状态指仅运行设备的识别语音信息中是否包含唤醒语句等功能,其他功能例如解析语音信息中的语义信息、从语义信息中获取控制指令和执行控制指令等功能关闭。
44.为实现在接收到的语音信息中识别到唤醒语句后,能继续接收所述唤醒语句之后的第一语音信息。这里,采用全双工模式在接收线路接收语音信息,在发送线路发送预设反馈语。
45.具体地,参见图2,全双工模式(full duplex)是指数据的发送和接收分流,分别由两根不同的传输线传送时,通信双方都能在同一时刻进行发送和接收操作,这样的传送方式就是全双工制。在全双工方式下,通信系统的每一端都设置了发送器和接收器,因此,能控制数据同时在两个方向上传送。全双工方式无需进行方向的切换,因此,没有切换操作所产生的时间延迟,这对那些不能有时间延误的交互式应用(例如远程监测和控制系统)十分有利。这种方式要求通讯双方均有发送器和接收器,同时,需要2根数据线传送数据信号。例如,电话就是标准的全双工模式。电话和早期的对讲机不同,对讲机属于半双工,在同一时间只可以一方传送一方接受。而全双工则可以同一时间内的双方都可以接受发送数据。
46.实际应用时,家用智能设备一般都不采用全双工模式,而本实施例中,智能设备在接收和发送语音时,采用全双工模式,能实时进行语音的接收处理,将识别唤醒语句之后的语音接收和语音发送分成两部分,提高语音接收实时率,避免遗漏重要语音信息,提高语音识别准确率,增强用户交互体验。
47.这里,全双工模式与其他语音交互模式的对比图可参见图3。其中,很明显,与单轮交互模式、多轮交互模式和持续监听模式相比,全双工交互不会遗漏语音信息,能实时接收语音,没有时间延时,语音交互效果好。
48.进一步地,在一实施例中,所述判断所述第一语音信息是否包含有效指示,包括:
49.判断所述第一语音信息中是否包含预设控制语句;
50.当所述第一语音信息中不包含预设控制语句时,判断所述第一语音信息不是有效指示。
51.具体地,可以预设多个预设命令词组,将预设的多个预设命令词组作为预设控制语句,例如,将打开,关闭,调小,放大,切换、显示等作为预设命令词组。这里的预设命令词组可以根据需要进行设定。另外,这里的预设命令词组可以为出厂时预设的,也可以是用户自定义添加的。在识别到第一语音信息中没有包含上述预设命令词组时,判断第一语音信息不是有效指示,从而结束此次唤醒。
52.另外,在一实施例中,在接收到的语音信息中识别到唤醒语句之后,所述方法还包括:
53.回复预设反馈语。
54.实际应用时,预设反馈语可以根据使用情况进行设定。例如,设定为在、我在、在的、请问有什么需要、请问有什么指示等。这些预设反馈语用于回复用户,以使得用户知道本设备有接收到用户的语音信息,并正在进行处理。
55.另外,为实现模块的精细划分,基于上述语音处理方式,可在家用设备中设置在线模块和离线模块。这里,参见图4,智能设备中设置有离线模块和在线模块。离线模块和在线模块都包含接收器、发送器和通信模块。接收器用于接收语音信息,发送器用于发出语音信息,通信模块用于与其他模块或设备进行通信。另外,这里,在线模块还包括有语义处理模块,语义处理模块能够执行解析语音信息中的语义信息、从语义信息中获取控制指令和执行控制指令等功能操作。
56.具体地,在一实施例中,所述将所述设备从静默状态切换至唤醒状态包括:
57.激活所述设备的在线模块;其中,所述在线模块用于解析语音信息中的语义信息,从语义信息中获取控制指令和执行控制指令。
58.实际使用时,在一实施例中,可使用所述在线模块判断所述第一语音信息是否包含有效指示。
59.由于在线模块仅在唤醒时才运行,在没有唤醒时,是关闭的,因此,可以节约电器电量,减少功耗。
60.另外,在一实施例中,在接收到的语音信息中识别到唤醒语句之前,所述方法还包括:
61.使用离线模块接收语音信息,所述离线模块用于识别语音信息中是否包含唤醒语句。
62.这里,将唤醒模块分成在线模块和离线模块两种,接收部分在离线模块,而且离线模块包含回复语,仅在我们要启动控制和唤醒功能的时候,接收的语音信息才传输到在线模块部分。具体流程如下:为了避免误唤醒,接收语音模块在接受到语音后,如果未开启联网或者未开启在线功能,则只在离线模块进行回复语反馈;如果开启在线功能,则在接收到唤醒词后,离线模块进行回复语反馈,并且此时在线模块开始接收离线模块接收器的数据,即唤醒词之后的语音信息,对其进行语义解析,判断是否为控制命令或者其他设定的自定义话术控制段。若是控制命令或者其他设定的自定义话术控制段,则执行命令、继续交互;若不是控制命令或者其他设定的自定义话术控制段,则关闭此次唤醒。因此,通过上述方式可以区分是人在唤醒控制设备,还是电视、手机等其他终端的发送器发出的话术声音造成的误唤醒,从而避免设备误唤醒。
63.本发明实施例提供的语音处理方法,在接收到的语音信息中识别到唤醒语句后,唤醒设备并继续接收所述唤醒语句之后的第一语音信息;判断所述第一语音信息是否包含有效指示;在判断所述语音信息不是有效指示时,将所述设备从唤醒状态切换成静默状态。采用本发明提供的方案能有效避免智能设备误唤醒。
64.为了实现本发明实施例的方法,本发明实施例还提供了一种语音处理装置,如图5所示,语音处理装置500包括:离线模块501和在线模块502;其中,
65.离线模块501,用于识别唤醒语句;
66.在线模块502,用于在识别到唤醒语句后,将设备从静默状态切换至唤醒状态,接收所述唤醒语句之后的第一语音信息;判断所述第一语音信息是否包含有效指示;并在判断所述语音信息不包含有效指示时,将所述设备从所述唤醒状态切换成所述静默状态。
67.在一实施例中,离线模块501还用于:
68.回复预设反馈语。
69.在一实施例中,离线模块501还用于:
70.采用全双工模式在接收线路接收语音信息,在发送线路发送所述预设反馈语。
71.在一实施例中,在线模块502还用于:
72.激活所述设备的在线模块;其中,所述在线模块用于解析语音信息中的语义信息,从语义信息中获取控制指令和执行所述控制指令。
73.在一实施例中,在线模块502还用于:
74.使用所述在线模块判断所述第一语音信息是否包含有效指示。
75.在一实施例中,在线模块502还用于:
76.使用离线模块识别是否包含唤醒语句。
77.实际应用时,离线模块501和在线模块502可由语音处理装置中的处理器实现。
78.具体地,所述在线模块包含第一接收器和第一发送器;所述离线模块包括第二接收器和第二发送器;所述第一接收器和所述第二接收器用于接收语音信息;所述第一发送器和所述第二发送器用于发送预设反馈语。
79.需要说明的是:上述实施例提供的上述装置在执行时,仅以上述各程序模块的划分进行举例说明,实际应用时,可以根据需要而将上述处理分配由不同的程序模块完成,即将终端的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的上述装置与上述方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
80.基于上述程序模块的硬件实现,且为了实现本发明实施例的方法,本发明实施例还提供了一种电子设备(计算机设备)。具体地,在一个实施例中,该计算机设备可以是终端,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器a01、网络接口a02、显示屏a04、输入装置a05和存储器(图中未示出)。其中,该计算机设备的处理器a01用于提供计算和控制能力。该计算机设备的存储器包括内存储器a03和非易失性存储介质a06。该非易失性存储介质a06存储有操作系统b01和计算机程序b02。该内存储器a03为非易失性存储介质a06中的操作系统b01和计算机程序b02的运行提供环境。该计算机设备的网络接口a02用于与外部的终端通过网络连接通信。该计算机程序被处理器a01执行时以实现上述任意一项实施例的方法。该计算机设备的显示屏a04可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置a05可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
81.本领域技术人员可以理解,图6中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
82.本发明实施例提供的设备,设备包括处理器、存储器及存储在存储器上并可在处
理器上运行的程序,处理器执行程序时实现上述任意一项实施例的方法。
83.本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd

rom、光学存储器等)上实施的计算机程序产品的形式。
84.本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
85.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
86.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
87.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
88.存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。存储器是计算机可读介质的示例。
89.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd

rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
90.可以理解,本发明实施例的存储器可以是易失性存储器或者非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(rom,read only memory)、可编程只读存储器(prom,programmable read

only memory)、可擦除可编程只读存储器(eprom,erasable programmable read

only memory)、电可擦除可编程只读存储器(eeprom,electrically erasable programmable read

only memory)、磁性随机存取存储器(fram,ferromagnetic random access memory)、快闪存储器(flash memory)、磁
表面存储器、光盘、或只读光盘(cd

rom,compact disc read

only memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(ram,random access memory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(sram,static random access memory)、同步静态随机存取存储器(ssram,synchronous static random access memory)、动态随机存取存储器(dram,dynamic random access memory)、同步动态随机存取存储器(sdram,synchronous dynamic random access memory)、双倍数据速率同步动态随机存取存储器(ddrsdram,double data rate synchronous dynamic random access memory)、增强型同步动态随机存取存储器(esdram,enhanced synchronous dynamic random access memory)、同步连接动态随机存取存储器(sldram,synclink dynamic random access memory)、直接内存总线随机存取存储器(drram,direct rambus random access memory)。本发明实施例描述的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
91.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
92.以上仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。