首页 > 乐器声学 专利正文
语音引擎的处理方法、装置、电子设备与存储介质与流程

时间:2022-01-23 阅读: 作者:专利查询

语音引擎的处理方法、装置、电子设备与存储介质与流程

1.本发明涉及语音信息处理领域,尤其涉及一种语音引擎的处理方法、装置、电子设备与存储介质。


背景技术:

2.在语音交互的过程中,终端(例如车机)与服务器之间可实现语音交互信息的交互传输,同时,可利用供应商的服务器对交互过程中产生的语音交互信息进行处理。
3.现有相关技术中,通常只能利用预先配置好的语音引擎及其所具有的处理功能对语音交互信息进行处理。然而,不同供应商的处理能力各不相同,例如某些供应商的语音引擎的某些处理功能比较优异,另某些处理功能则比较薄弱,故而,现有的方案难以适配满足处理需求,无法充分发挥各种语音引擎的优势。


技术实现要素:

4.本发明提供一种语音引擎的处理方法、装置、电子设备与存储介质,以解决难以适配满足处理需求,无法充分发挥各种语音引擎的优势的问题。
5.根据本发明的第一方面,提供了一种语音引擎的处理方法,包括:
6.获取语音交互过程中当前的语音交互信息;
7.基于目标处理功能与预设的选择规则,选择适配的引擎功能,所述引擎功能指一个处理端,及其语音引擎的至少一种处理功能;所述目标处理功能指:针对所述语音交互信息所需实施的一种或多种处理功能;所述处理端指供应商的云服务端或本地端;
8.在利用所述适配的引擎功能对所述语音交互信息处理完成后,通过目标终端对外反馈对应的处理结果;所述目标终端为实现所述语音交互过程的终端。
9.可选的,所述基于目标处理功能与预设的选择规则,选择适配的引擎功能,包括:
10.获取所述参考信息,所述参考信息包括以下至少之一:所述目标终端的当前环境信息、当前时间信息、云服务端的语音引擎的当前负荷情况,所述当前环境信息描述了所述目标终端所处环境;
11.基于所述参考信息、所述目标处理功能,以及所述选择规则,选择所述适配的引擎功能。
12.可选的,其中的处理功能包括以下任意之一:
13.唤醒词识别的功能;
14.自语音信号识别出文本的功能;
15.基于文本而形成语音信号的功能。
16.可选的,所述基于所述参考信息、所述目标处理功能,以及所述选择规则,选择所述适配的引擎功能,包括:
17.若所述环境的噪音程度高于噪音阈值,且所述目标处理功能为唤醒词识别的功能或自语音信号中识别出文本的功能时,则:选择预先指定的一个云服务端的引擎功能作为
所述适配的引擎功能。
18.可选的,所述基于所述参考信息、所述目标处理功能,以及所述选择规则,选择所述适配的引擎功能,包括:
19.若所述目标终端的网络信号质量低于信号质量阈值,则:选择本地的引擎功能作为所述适配的引擎功能。
20.可选的,所述处理方法应用于平台,所述平台能够与所述目标终端,以及各供应商的服务器通信。
21.可选的,所述目标终端为车载终端。
22.根据本发明的第二方面,提供了一种语音引擎的处理装置,包括:
23.获取模块,用于获取语音交互过程中当前的语音交互信息;
24.引擎功能选择模块,用于基于目标处理功能与预设的选择规则,选择适配的引擎功能,所述引擎功能指一个处理端,及其语音引擎的至少一种处理功能;所述目标处理功能指:针对所述语音交互信息所需实施的一种或多种处理功能;
25.反馈模块,用于在利用所述适配的引擎功能对所述语音交互信息处理完成后,通过目标终端对外反馈对应的处理结果;所述目标终端为实现所述语音交互过程的终端。
26.根据本发明的第三方面,提供了一种电子设备,包括处理器与存储器,
27.所述存储器,用于存储代码;
28.所述处理器,用于执行所述存储器中的代码用以实现第一方面及其可选方案涉及的方法。
29.根据本发明的第四方面,提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面及其可选方案涉及的方法。
30.本发明提供的语音引擎的处理方法、装置、电子设备与存储介质中,基于所需实施的目标处理功能与预设的选择规则,选择了适配的引擎功能,进而,可便于利用更合适的引擎功能对当前的语音交互信息进行处理,从而可针对性地适配满足处理需求,充分发挥各种语音引擎的优势,本发明为这种效果的实现提供了合适的途径。
附图说明
31.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
32.图1是本发明一实施例中语音引擎的处理方法的流程示意图;
33.图2是本发明一实施例中步骤s12的流程示意图;
34.图3是本发明一实施例中语音引擎的处理装置的程序模块示意图;
35.图4是本发明一实施例中电子设备的构造示意图。
具体实施方式
36.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于
本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
37.本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
38.下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
39.本发明实施例提供的语音引擎的处理方法,可应用于服务器、平台,也可应用于终端。例如:所述处理方法应用于平台,所述平台能够与所述目标终端,以及各供应商的服务器通信。
40.请参考图1,语音引擎的处理方法,包括:
41.s11:获取语音交互过程中当前的语音交互信息;
42.s12:基于目标处理功能与预设的选择规则,选择适配的引擎功能;
43.s13:在利用所述适配的引擎功能对所述语音交互信息处理完成后,通过目标终端对外反馈对应的处理结果。
44.其中的目标终端,可理解为用于实现语音交互过程的终端,若本发明实施例应用于车内环境的人机交互,则该目标终端可以为车载终端,若应用于其他环境,该目标终端可以为手机、平板电脑等移动终端,还可以为其他具有特定用途的终端。
45.其中的语音交互过程,可理解为人机间实现语音交互的过程,例如可以包括用户发出语音,从而令目标终端(例如车载终端)采集到相应语音信号的过程,以及目标终端(例如车载终端)发出反馈的声音信号(或通过其他方式反馈)从而令用户获悉的过程。
46.其中的语音交互信息,可理解为用于语音交互的任意信息,例如是需要转换为文本的语音信号,再例如需要从中识别出信息的语音信号,还例如需要转换(或合成)为语音信号的文本,又例如需要进行降噪、滤波处理的信号。
47.进而,语音交互信息可能源自目标终端,也可能源自其他服务器的处理结果,亦或是平台的处理结果。
48.其中的引擎功能可理解为一个处理端,及其语音引擎的至少一种处理功能,进而,适配的引擎功能,可理解为适配于对当前的语音交互信息执行目标处理功能的引擎功能。所述处理端指供应商的云服务端或本地端。该本地端可以指处理方法的执行主体(例如平台或目标终端等),也可以指目标终端本身。
49.其中的引擎选择规则中定义了:该如何选出适配的引擎功能;
50.其中的处理功能(例如目标处理功能、语音引擎的处理功能)包括以下任意之一:
51.唤醒词识别的功能;
52.自语音信号识别出文本的功能;
53.基于文本而形成语音信号的功能。
54.其他举例中,目标处理还可包括对语音信号进行降噪滤波的处理,语音信号的合并、拆分等,文本信息的合并、拆分等。
55.以上方案中,处理结果不再由唯一的一个供应商的语音引擎而提供,可有助于适配满足当前的实际需求。进而,可便于利用更合适的引擎功能对当前的语音交互信息进行处理,从而可针对性地适配满足处理需求,充分发挥各种语音引擎的优势,本发明为这种效果的实现提供了合适的途径。
56.其中一种实施方式中,请参考图2,步骤s12可以包括:
57.s121:获取参考信息;
58.所述参考信息包括以下至少之一:所述目标终端的当前环境信息、当前时间信息、云服务端的语音引擎的当前负荷情况;
59.s122:基于所述参考信息、所述目标处理功能,以及所述选择规则,选择所述适配的引擎功能。
60.其中,当前环境信息描述了所述目标终端所处环境,根据引擎选择规则所定义的内容不同,该当前环境信息可适应变化。
61.其中的当前负荷情况,可理解为对云服务端的语音引擎的负荷大小进行描述的任意信息。其中的负荷大小,可体现为需承担的处理量,也可体现为需承担的处理量与语音引擎所能承担的最大处理量的比值。
62.一种具体方案中,可预先针对每种处理功能配置各引擎功能的优先级(即针对每种处理功能,优先选哪个引擎功能来实现),然后,基于目标处理功能,实现各引擎功能的优先级排序;然后,可结合负荷情况、当前时间信息、当前环境信息中至少之一,再对排序结果进行调整(包括顺序的调整,也可包括对其中的引擎功能进行筛选),最终确定出优先级最高(或剩余引擎功能中优先级最高)的一个引擎功能作为所述适配的引擎功能。
63.一种举例中,其中的优先级也可体现为评分及基于评分的排序,进而,针对每种处理功能配置各引擎功能的优先级评分,然后,可结合负荷情况、当前时间信息、当前环境信息中至少之一对优先级评分进行调整,例如:不同的负荷情况、当前时间信息、当前环境信息,可赋予不同的调整分值,负荷情况、当前时间信息、当前环境信息还可赋予不同(或相同)的权重值,然后,通过未调整的优先级评分、调整分值的加权求和,可得到调整后的优先级评分,基于该调整后的优先级评分进行排序后,可选优先级最高的引擎功能作为适配的引擎功能。
64.再一举例中,其中的优先级仅体现为排序,进而,结合负荷情况、当前时间信息、当前环境信息中至少之一时,可实现对引擎功能的筛选,例如可在高峰期(例如早高峰、晚高峰的时候)限定为仅在部分语音引擎内选择适配的引擎功能,再例如,可将负荷情况较高的引擎功能排除。最终在筛选后的引擎功能中,选择优先级最高的引擎功能作为适配的引擎功能,或选择唯一剩下的引擎功能作为适配的引擎功能。
65.另一举例中,也可针对某些特定的当前环境信息,而唯一指定一个适配的引擎功能。
66.以下将结合噪音、网络信号两个因素而给出两个具体的例子。
67.一种具体的举例中,步骤s122可以包括:
68.若所述环境的噪音程度高于噪音阈值,且所述目标处理功能为唤醒词识别的功能
或自语音信号中识别出文本的功能时,则:选择预先指定的一个云服务端的引擎功能作为所述适配的引擎功能。
69.其中,所述环境的噪音程度可理解为一种当前环境信息,目标处理功能为唤醒词识别或自所述语音信号中识别出文本,进而,该“指定的一个云服务端的引擎功能”可理解为:预先被判断为降噪功能较佳的供应商的服务器所提供的引擎功能。
70.另一种具体的举例中,步骤s122可以包括:
71.若所述目标终端的网络信号质量低于信号质量阈值时,则:选择本地的引擎功能作为所述适配的引擎功能。
72.其中,所述目标终端的网络信号质量可理解为一种当前环境信息,通过以上方案可实现信号较差时的处理。
73.与之对应的,若目标终端的网络信号质量不低于所述信号质量阈值,则可采用其他方案而选择适配的引擎功能(例如可执行步骤s1221)。
74.其中一种实施方式中,步骤s12之后,还可包括:
75.若适配的引擎功能为云服务端的引擎功能,则可在将当前的语音交互信息发送至对应的云服务端(即发送至对应的供应商的云服务端)之后,自该云服务端获取处理结果。
76.还可指示该云服务端对所述当前的语音交互信息执行目标处理功能。
77.以上过程可例如通过调用云服务端所开放的相应接口来实现。
78.此外,部分实施方式中,也可将当前的语音交互信息发送至所有云服务端(即所有供应商的云服务端服务器),然后,在步骤s13中,仅挑选适配的引擎功能的处理结果作为需目标终端对外反馈的“对应的处理结果”。
79.请参考图3,本发明实施例还提供了一种语音引擎的处理装置2,包括:
80.获取模块21,用于获取语音交互过程中当前的语音交互信息;
81.引擎功能选择模块22,用于基于目标处理功能与预设的选择规则,选择适配的引擎功能,所述引擎功能指一个处理端,及其语音引擎的至少一种处理功能;所述目标处理功能指:针对所述语音交互信息所需实施的一种或多种处理功能;所述处理端指供应商的云服务端或本地端;
82.反馈模块23,用于在利用所述适配的引擎功能对所述语音交互信息处理完成后,通过目标终端对外反馈对应的处理结果;所述目标终端为实现所述语音交互过程的终端。
83.可选的,所述引擎功能选择模块22,具体用于:
84.获取所述参考信息,所述参考信息包括以下至少之一:所述目标终端的当前环境信息、当前时间信息、云服务端的语音引擎的当前负荷情况,所述当前环境信息描述了所述目标终端所处环境;
85.基于所述参考信息、所述目标处理功能,以及所述选择规则,选择所述适配的引擎功能。
86.可选的,其中的处理功能包括以下任意之一:
87.唤醒词识别的功能;
88.自语音信号识别出文本的功能;
89.基于文本而形成语音信号的功能。
90.可选的,所述引擎功能选择模块22,具体用于:
91.若所述环境的噪音程度高于噪音阈值,且所述目标处理功能为唤醒词识别的功能或自语音信号中识别出文本的功能时,则:选择预先指定的一个云服务端的引擎功能作为所述适配的引擎功能。
92.可选的,所述引擎功能选择模块22,具体用于:
93.若所述目标终端的网络信号质量低于信号质量阈值,则:选择本地的引擎功能作为所述适配的引擎功能。
94.请参考图4,提供了一种电子设备30,包括:
95.处理器31;以及,
96.存储器32,用于存储所述处理器的可执行指令;
97.其中,所述处理器31配置为经由执行所述可执行指令来执行以上所涉及的方法。
98.处理器31能够通过总线33与存储器32通讯。
99.本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以上所涉及的方法。
100.本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
101.最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。