首页 > 乐器声学 专利正文
智能语音导航方法、装置和系统、计算机可读存储介质与流程

时间:2022-02-17 阅读: 作者:专利查询

智能语音导航方法、装置和系统、计算机可读存储介质与流程

1.本公开涉及人工智能领域,特别涉及一种智能语音导航方法、装置和系统、计算机可读存储介质。


背景技术:

2.相关技术许多呼叫中心现网所采用ivr(interactive voice response,互动式语音应答)流程实现方式,是通过语音排队机将用户按键信息(code码)传到ivr服务器,由ivr服务器驱动下一步动作,因此排队机和ivr服务器之间传输数据不需要定义的很长,如华为的呼叫中心仅支持23字节,即最大11个汉字。
3.在这样情况下实现语音智能导航,需要传输对用户语音分析得出的交互语义信息,而这些识别信息往往超过排队机的字节限制,从而无法传递到ivr服务器进行流程节点执行。
4.这种情况在2016年以前建设的呼叫中心,包括华为uap8100、uap3100,中兴通讯ms10等型号中都存在,为传统呼叫中心实现智能语音导航带来了困难,而相关技术的解决方案中需求对ivr流程code码机制进行较大的调整变动。


技术实现要素:

5.鉴于以上技术问题中的至少一项,本公开提供了一种智能语音导航方法、装置和系统、计算机可读存储介质,基于自定义xid短码机制,解决了主流排队机对智能导航识别文字信息过长受限问题。
6.根据本公开的一个方面,提供一种智能语音导航方法,包括:
7.排队机将用户语音流发送到语音识别装置和语义识别装置;
8.语义识别装置将用户语音流的语音语义识别内容发送到智能语音导航装置;
9.智能语音导航装置根据所述语音语义识别内容生成短编码标识,建立语音语义识别内容和短编码标识的对应关系;
10.智能语音导航装置将短编码标识返回给排队机;
11.排队机将短编码标识发送到互动式语音应答服务器;
12.互动式语音应答服务器根据短编码标识从智能语音导航装置获取对应的语音语义识别内容。
13.在本公开的一些实施例中,所述互动式语音应答服务器根据短编码标识从智能语音导航装置获取对应的语音语义识别内容包括:
14.智能语音导航装置根据短编码标识获取对应的语音语义识别内容;
15.智能语音导航装置根据语音语义识别内容生成对应的互动式语音流程执行节点;
16.智能语音导航装置将所述互动式语音流程执行节点封装成可被互动式语音应答服务器执行的流程节点语音可扩展标记语言;
17.智能语音导航装置将所述流程节点语音可扩展标记语言返回给互动式语音应答
服务器。
18.在本公开的一些实施例中,所述智能语音导航方法还包括:
19.对于智能语音导航中多轮交互的场景,智能语音导航装置与互动式语音应答服务器配合,对语音语义识别内容进行短编码标识转换的情况下,建立语义上下文的关联逻辑,以实现基于多语义槽位补全识别。
20.在本公开的一些实施例中,所述排队机将用户语音流发送到语音识别装置和语义识别装置包括:
21.排队机将用户语音流发送到互动式语音应答服务器,请求语音分配;
22.互动式语音应答服务器指示排队机将用户语音流发送到语音识别装置;
23.语音识别装置对用户语音流进行语音识别,并将语音识别后的文字发送到语义识别装置。
24.根据本公开的另一方面,提供一种智能语音导航装置,包括:
25.短编码转换模块,用于接收用户语音流的语音语义识别内容,其中,排队机将用户语音流发送到语音识别装置和语义识别装置,语义识别装置输出用户语音流的语音语义识别内容给智能语音导航装置;根据所述语音语义识别内容生成短编码标识,建立语音语义识别内容和短编码标识的对应关系;并将短编码标识返回给排队机,指示排队机将短编码标识发送到互动式语音应答服务器;
26.短编码解码模块,用于对互动式语音应答服务器的短编码标识进行解析,获取所述短编码标识对应的语音语义识别内容;并将所述短编码标识对应的语音语义识别内容返回给互动式语音应答服务器。
27.在本公开的一些实施例中,短编码解码模块,用于根据短编码标识获取对应的语音语义识别内容;根据语音语义识别内容生成对应的互动式语音流程执行节点;将所述互动式语音流程执行节点封装成可被互动式语音应答服务器执行的流程节点语音可扩展标记语言;将所述流程节点语音可扩展标记语言返回给互动式语音应答服务器。
28.在本公开的一些实施例中,短编码转换模块和短编码解码模块,用于对于智能语音导航中多轮交互的场景,与互动式语音应答服务器配合,对语音语义识别内容进行短编码标识转换的情况下,建立语义上下文的关联逻辑,以实现基于多语义槽位补全识别。
29.在本公开的一些实施例中,所述智能语音导航装置还包括:
30.消息中间件模块,用于存储语音语义识别内容和短编码标识的对应关系。
31.根据本公开的另一方面,提供一种智能语音导航系统,包括:
32.排队机,用于将用户语音流发送到语音识别装置和语义识别装置;
33.语义识别装置,用于将用户语音流的语音语义识别内容发送到智能语音导航装置;
34.智能语音导航装置,用于根据所述语音语义识别内容生成短编码标识,建立语音语义识别内容和短编码标识的对应关系;将短编码标识返回给排队机,并指示排队机将短编码标识发送到互动式语音应答服务器;
35.互动式语音应答服务器,用于根据短编码标识从智能语音导航装置获取对应的语音语义识别内容。
36.在本公开的一些实施例中,所述智能语音导航系统还包括:
37.排队机还用于将用户语音流发送到互动式语音应答服务器,请求语音分配;
38.互动式语音应答服务器还用于指示排队机将用户语音流发送到语音识别装置;
39.语音识别装置,用于对用户语音流进行语音识别,并将语音识别后的文字发送到语义识别装置。
40.在本公开的一些实施例中,所述智能语音导航装置为如上述任一实施例所述的智能语音导航装置。
41.根据本公开的另一方面,提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储有计算机指令,所述指令被处理器执行时实现如上述任一实施例所述的智能语音导航方法。
42.本公开基于自定义xid短码机制,解决了主流排队机对智能导航识别文字信息过长受限问题。
附图说明
43.为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
44.图1为本公开智能语音导航方法一些实施例的示意图。
45.图2为本公开智能语音导航方法另一些实施例的示意图。
46.图3为本公开一些实施例中短编码标识多轮交互机制的示意图。
47.图4为本公开智能语音导航装置一些实施例的示意图。
48.图5为本公开智能语音导航系统一些实施例的示意图。
具体实施方式
49.下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
50.除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
51.同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
52.对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
53.在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
54.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
55.图1为本公开智能语音导航方法一些实施例的示意图。优选的,本实施例可由本公开智能语音导航装置或本公开智能语音导航系统执行。该方法可以包括步骤11-步骤16,其中:
56.步骤11,排队机将用户语音流发送到语音识别装置和语义识别装置。
57.在本公开的一些实施例中,步骤11可以包括步骤111-步骤113,其中:
58.步骤111,排队机将用户语音流发送到互动式语音应答服务器,请求语音分配。
59.步骤112,互动式语音应答服务器指示排队机将用户语音流发送到语音识别装置。
60.步骤113,语音识别装置对用户语音流进行语音识别,并将语音识别后的文字发送到语义识别装置。
61.步骤12,语义识别装置将用户语音流的语音语义识别内容发送到智能语音导航装置。
62.步骤13,智能语音导航装置根据所述语音语义识别内容生成短编码标识xid,利用redis(remote dictionary server,即远程字典服务)内存服务器建立语音语义识别内容和短编码标识的对应关系。
63.在本公开的一些实施例中,redis是一种成熟、开源的数据缓存服务架构,被广泛用于基于内存的数据快速读写,基于redis集群可实现高效的实时消息栈管理。本公开撒谎给你是实施例基于redis搭建了承载高并发智能导航交互语义xml数据消息的传输调度。
64.步骤14,智能语音导航装置将短编码标识返回给排队机。
65.步骤15,排队机将短编码标识发送到互动式语音应答服务器。
66.步骤16,互动式语音应答服务器根据短编码标识从智能语音导航装置获取对应的语音语义识别内容。
67.在本公开的一些实施例中,步骤16可以包括步骤161-步骤164,其中:
68.步骤161,智能语音导航装置根据短编码标识获取对应的语音语义识别内容。
69.步骤162,智能语音导航装置根据语音语义识别内容生成对应的互动式语音流程执行节点。
70.步骤163,智能语音导航装置将所述互动式语音流程执行节点封装成可被互动式语音应答服务器执行的流程节点语音可扩展标记语言。
71.步骤164,智能语音导航装置将所述流程节点语音可扩展标记语言返回给互动式语音应答服务器。
72.在本公开的一些实施例中,所述智能语音导航方法还可以包括:对于智能语音导航中多轮交互的场景,智能语音导航装置与互动式语音应答服务器配合,对语音语义识别内容进行短编码标识转换的情况下,建立语义上下文的关联逻辑,以实现基于多语义槽位补全识别。
73.基于本公开上述实施例提供的智能语音导航方法,不改变原有code码机制及核心架构。本公开上述实施例利用redis内存服务器,自定义xid短编码,建立同用户语音识别文字的临时关系,从而解决了智能导航语音语义分析识别数据传输长度受限的问题,避免了呼叫中心升级带来的大量投资,加快了智能语音导航上线。
74.本公开上述实施例可以基于传统呼叫中心实现智能ivr导航业务,并支持客服机器人与用户的多轮交互,从而代替了传统按键ivr服务,实现了扁平化。
75.图2为本公开智能语音导航方法另一些实施例的示意图。优选的,本实施例可由本公开智能语音导航装置或本公开智能语音导航系统执行。该方法可以包括步骤201-步骤216,其中:
76.步骤201,在用户通过用户终端进行电话呼入排队机的情况下,排队机将用户语音流发送到互动式语音应答ivr服务器,请求语音分配。
77.步骤202,互动式语音应答服务器返回引导话术给排队机,指示排队机将用户语音流发送到asr(automatic speech recognition,自动语音识别装置,又称为语音识别装置)。
78.步骤203,排队机将用户语音流发送到语音识别装置。
79.步骤204,语音识别装置对用户语音流进行语音识别,并将语音识别后的文字发送到语义nlp(natural language processing,自然语言处理,又称为语义识别装置)。
80.步骤205,语义识别装置将用户语音流的语音语义识别内容发送到智能语音导航装置。
81.在本公开的一些实施例中,所述用户语音流的语音语义识别内容可以为语义识别装置的语义识别结果,之后执行步骤206和步骤207。
82.在本公开的一些实施例中,所述用户语音流的语音语义识别内容可以为交互语义xml(extensible markup language,可扩展标记语言)。
83.步骤206,智能语音导航装置的短编码转换模块根据所述语音语义识别内容生成短编码标识xid,并将短编码标识返回给排队机,之后执行步骤208。
84.步骤207,智能语音导航装置利用redis服务缓存用户语音流的语音语义识别内容,并建立语音语义识别内容和短编码标识的对应关系。
85.步骤208,排队机将短编码标识xid透传给互动式语音应答服务器。
86.步骤209,互动式语音应答服务器请求节点执行,将短编码标识xid透传给智能语音导航装置的短编码解码模块。
87.步骤210,智能语音导航装置的短编码解码模块解析短编码标识xid,请求短编码标识对应的语音语义识别内容,即,向redis消息中间件模块请求短编码标识对应的语音语义识别内容(例如交互语义xml)。
88.步骤211,智能语音导航装置的redis消息中间件模块,将短编码标识对应的语音语义识别内容(例如交互语义xml)返回给短编码解码模块。
89.步骤212,智能语音导航装置的短编码解码模块根据语音语义识别内容生成对应的互动式语音流程执行节点;将所述互动式语音流程执行节点封装成可被互动式语音应答服务器执行的流程节点vxml(voice extensible markup language,语音可扩展标记语言);将所述流程节点语音可扩展标记语言返回给互动式语音应答服务器。
90.在本公开的一些实施例中,步骤212可以包括:响应于ivr流程请求,返回完整节点vxml。
91.在本公开的一些实施例中,ivr服务器利用步骤209-步骤212的方式,通过xid在智能语音导航装置获得真实的用户语音、语义识别内容,从而驱动排队机后面的动作(步骤213-步骤216)。
92.步骤213,互动式语音应答服务器发起ivr流程节点,将语音分配结果返回给排队
机。
93.步骤214,排队机向tts(text to speech,从文本到语音)语音合成装置请求tts播报。
94.步骤215,tts语音合成装置合成播报音并返回给排队机。
95.步骤216,排队机向用户播报所述播报音。
96.本公开上述实施例通过建立具有redis缓存服务的适配装置,提供基于动态生成的xid短编码数据的智能语音导航集成方法,以解决原本复杂、字节数超过排队机限制的识别文字信息无法传输问题,最终实现将用户的语音交互识别信息明确指映到语音导航ivr流程执行节点上。
97.本公开上述实施例排队机输出的语音流通过接口协议转换,送到语音识别、语义识别引擎,将识别内容送到本装置通过redis服务缓存,并动态生成xid短编码,建立关联关系。
98.本公开上述实施例的智能语音导航装置将xid送到排队机,排队机将xid送到ivr服务器,从而绕过了传统排队机不支持语音识别内容及传输数据受限的限制。
99.本公开上述实施例基于自定义xid短码机制,解决了主流排队机对智能导航识别文字信息过长受限问题。
100.本公开上述实施例可以通过抓包方式实现去mrcp(media resource control protocol,媒体资源控制协议)协议架构,突破传统语音ai引擎需要私有化部署的限制。基于新的架构,本公开上述实施例可对主流的语音ai引擎接口协议适配,引擎只需要提供标准化能力开放的http(hypertext transfer protocol)即超文本传输协议/websocket(一种在单个tcp连接上进行全双工通信的协议)接口。
101.图3为本公开一些实施例中短编码标识多轮交互机制的示意图。对于智能语音导航中的多轮交互,本公开智能语音导航装置与ivr服务器配合,提供了一种基于多语义槽位补全识别机制,在将语音识别数据进行xid编码转换时能够带上上下文的关联逻辑,以更好地支持一次业务多轮人机对话的场景。
102.例如:图3实施例中根据用户“我想查账单”的语音流,确定查账单code码,确定中间节点为01002,作为多语义槽位中的起动槽位。排队机向用户播报“确认查询的是本机还是他机”的语音,根据用户返回的“我本机的”的语音流,查本机code码,中间节点+01,作为多语义槽位中的中间槽位。排队机向用户播报“请问您需要查询今年几月份账单”的语音,根据用户返回的“2月份”的语音流,查2月份code码,中间节点+02,作为多语义槽位中的结束槽位。综合2月份、本机、账单三个槽位的语义进行上下文关联,最终向用户提供该用户2月份的账单总额,并提醒用户缴费。
103.本公开上述实施例可以基于会话关联,实现xid短码的多语义槽位补全识别机制,实现一次业务多轮人机对话。
104.本公开上述实施例对于呼叫平台实时话务的ai(artificial intelligence,人工智能)处理分析,与相关技术传统方式在应用层面进行话务逻辑的定制开发相比,可在智能语音导航装置内实现双通道话务信息管理和实时集成,可以实现话务随路与语音流ai处理结果的关联输出,可复用性价值高。
105.图4为本公开智能语音导航装置一些实施例的示意图。如图4所示,本公开智能语
音导航装置可以包括短编码转换模块41和短编码解码模块42,其中:
106.短编码转换模块41,用于接收用户语音流的语音语义识别内容,其中,排队机将用户语音流发送到语音识别装置和语义识别装置,语义识别装置输出用户语音流的语音语义识别内容给智能语音导航装置;根据所述语音语义识别内容生成短编码标识,建立语音语义识别内容和短编码标识的对应关系;并将短编码标识返回给排队机,指示排队机将短编码标识发送到互动式语音应答服务器。
107.在本公开的一些实施例中,短编码转换模块41可以为语义xid短码转换模块。
108.在本公开的一些实施例中,短编码转换模块41可以用于将基于通过节点执行规则来定义xid短码,并对应编码来替代原有字数过多的语义识别输出结果,从而绕开排队机限制。
109.短编码解码模块42,用于对互动式语音应答服务器的短编码标识进行解析,获取所述短编码标识对应的语音语义识别内容;并将所述短编码标识对应的语音语义识别内容返回给互动式语音应答服务器。
110.在本公开的一些实施例中,短编码解码模块42可以用于根据短编码标识获取对应的语音语义识别内容;根据语音语义识别内容生成对应的互动式语音流程执行节点;将所述互动式语音流程执行节点封装成可被互动式语音应答服务器执行的流程节点语音可扩展标记语言;将所述流程节点语音可扩展标记语言返回给互动式语音应答服务器。
111.在本公开的一些实施例中,短编码转换模块41可以为xid短码节点解析模块。
112.在本公开的一些实施例中,短编码转换模块41可以用于将生成的xid短码进行解析,获取多对应的ivr流程执行节点,并以此封装成可被ivr执行的流程节点vxml。
113.在本公开的一些实施例中,短编码转换模块41和短编码解码模块42可以用于对于智能语音导航中多轮交互的场景,与互动式语音应答服务器配合,对语音语义识别内容进行短编码标识转换的情况下,建立语义上下文的关联逻辑,以实现基于多语义槽位补全识别。
114.在本公开的一些实施例中,如图4所示,所述智能语音导航装置还可以包括消息中间件模块43,其中:
115.消息中间件模块43,用于存储语音语义识别内容和短编码标识的对应关系。
116.在本公开的一些实施例中,消息中间件模块43可以为redis消息中间件模块。
117.在本公开的一些实施例中,消息中间件模块43可以用于承载高并发智能导航交互语义xml数据消息的传输调度。
118.基于本公开上述实施例提供的智能语音导航装置,不改变原有code码机制及核心架构。本公开上述实施例利用redis内存服务器,自定义xid短编码,建立同用户语音识别文字的临时关系,从而解决了智能导航语音语义分析识别数据传输长度受限的问题,避免了呼叫中心升级带来的大量投资,加快了智能语音导航上线。
119.本公开上述实施例可以基于传统呼叫中心实现智能ivr导航业务,并支持客服机器人与用户的多轮交互,从而代替了传统按键ivr服务,实现了扁平化。
120.图5为本公开智能语音导航系统一些实施例的示意图。如图5所示,本公开智能语音导航装置可以包括排队机1、语义识别装置2、互动式语音应答服务器3和智能语音导航装置4,其中:
121.排队机1,用于将用户语音流发送到语音识别装置和语义识别装置。
122.语义识别装置2,用于将用户语音流的语音语义识别内容发送到智能语音导航装置。
123.在本公开的一些实施例中,所述用户语音流的语音语义识别内容可以为交互语义xml。
124.智能语音导航装置4,用于根据所述语音语义识别内容生成短编码标识xid,建立语音语义识别内容和短编码标识的对应关系;将短编码标识返回给排队机,并指示排队机将短编码标识发送到互动式语音应答服务器。
125.互动式语音应答服务器3,用于根据短编码标识从智能语音导航装置获取对应的语音语义识别内容。
126.在本公开的一些实施例中,如图5所示,所述智能语音导航系统还可以包括语音识别装置5,其中:
127.排队机1还可以用于用户通过用户终端进行电话呼入排队机的情况下,将用户语音流发送到互动式语音应答ivr服务器,请求语音分配。
128.互动式语音应答服务器3还可以用于返回引导话术给排队机,指示排队机将用户语音流发送到语音识别装置。
129.语音识别装置5,用于对用户语音流进行语音识别,并将语音识别后的文字发送到语义识别装置2。
130.语义识别装置2,用于将用户语音流的语音语义识别内容发送到智能语音导航装置4。
131.在本公开的一些实施例中,如图5所示,所述语音语义识别内容可以为xml格式封装的的语义结果。
132.在本公开的一些实施例中,如图5所示,智能语音导航装置4可以包括短编码转换模块41、短编码解码模块42和消息中间件模块43,其中:
133.智能语音导航装置4的短编码转换模块41,用于根据所述语音语义识别内容(语义xml)生成短编码标识xid,在短编码解码模块42建立语音语义识别内容和短编码标识的对应关系;将短编码标识返回给排队机1,并指示排队机1将短编码标识发送到互动式语音应答服务器。
134.互动式语音应答服务器3,用于请求节点执行,将短编码标识xid透传给智能语音导航装置的短编码解码模块42。
135.智能语音导航装置的短编码解码模块42,用于解析短编码标识xid,请求短编码标识对应的语音语义识别内容,即,向redis消息中间件模块请求短编码标识对应的语音语义识别内容(例如交互语义xml)。
136.智能语音导航装置的redis消息中间件模块43,用于将短编码标识对应的语音语义识别内容(例如交互语义xml)返回给短编码解码模块42。
137.智能语音导航装置的短编码解码模块42,用于根据语音语义识别内容生成对应的互动式语音流程执行节点(例如xml封装节点);将所述互动式语音流程执行节点封装成可被互动式语音应答服务器执行的流程节点vxml;将所述流程节点语音可扩展标记语言返回给互动式语音应答服务器。
138.图2还给出了本公开智能语音导航系统另一些实施例的示意图。与图5实施例相比,图2实施例的智能语音导航系统除了包括排队机1、语音识别装置5、语义识别装置2、互动式语音应答服务器3和智能语音导航装置4外,还可以tts语音合成装置6,其中:
139.互动式语音应答服务器3还可以用于发起ivr流程节点,将语音分配结果返回给排队机。
140.排队机1还可以用于向tts语音合成装置请求tts播报。
141.tts语音合成装置6,用于合成播报音并返回给排队机1,并指示排队机1向用户播报所述播报音。
142.在本公开的一些实施例中,图2和图3实施例的智能语音导航装置可以为如上述任一实施例(例如图4实施例)所述的智能语音导航装置。
143.基于本公开上述实施例提供的智能语音导航系统,不改变原有code码机制及核心架构。本公开上述实施例利用redis内存服务器,自定义xid短编码,建立同用户语音识别文字的临时关系,从而解决了智能导航语音语义分析识别数据传输长度受限的问题,避免了呼叫中心升级带来的大量投资,加快了智能语音导航上线。
144.本公开上述实施例可以基于传统呼叫中心实现智能ivr导航业务,并支持客服机器人与用户的多轮交互,从而代替了传统按键ivr服务,实现了扁平化。
145.本公开上述实施例采用的智能语音导航方法、装置和系统,被实际用于某运营商多媒体客服配合集团智能ivr扁平化建设项目中。本公开上述实施例在该项目中得到验证,实现了某城市运营商智能语音导航业务的快速上线,并避免了呼叫中心的改造升级。
146.根据本公开的另一方面,提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储有计算机指令,所述指令被处理器执行时实现如上述任一实施例(例如图1或图2实施例)所述的智能语音导航方法。
147.基于本公开上述实施例提供的计算机可读存储介质,不改变原有code码机制及核心架构。本公开上述实施例利用redis内存服务器,自定义xid短编码,建立同用户语音识别文字的临时关系,从而解决了智能导航语音语义分析识别数据传输长度受限的问题,避免了呼叫中心升级带来的大量投资,加快了智能语音导航上线。
148.本公开上述实施例可以基于传统呼叫中心实现智能ivr导航业务,并支持客服机器人与用户的多轮交互,从而代替了传统按键ivr服务,实现了扁平化。
149.本公开上述实施例排队机输出的语音流通过接口协议转换,送到语音识别、语义识别引擎,将识别内容送到本装置通过redis服务缓存,并动态生成xid短编码,建立关联关系。
150.本公开上述实施例的智能语音导航装置将xid送到排队机,排队机将xid送到ivr服务器,从而绕过了传统排队机不支持语音识别内容及传输数据受限的限制。
151.本公开上述实施例基于自定义xid短码机制,解决了主流排队机对智能导航识别文字信息过长受限问题。
152.本公开上述实施例可以通过抓包方式实现去mrcp协议架构,突破传统语音ai引擎需要私有化部署的限制。基于新的架构,本公开上述实施例可对主流的语音ai引擎接口协议适配,引擎只需要提供标准化能力开放的http(hypertext transfer protocol)即超文本传输协议/websocket(一种在单个tcp连接上进行全双工通信的协议)接口。
153.在上面所描述的智能语音导航装置可以实现为用于执行本技术所描述功能的通用处理器、可编程逻辑控制器(plc)、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件或者其任意适当组合。
154.至此,已经详细描述了本公开。为了避免遮蔽本公开的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里公开的技术方案。
155.本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指示相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
156.本公开的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本公开限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本公开的原理和实际应用,并且使本领域的普通技术人员能够理解本公开从而设计适于特定用途的带有各种修改的各种实施例。