首页 > 乐器声学 专利正文
智能交互的多轮对话方法、系统、存储介质及其计算机设备与流程

时间:2022-01-19 阅读: 作者:专利查询

智能交互的多轮对话方法、系统、存储介质及其计算机设备与流程

1.本发明涉及语音交互技术领域,尤其涉及一种智能交互的多轮对话方法、系统、存储介质及其计算机设备。


背景技术:

2.智能语音交互是基于语音输入的新一代交互模式,通过说话就可以得到反馈结果。然而现有的语音交互方案中的多轮对话方式是极为简单且粗糙的;如以下多轮对话为例:人:今天天气怎么样?音箱:今天天气

。人:北京呢?音箱:北京今天的天气


3.当由于环境有噪音导致asr(automatic speech recognition,自动语音识别技术)录入无效的文字导致意图无效,或者中间间隔着有关联性较高的意图,当再次询问时,多轮对话被打断。例如,人:今天天气怎么样?音箱:今天天气

。人:北京呢放假就放假峰峰峰峰额度?音箱:我听不懂你说什么,还要多学习。
4.当中间间隔着关联性较高的意图。例如,人:今天天气怎么样?音箱:今天天气

。人:帮我订去北京的机票。音箱:好的,已经帮你订好了

。人:北京怎样?音箱:我听不懂你说什么,还要多学习。
5.实际上在多轮对话中不应该是完全割裂的关系,就好像人与人之间的对话一样。因此现有技术对于语音交互的多轮对话方案存在着较多问题,所以有必要加以改进。


技术实现要素:

6.针对上述的缺陷,本发明的目的在于提供一种智能交互的多轮对话方法,系统、存储介质及其计算机设备,能够提升语音交互的多轮对话的用户体验。
7.为了实现上述目的,本发明提供一种智能交互的多轮对话方法,包括有:
8.第一拾音分析步骤,采集用户一轮对话的第一音频,分析对应的第一意图信息并根据所述第一意图信息生成第一反馈信息;
9.提取存储步骤,提取所述第一意图信息和/或所述第一反馈信息中的意图特征并存储为历史数据;
10.第二拾音分析步骤,采集用户下一轮对话的第二音频,分析对应的第二意图信息;
11.分析反馈步骤,分析计算所述历史数据在所述第二意图信息中相关的权重系数,并判断所述权重系数是否达到预设阈值,若是则根据所述第二意图信息结合所述历史数据以生成对应的第二反馈信息。
12.所述分析反馈步骤还包括:
13.若所述权重系数未达到预设阈值,则根据所述第二意图信息以生成对应的第三反馈信息。
14.所述第一拾音分析步骤包括:
15.第一拾音步骤,采集第一输入音频并通过语音识别为第一文本数据;
16.第一转化步骤,将所述第一文本数据转化为第一机器语言;
17.第一分析步骤,分析所述第一机器语言对应第一领域的第一意图信息。
18.可选的,所述第一拾音分析步骤还包括:
19.第一槽位填充步骤,分析所述第一机器语言以填充对应的第一意图槽位;
20.第一反馈信息步骤,根据所述第一领域、所述第一意图信息以及所述第一意图槽位以匹配生成对应的第一反馈信息。
21.还提供了一种智能交互的多轮对话系统,包括有:
22.第一拾音分析单元,用于采集用户一轮对话的第一音频,分析对应的第一意图信息并根据所述第一意图信息生成第一反馈信息;
23.提取存储单元,用于提取所述第一意图信息和/或所述第一反馈信息中的意图特征并存储为历史数据;
24.第二拾音分析单元,用于采集用户下一轮对话的第二音频,分析对应的第二意图信息;
25.分析反馈单元,用于分析计算所述历史数据在所述第二意图信息中相关的权重系数,并判断所述权重系数是否达到预设阈值,若是则根据所述第二意图信息结合所述历史数据以生成对应的第二反馈信息。
26.所述分析反馈单元还用于:
27.若所述权重系数未达到预设阈值,则根据所述第二意图信息以生成对应的第三反馈信息。
28.所述第一拾音分析单元包括有:
29.第一拾音子单元,用于采集第一输入音频并通过语音识别为第一文本数据;
30.第一转化子单元,用于将所述第一文本数据转化为第一机器语言;
31.第一分析子单元,用于分析所述第一机器语言对应第一领域的第一意图信息。
32.可选的,所述第一拾音分析单元还包括:
33.第一槽位填充子单元,用于分析所述第一机器语言以填充对应的第一意图槽位;
34.第一反馈信息子单元,用于根据所述第一领域、所述第一意图信息以及所述第一意图槽位以匹配生成对应的第一反馈信息。
35.另外,还提供了一种存储介质和计算机设备,所述存储介质用于存储一种用于执行上述智能交互的多轮对话方法的计算机程序。
36.所述计算机设备包括存储介质、处理器以及存储在所述存储介质上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的智能交互的多轮对话方法。
37.本发明所述的智能交互的多轮对话方法及其系统,通过提取上一轮对话中的所述第一意图信息和/或第一反馈信息中的意图特征并存储为历史数据;分析计算历史数据在下一轮对话的第二意图信息中相关的权重系数,并判断权重系数是否达到预设阈值,若是则根据所述第二意图信息结合历史数据以生成对应的第二反馈信息。本发明使得语音交互的多轮对话就像人与人之间对话一样自然,让整个语音交互的体验更好,更贴心。
附图说明
38.图1为本发明优选实施例所述智能交互的多轮对话方法的步骤流程图;
39.图2为本发明优选实施例所述智能交互的多轮对话方法的具体流程示意图;
40.图3为本发明所述智能交互的多轮对话方法的所述第一拾音分析步骤的优选步骤流程图;
41.图4为本发明所述智能交互的多轮对话方法的所述第二拾音分析步骤的优选步骤流程图;
42.图5为本发明所述智能交互的多轮对话方法的所述分析反馈步骤的第一种实施方式的步骤流程图;
43.图6为本发明所述智能交互的多轮对话方法的所述分析反馈步骤的第二种实施方式的步骤流程图;
44.图7为本发明所述智能交互的多轮对话方法的所述提取存储步骤的优选步骤流程图;
45.图8为本发明优选实施例所述智能交互的多轮对话系统的结构示意框图;
46.图9为本发明所述智能交互的多轮对话系统的第一拾音分析单元优选的结构框图;
47.图10为本发明所述智能交互的多轮对话系统的第二拾音分析单元优选的结构框图;
48.图11为本发明所述智能交互的多轮对话系统的分析反馈单元第一实施例的结构框图;
49.图12为本发明所述智能交互的多轮对话系统的分析反馈单元第二实施例的结构框图;
50.图13为本发明所述智能交互的多轮对话系统的提取存储单元优选的结构框图。
具体实施方式
51.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
52.需要说明的,本说明书中针对“一个实施例”、“实施例”、“示例实施例”等的引用,指的是描述的该实施例可包括特定的特征、结构或特性,但是不是每个实施例必须包含这些特定特征、结构或特性。此外,这样的表述并非指的是同一个实施例。进一步,在结合实施例描述特定的特征、结构或特性时,不管有没有明确的描述,已经表明将这样的特征、结构或特性结合到其它实施例中是在本领域技术人员的知识范围内的。
53.此外,在说明书及后续的权利要求当中使用了某些词汇来指称特定组件或部件,所属领域中具有通常知识者应可理解,制造商可以用不同的名词或术语来称呼同一个组件或部件。本说明书及后续的权利要求并不以名称的差异来作为区分组件或部件的方式,而是以组件或部件在功能上的差异来作为区分的准则。在通篇说明书及后续的权利要求书中所提及的“包括”和“包含”为一开放式的用语,故应解释成“包含但不限定于”。以外,“连接”一词在此系包含任何直接及间接的电性连接手段。间接的电性连接手段包括通过其它装置进行连接。
54.图1示出本发明优选实施例所述的智能交互的多轮对话方法,包括步骤有:
55.s101:采集用户一轮对话的第一音频,分析对应的第一意图信息并根据所述第一意图信息生成第一反馈信息;具体可通过前端麦克风阵列负责拾音并且把采集到的第一音频上传,通过分析其对应的第一意图信息,其意图信息可以是查询天气、播放歌曲或者是播报新闻资讯等指示意图;所述第一反馈信息是根据经分析获得的第一意图信息生成,具体可以是为用户查询到天气信息,为用户播放歌曲或者为用户播报新闻资讯等反馈音频。或者该意图信息可以是对家用电器的控制命令,如开关空调或开关电视等用户命令;则对应的第一反馈信息为控制空调开启或关闭,或者控制电视开启或关闭等操控信令。所述第一意图信息可以是完整的意图信息,也可以是不完整的意图信息。
56.s102:提取所述第一意图信息和/或所述第一反馈信息中的意图特征并存储为历史数据;通过将第一意图信息和/或第一反馈信息的相关数据存储为历史记录,以便于下一轮对话的关联操作;对应的意图特征可以是一轮对话中指示的操作,如查询天气,播放歌曲或播报新闻;或者是特定意图的槽位,如“天气”、“歌曲”或者“新闻”等;本实施例优选的是,所述历史数据设为所述第一意图信息和/或第一反馈信息的槽位参数;既存储的历史数据可以是由至少一个特定意图的槽位构成的参数集。
57.s103:采集用户下一轮对话的第二音频,分析对应的第二意图信息;所述的下一轮对话与上述一轮对话相衔接;优选的是,所述下一轮对话与所述一轮对话结束时间的间隔小于或等于预设的时间阈值,如5秒、10秒或15秒等;将采集到的第二音频分析获得该第二音频对应的第二意图信息,该第二意图信息可以是与第一意图信息为相同领域,也可以是不同领域。
58.s104:分析计算所述历史数据在所述第二意图信息中相关的权重系数,并判断所述权重系数是否达到预设阈值,若是则根据所述第二意图信息结合所述历史数据以生成对应的第二反馈信息。通过分析已存储在数据库中的历史数据与第二意图信息之间的相关性,具体分析计算出该历史数据在第二意图信息中相关的权重系数,当所述历史数据与第二意图信息关联的权重达到了预设阈值时,即判定上一轮对话与下一轮对话之间相关联,从而在下一轮对话中结合上一轮对话产生的相关信息来生成第二反馈信息。既在分析第二轮对话时,先分析上一轮对话中存储的意图特征是否与第二轮对话相关联,若用于判断关联的权重系数达到预设阈值,即为相关联,从而在第二轮对话生成反馈信息时需要结合上一轮的意图特征,第二反馈信息是与第一轮对话关联,其一般是指对上一轮对话的连续或者是结合上一轮对话的相关信息产生。依此循环到多轮对话中,从而使得智能语音交互的多轮对话的体验更好且更贴心。
59.本实施例的方法,具体举例说明,人:今天天气怎么样?音箱:今天天气

。人:帮我订去北京的机票。音箱:好的,已经帮你订好了

,北京的天气很冷,记得穿多件衣服。通过将第一轮对话中的“天气”的槽位参数存储为历史数据,当发起第二轮对话时,则分析“天气”与第二意图信息(订机票)相关联的权重系数;一般而言,天气与订机票之间的关联度较高,则经分析获得的权重系数将达到预设阈值,从而在第二轮对话中将结合上一轮的相关信息来产生第二反馈信息;在该例子中,第二反馈信息结合“天气”的槽位产生来提醒用户所要前去的地点(北京)的“天气”并提醒保暖,从而使得语音交互的多轮对话的用户体验更好且更贴心。
60.图2示出本实施例所述智能交互的多轮对话方法的具体流程图,其中步骤s104具
体包括以下步骤:
61.s1041:分析计算所述历史数据在所述第二意图信息中相关的权重系数;
62.s1042:判断所述权重系数是否达到预设阈值;若达到则进入步骤s1043,否则进入步骤s1044;
63.s1043:根据所述第二意图信息结合所述历史数据以生成对应的第二反馈信息;
64.s1044:根据所述第二意图信息以生成对应的第三反馈信息。即所述步骤s104还包括:若所述权重系数未达到预设阈值,则根据所述第二意图信息以生成对应的第三反馈信息。当所述历史数据在第二意图信息中相关的权重系数未能达到预设阈值时,即第二轮对话的意图与上一轮对话的意图不相关,因此仅需根据第二意图信息产生对应的第三反馈信息即可;第三反馈信息与第一反馈信息并不关联,一般为独立分割的两轮对话;而第二反馈信息则是与第一轮对话关联,其一般是指对上一轮对话的连续或者是结合上一轮对话的相关信息产生。
65.参见图3,可选的,步骤s101包括有:
66.s1011:采集第一输入音频并通过语音识别为第一文本数据;
67.s1012:将所述第一文本数据转化为第一机器语言;
68.s1013:分析所述第一机器语言对应第一领域的第一意图信息。
69.具体而言,本实施例通过前端麦克风阵列负责拾音并且把第一音频上传到asr。asr负责将音频转化为第一文本数据,并将转化后的第一文本数据发给nlu(natural language understanding,自然语言理解)进行处理。nlu负责将asr的处理结果转化为机器可以理解的语言,从而分析出对应的领域和意图信息。
70.所述步骤s101优选还包括有:
71.s1014:分析所述第一机器语言以填充对应的第一意图槽位;
72.s1015:根据所述第一领域、第一意图信息以及第一意图槽位以匹配生成对应的第一反馈信息。
73.例如,在一轮对话中用户发起的第一音频为:今天天气怎样?则分析获得的以上的第一音频对应的领域是天气,对应的意图是查询天气,对应的意图槽位时间地点分别对应“今天”“北京”。nlu将分析后的结果发送到对话管理进行处理,并记录该意图对话的相关数据把其作为历史记录下来,确定具体的执行动作,把结果发送到语言合成与语言生成的处理端。从而得到的对话为:人:今天天气怎样?音箱:今天北京的天气


74.参见图4,可选的,步骤s103包括:
75.s1031:采集第二输入音频并通过语音识别转化为第二文本数据;
76.s1032:将所述第二文本数据转化为第二机器语言;
77.s1033:分析所述第二机器语言对应第二领域的第二意图信息;
78.所述步骤s104包括:若所述权重系数达到预设阈值,若是则根据第二领域和第二意图信息以结合所述历史数据生成对应的第二反馈信息。
79.进一步的,步骤s103还包括有:
80.s1034:分析所述第二机器语言以填充对应的第二意图槽位;
81.步骤s104进一步包括:若所述权重系数达到预设阈值,若是则根据第二领域、第二意图信息和第二意图槽位以结合所述历史数据生成对应的第二反馈信息。
82.参见图5,可选的,步骤s104包括:
83.s1045:通过大数据分析技术以分析计算所述历史数据在所述第二意图信息中相关的权重系数;
84.s1046:判断所述权重系数是否达到预设阈值,若是则根据所述第二意图信息以结合所述历史数据生成对应的所述第二反馈信息。
85.通过大数据对所有相关的领域和意图进行对应的分析,通过大数据对比大多数同样使用该终端的人的行为,分析用户在比如查询天气时的下一次意图是订机票的概率是20%,可通过定义预设阈值为10%,则认为是这两个是相关性的意图。因此,结合上述对话的例子,对应的历史数据中包括的“天气”,当下一轮对话中的第二意图为订机票,则上一轮对话的“天气”与第二轮对话中的订机票相关联,从而得到以下多轮对话:
86.人:今天天气怎么样?
87.音箱:今天天气


88.人:帮我订去北京的机票。
89.音箱:好的,已经帮你订好了

,北京的天气很冷,记得穿多件衣服。
90.参见图6,在另一种实施例中,可选的,步骤s104包括:
91.s1047:根据预制的关联匹配规则以分析计算所述历史数据在第二意图信息中相关的权重系数;
92.s1048:判断所述权重系数是否达到预设阈值,若是则根据第二意图信息以结合历史数据生成对应的第二反馈信息。
93.通过事先定义的关联匹配规则,如将“天气”与“订机票”的意图特征进行关联,在进行第二轮对话时,从历史数据中提取出“天气”的意图特征并通过关联匹配规则与第二意图信息进行匹配,若对应的“天气”与第二意图信息中的“订机票”被预先定义在该关联匹配规则的权重系数达到预设阈值,则认为是这两个是相关性的意图。该关联匹配规则用于记录用户平时的习惯,当这种权重超过一定的阈值则时可以选择添加相应的内容,这都是灵活可变的。因此,第二意图信息结合上一轮对话中的“天气”的意图特征,以生成对应的第二反馈信息。这种相关性的关联匹配规则可以由厂商自己来定义,具体对话示例如同上述。
94.参见图7,可选的,步骤s102包括:
95.s1021:提取所述第一意图信息和/或第一反馈信息中用于指示执行的至少一意图特征;
96.s1022:将全部的所述意图特征存储为历史数据。既已存储的历史数据包括不少于一个的意图特征;更好的是,该历史数据进一步包括有多轮对话的意图特征。例如,当进行到第三轮对话时,并不是说一定要在第二轮对话中出现天气的相关结果,同样的可以衍生到第三轮对话当中。这种相关性同样可以体现在槽位参数的关联性上,如果在多轮对话中,北京作为槽位出现的次数很多,在意味着在多轮对话后的场景或者在之后的第4、第5轮或者以后的对话中也能把这种相关性加上。
97.当意图描述不清或者意图存在被打断的情况,需要判断意图的完整性,如果多轮对话中间间隔的意图是空的或者语音指令被判断无效的,则多轮对话的上下记录不应该发生改变或者只是略微的改变。
98.图8示出本发明优选实施例所述的智能交互的多轮对话系统100,包括有第一拾音
分析单元10、提取存储单元20、第二拾音分析单元30以及分析反馈单元40;其中:
99.第一拾音分析单元10用于采集用户一轮对话的第一音频,分析对应的第一意图信息并根据第一意图信息生成第一反馈信息;提取存储单元20用于提取所述第一意图信息和/或所述第一反馈信息中的意图特征并存储为历史数据;第二拾音分析单元30用于采集用户下一轮对话的第二音频,分析对应的第二意图信息;分析反馈单元40用于分析计算所述历史数据在第二意图信息中相关的权重系数,并判断所述权重系数是否达到预设阈值,若是则根据第二意图信息结合历史数据以生成对应的第二反馈信息。
100.本实施例优选的是,所述历史数据设为所述第一意图信息和/或第一反馈信息的槽位参数;既存储的历史数据可以是由至少一个特定意图的槽位构成的参数集。通过分析已存储在数据库中的历史数据与第二意图信息之间的相关性,具体分析计算出该历史数据在第二意图信息中相关的权重系数,当所述历史数据与第二意图信息关联的权重达到了预设阈值时,即判定上一轮对话与下一轮对话之间相关联,从而在下一轮对话中结合上一轮对话产生的相关信息来生成第二反馈信息。既在分析第二轮对话时,先分析上一轮对话中存储的意图特征是否与第二轮对话相关联,若用于判断关联的权重系数达到预设阈值,即为相关联,从而在第二轮对话生成反馈信息时需要结合上一轮的意图特征,第二反馈信息是与第一轮对话关联,其一般是指对上一轮对话的连续或者是结合上一轮对话的相关信息产生。依此循环到多轮对话中,从而使得智能语音交互的多轮对话的体验更好且更贴心。
101.可选的,分析反馈单元40还用于:若所述权重系数未达到预设阈值,则根据所述第二意图信息以生成对应的第三反馈信息。当所述历史数据在第二意图信息中相关的权重系数未能达到预设阈值时,即第二轮对话的意图与上一轮对话的意图不相关,因此仅需根据第二意图信息产生对应的第三反馈信息即可;第三反馈信息与第一反馈信息并不关联,一般为独立分割的两轮对话;而第二反馈信息则是与第一轮对话关联,其一般是指对上一轮对话的连续或者是结合上一轮对话的相关信息产生。
102.参见图9,可选的,第一拾音分析单元10包括有第一拾音子单元101、第一转化子单元102以及第一分析子单元103;其中:
103.第一拾音子单元101用于采集第一输入音频并通过语音识别为第一文本数据;第一转化子单元102用于将第一文本数据转化为第一机器语言;第一分析子单元103用于分析第一机器语言对应第一领域的第一意图信息。
104.进一步的,第一拾音分析单元10还包括有第一槽位填充子单元104和第一反馈信息子单元105;其中:
105.第一槽位填充子单元104用于分析第一机器语言以填充对应的第一意图槽位;第一反馈信息子单元105用于根据第一领域、第一意图信息以及第一意图槽位以匹配生成对应的第一反馈信息。
106.例如,在一轮对话中用户发起的第一音频为:今天天气怎样?则分析获得的以上的第一音频对应的领域是天气,对应的意图是查询天气,对应的意图槽位时间地点分别对应“今天”“北京”。nlu将分析后的结果发送到对话管理进行处理,并记录该意图对话的相关数据把其作为历史记录下来,确定具体的执行动作,把结果发送到语言合成与语言生成的处理端。从而得到的对话为:人:今天天气怎样?音箱:今天北京的天气


107.参见图10,第二拾音分析单元30包括有第二拾音子单元301、第二转化子单元302
以及第二分析子单元303;其中:
108.第二拾音子单元301用于采集第二输入音频并通过语音识别转化为第二文本数据;第二转化子单元302用于将第二文本数据转化为第二机器语言;第二分析子单元303用于分析第二机器语言对应第二领域的第二意图信息;
109.分析反馈单元40用于:若所述权重系数达到预设阈值,若是则根据所述第二领域和所述第二意图信息以结合所述历史数据生成对应的所述第二反馈信息。
110.可选的,第二拾音分析单元30还包括有第二槽位填充子单元,其用于分析第二机器语言以填充对应的第二意图槽位;所述分析反馈单元40进一步用于:若所述权重系数达到预设阈值,若是则根据第二领域、第二意图信息和第二意图槽位以结合历史数据生成对应的第二反馈信息。
111.参见图11,可选的,分析反馈单元40包括有大数据分析子单元401和第一判断子单元402;其中:
112.大数据分析子单元401用于通过大数据分析技术以分析计算所述历史数据在第二意图信息中相关的权重系数;第一判断子单元402用于判断权重系数是否达到预设阈值,若是则根据第二意图信息以结合历史数据生成对应的第二反馈信息。通过大数据对所有相关的领域和意图进行对应的分析,通过大数据对比大多数同样使用该终端的人的行为,分析用户在比如查询天气时的下一次意图是订机票的概率是20%,可通过定义预设阈值为10%,则认为是这两个是相关性的意图。
113.参见图12,在另一实施例中,可选的,分析反馈单元40包括有匹配分析子单元403和第二判断子单元404;其中:
114.匹配分析子单元403用于根据预制的关联匹配规则以分析计算所述历史数据在第二意图信息中相关的权重系数;第二判断子单元404用于判断权重系数是否达到预设阈值,若是则根据第二意图信息以结合所述历史数据生成对应的第二反馈信息。
115.通过事先定义的关联匹配规则,如将“天气”与“订机票”的意图特征进行关联,在进行第二轮对话时,从历史数据中提取出“天气”的意图特征并通过关联匹配规则与第二意图信息进行匹配,若对应的“天气”与第二意图信息中的“订机票”被预先定义在该关联匹配规则的权重系数达到预设阈值,则认为是这两个是相关性的意图。该关联匹配规则用于记录用户平时的习惯,当这种权重超过一定的阈值则时可以选择添加相应的内容,这都是灵活可变的。因此,第二意图信息结合上一轮对话中的“天气”的意图特征,以生成对应的第二反馈信息;这种相关性的关联匹配规则可以由厂商自己来定义。
116.参见图13,可选的,提取存储单元20包括有提取子单元201和存储子单元202;其中:
117.提取子单元201用于提取第一意图信息和/或第一反馈信息中用于指示执行的至少一意图特征;存储子单元202用于将全部的意图特征存储为历史数据。更好的是,该历史数据进一步包括有多轮对话的意图特征。例如,当进行到第三轮对话时,并不是说一定要在第二轮对话中出现天气的相关结果,同样的可以衍生到第三轮对话当中。这种相关性同样可以体现在槽位参数的关联性上,如果在多轮对话中,北京作为槽位出现的次数很多,在意味着在多轮对话后的场景或者在之后的第4、第5轮或者以后的对话中也能把这种相关性加上。
118.当意图描述不清或者意图存在被打断的情况,需要判断意图的完整性,如果多轮对话中间间隔的意图是空的或者语音指令被判断无效的,则多轮对话的上下记录不应该发生改变或者只是略微的改变。
119.本发明还提供一种存储介质,用于存储如图1~图7所述智能交互的多轮对话方法的计算机程序。例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本技术的方法和/或技术方案。而调用本技术的方法的程序指令,可能被存储在固定的或可移动的存储介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输和/或被存储在根据程序指令运行的计算机设备的存储介质中。在此,根据本技术的一个实施例包括如图8所示智能交互的多轮对话系统的计算机设备,所述计算机设备优选包括用于存储计算机程序的存储介质和用于执行计算机程序的处理器,其中,当该计算机程序被该处理器执行时,触发该计算机设备执行基于前述多个实施例中的方法和/或技术方案。
120.需要注意的是,本技术可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(asic)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本技术的软件程序可以通过处理器执行以实现上文步骤或功能。同样地,本技术的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,ram存储器,磁或光驱动器或软磁盘及类似设备。另外,本技术的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
121.根据本发明的方法可以作为计算机实现方法在计算机上实现、或者在专用硬件中实现、或以两者的组合的方式实现。用于根据本发明的方法的可执行代码或其部分可以存储在计算机程序产品上。计算机程序产品的示例包括存储器设备、光学存储设备、集成电路、服务器、在线软件等。优选地,计算机程序产品包括存储在计算机可读介质上以便当所述程序产品在计算机上执行时执行根据本发明的方法的非临时程序代码部件。
122.在优选实施例中,计算机程序包括适合于当计算机程序在计算机上运行时执行根据本发明的方法的所有步骤的计算机程序代码部件。优选地,在计算机可读介质上体现计算机程序。
123.综上所述,多轮对话中不应该是完全割裂的关系。就好像人与人之间的对话一样,假设被环境噪声打扰了或者中间被打断了没办法听清或者在如上意图查询天气和订机票等具有较强相关的领域、意图等情况中都可以是上下文语境的印证。当然在意图槽位也可能会存在相关。本发明所述的智能交互的多轮对话方法及其系统,通过提取上一轮对话中的所述第一意图信息和/或第一反馈信息中的意图特征并存储为历史数据;分析计算历史数据在下一轮对话的第二意图信息中相关的权重系数,并判断权重系数是否达到预设阈值,若是则根据所述第二意图信息结合历史数据以生成对应的第二反馈信息。使得语音交互的多轮对话就像人与人之间对话一样自然,让整个语音交互的体验更好,更贴心。
124.当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
125.本发明还提供了a1、一种智能交互的多轮对话方法,包括有:
126.第一拾音分析步骤,采集用户一轮对话的第一音频,分析对应的第一意图信息并根据所述第一意图信息生成第一反馈信息;
127.提取存储步骤,提取所述第一意图信息和/或所述第一反馈信息中的意图特征并存储为历史数据;
128.第二拾音分析步骤,采集用户下一轮对话的第二音频,分析对应的第二意图信息;
129.分析反馈步骤,分析计算所述历史数据在所述第二意图信息中相关的权重系数,并判断所述权重系数是否达到预设阈值,若是则根据所述第二意图信息结合所述历史数据以生成对应的第二反馈信息。
130.a2、根据a1所述的智能交互的多轮对话方法,所述分析反馈步骤还包括:
131.若所述权重系数未达到预设阈值,则根据所述第二意图信息以生成对应的第三反馈信息。
132.a3、根据a1所述的智能交互的多轮对话方法,所述第一拾音分析步骤包括:
133.第一拾音步骤,采集第一输入音频并通过语音识别为第一文本数据;
134.第一转化步骤,将所述第一文本数据转化为第一机器语言;
135.第一分析步骤,分析所述第一机器语言对应第一领域的第一意图信息。
136.a4、根据a3所述的智能交互的多轮对话方法,所述第一拾音分析步骤还包括:
137.第一槽位填充步骤,分析所述第一机器语言以填充对应的第一意图槽位;
138.第一反馈信息步骤,根据所述第一领域、所述第一意图信息以及所述第一意图槽位以匹配生成对应的第一反馈信息。
139.a5、根据a1所述的智能交互的多轮对话方法,所述第二拾音分析步骤包括:
140.第二拾音步骤,采集第二输入音频并通过语音识别转化为第二文本数据;
141.第二转化步骤,将所述第二文本数据转化为第二机器语言;
142.第二分析步骤,分析所述第二机器语言对应第二领域的第二意图信息;
143.所述分析反馈步骤包括:
144.若所述权重系数达到预设阈值,若是则根据所述第二领域和所述第二意图信息以结合所述历史数据生成对应的所述第二反馈信息。
145.a6、根据a5所述的智能交互的多轮对话方法,所述第二拾音分析步骤还包括:
146.第二槽位填充步骤,分析所述第二机器语言以填充对应的第二意图槽位;
147.所述分析反馈步骤进一步包括:
148.若所述权重系数达到预设阈值,若是则根据所述第二领域、所述第二意图信息和所述第二意图槽位以结合所述历史数据生成对应的所述第二反馈信息。
149.a7、根据a1所述的智能交互的多轮对话方法,所述分析反馈步骤包括:
150.大数据分析步骤,通过大数据分析技术以分析计算所述历史数据在所述第二意图信息中相关的权重系数;
151.第一判断步骤,判断所述权重系数是否达到预设阈值,若是则根据所述第二意图信息以结合所述历史数据生成对应的所述第二反馈信息。
152.a8、根据a1所述的智能交互的多轮对话方法,所述分析反馈步骤包括:
153.匹配分析步骤,根据预制的关联匹配规则以分析计算所述历史数据在所述第二意图信息中相关的权重系数;
154.第二判断步骤,判断所述权重系数是否达到预设阈值,若是则根据所述第二意图信息以结合所述历史数据生成对应的所述第二反馈信息。
155.a9、根据a1所述的智能交互的多轮对话方法,所述提取存储步骤包括:
156.提取步骤,提取所述第一意图信息和/或所述第一反馈信息中用于指示执行的至少一意图特征;
157.存储步骤,将全部的所述意图特征存储为历史数据。
158.a10、根据a1~a9任一项所述的智能交互的多轮对话方法,所述历史数据设为所述第一意图信息和/或所述第一反馈信息的槽位参数。
159.还提供给了b11、一种智能交互的多轮对话系统,包括有:
160.第一拾音分析单元,用于采集用户一轮对话的第一音频,分析对应的第一意图信息并根据所述第一意图信息生成第一反馈信息;
161.提取存储单元,用于提取所述第一意图信息和/或所述第一反馈信息中的意图特征并存储为历史数据;
162.第二拾音分析单元,用于采集用户下一轮对话的第二音频,分析对应的第二意图信息;
163.分析反馈单元,用于分析计算所述历史数据在所述第二意图信息中相关的权重系数,并判断所述权重系数是否达到预设阈值,若是则根据所述第二意图信息结合所述历史数据以生成对应的第二反馈信息。
164.b12、根据b11所述的智能交互的多轮对话系统,所述分析反馈单元还用于:
165.若所述权重系数未达到预设阈值,则根据所述第二意图信息以生成对应的第三反馈信息。
166.b13、根据b11所述的智能交互的多轮对话系统,所述第一拾音分析单元包括有:
167.第一拾音子单元,用于采集第一输入音频并通过语音识别为第一文本数据;
168.第一转化子单元,用于将所述第一文本数据转化为第一机器语言;
169.第一分析子单元,用于分析所述第一机器语言对应第一领域的第一意图信息。
170.b14、根据b13所述的智能交互的多轮对话系统,所述第一拾音分析单元还包括:
171.第一槽位填充子单元,用于分析所述第一机器语言以填充对应的第一意图槽位;
172.第一反馈信息子单元,用于根据所述第一领域、所述第一意图信息以及所述第一意图槽位以匹配生成对应的第一反馈信息。
173.b15、根据b11所述的智能交互的多轮对话系统,所述第二拾音分析单元包括有:
174.第二拾音子单元,用于采集第二输入音频并通过语音识别转化为第二文本数据;
175.第二转化子单元,用于将所述第二文本数据转化为第二机器语言;
176.第二分析子单元,用于分析所述第二机器语言对应第二领域的第二意图信息;
177.所述分析反馈单元用于:
178.若所述权重系数达到预设阈值,若是则根据所述第二领域和所述第二意图信息以结合所述历史数据生成对应的所述第二反馈信息。
179.b16、根据b15所述的智能交互的多轮对话系统,所述第二拾音分析单元还包括有:
180.第二槽位填充子单元,用于分析所述第二机器语言以填充对应的第二意图槽位;
181.所述分析反馈单元进一步用于:
182.若所述权重系数达到预设阈值,若是则根据所述第二领域、所述第二意图信息和所述第二意图槽位以结合所述历史数据生成对应的所述第二反馈信息。
183.b17、根据b11所述的智能交互的多轮对话系统,所述分析反馈单元包括有:
184.大数据分析子单元,用于通过大数据分析技术以分析计算所述历史数据在所述第二意图信息中相关的权重系数;
185.第一判断子单元,用于判断所述权重系数是否达到预设阈值,若是则根据所述第二意图信息以结合所述历史数据生成对应的所述第二反馈信息。
186.b18、根据b11所述的智能交互的多轮对话系统,所述分析反馈单元包括有:
187.匹配分析子单元,用于根据预制的关联匹配规则以分析计算所述历史数据在所述第二意图信息中相关的权重系数;
188.第二判断子单元,用于判断所述权重系数是否达到预设阈值,若是则根据所述第二意图信息以结合所述历史数据生成对应的所述第二反馈信息。
189.b19、根据b11所述的智能交互的多轮对话系统,所述提取存储单元包括有:
190.提取子单元,用于提取所述第一意图信息和/或所述第一反馈信息中用于指示执行的至少一意图特征;
191.存储子单元,用于将全部的所述意图特征存储为历史数据。
192.b20、根据b11~b19任一项所述的智能交互的多轮对话系统,所述历史数据设为所述第一意图信息和/或所述第一反馈信息的槽位参数。
193.还提供了c21、一种存储介质,用于存储一种用于执行a1~a10中任意一种所述智能交互的多轮对话方法的计算机程序。
194.还提供了d22、一种计算机设备,包括存储介质、处理器以及存储在所述存储介质上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现a1~a10任一项所述的智能交互的多轮对话方法。