首页 > 乐器声学 专利正文
基于拟真人逻辑知识库的AI视频云交互系统的制作方法

时间:2022-02-18 阅读: 作者:专利查询

基于拟真人逻辑知识库的AI视频云交互系统的制作方法
基于拟真人逻辑知识库的ai视频云交互系统
技术领域
1.本发明属于智能系统领域,尤其涉及一种基于拟真人逻辑知识库的ai视频云交互系统。


背景技术:

2.现有的视频交互系统,每次用户交互时,均会打断机器人当前的讲话,不够接近于真人的对话模拟,且交互一旦开始,无法中断,直至系统关机。
3.而且现有的ai视频交互系统一般部署在linux系统,关机方式是使用手动输入linux命令,且操作界面隐藏在播放界面之下,操作繁琐,使用门槛较高,不适于商业化推广。
4.而且现有的视频交互系统在解析用户语言时,因受用户所在地域、习惯、发音方式等客观变量影响,使得普通话的标准程度参差不齐,语言转文本的识别程序无法做到百分百精准,并结合网络传输对音频流的干扰影响等其它情况,导致解析的关键词出现音较相似但字不相同的词汇,极大影响视频交互系统程序的正确判断。


技术实现要素:

5.本发明为了解决上述现有技术中存在的缺陷和不足,提供了一种集成了打断交互方法、语音关机方法和语言纠正方法,使机器人交互更加拟真人化、智能化,极大的方便了用户的使用和商业化的推广,还使得智能交互效果在准确性、判断能力方面显著提升,并进一步增强用户体验感的基于拟真人逻辑知识库的ai视频云交互系统。
6.本发明的技术方案:一种基于拟真人逻辑知识库的ai视频云交互系统,集成了打断交互方法、语音关机方法和语言纠正方法,所述打断交互方法实现人机交互的打断指令、打断次数、交互中断与唤醒的可控性,使机器人交互更加拟真人化、智能化;所述语音关机方法是在系统中添加了关机的语音指令,通过语音指令直接控制系统的关机;所述语言纠正方法是在系统中增加对音相似字不同的词汇做预判纠正功能,对交互过程中即使存在大量该类词汇,也能快速实现文字转拼音的相应机制,使得智能交互效果在准确性、判断能力方面显著提升,并进一步增强用户体验感。
7.本发明集成了打断交互方法、语音关机方法和语言纠正方法,使机器人交互更加拟真人化、智能化,极大的方便了用户的使用和商业化的推广,还使得智能交互效果在准确性、判断能力方面显著提升,并进一步增强用户体验感。
8.优选地,所述打断交互方法的步骤如下:当用户说出一句话后,先检测当前机器人是否正在讲话中,若正在讲话中,则检测当前交互系统已经被打断过几次,若大于设定的最大次数,则不允许打断当前机器人的讲话,直至机器人讲完当前话术,否则执行允许打断步骤。
9.优选地,其中允许打断步骤具体如下:先提取用户说的该句话是否存在关键词,若
无则不会打断,若有则检索该关键词属性,是否允许“打断”和是否需要“中断”,若均不是,则不允许打断;若有“中断”属性,则允许打断机器人当前讲话且机器人将在讲完中断词后,设置暂停交互系统的标志位为真,后续用户每次所讲的话,均被记录下来,并提取关键词,检测该关键词是否为“结束中断”属性,若是则设置暂停交互系统标志位为假,恢复交互系统,否则刷新当前已被打断次数为0,防止在暂停交互状态中,打断超次而无法恢复交互;否则若为“打断”属性,则允许打断机器人当前讲话且机器人将在讲完打断词后,将已被打断次数累加1,打断次数将在机器人完整讲完当前话术后重置为0,允许下次对话重复该流程。
10.优选地,所述语音关机方法的步骤如下:当用户说与关机相关关键词对应的语音指令后,系统通过识别程序将语音转换成文本,然后通过关键词表提取出关机相关关键词,以及每个关键词的权重属性,根据权重依次执行权重高的关键词,此时需将关机相关关键词权重设置为较高级别,后查询通用表检索关机相关关键词的详细属性,如是否需要结束交互,若查询到该关键词且配置了结束属性,则继续查询音频表该关键词需播放的音视频文件名称,此时需设置音视频文件名称为end.wav和end.mp4,后通过网络传输该音视频文件名给播放器,播放器在收到end.wav和end.mp4后将在播放完该音视频文件后中断与交互系统的连接并关闭播放界面,交互系统在监听到播放器中断连接后,将结束本次交互并清理交互缓存。
11.优选地,其中关机相关关键词包括“关机”、“再见”和“结束”。
12.优选地,所述语言纠正方法的步骤如下:当用户期望说的话在因上述情况识别成别的文字,如“xxx,你好”识别成“xxx,泥号”时,首先查询该句话是否有纠正词表中指定的待纠正关键词,若存在则查询该待纠正词在该句话中的位置,并在该位置替换掉该词汇,替换后的词汇为可自定义的、可带空格进行模糊查询的预判性关键词,后以替换后的整句话进行关键词表查询是否有关键词和关键词属性,执行交互逻辑;若未设置预判性纠正关键词,且查询关键词失败,则可以使用拼音查询的方式,将该句话全部转换成拼音,然后以拼音去关键词表查询关键词,若查到则执行交互逻辑,否则走未识别流程。
13.本发明集成了打断交互方法、语音关机方法和语言纠正方法,使机器人交互更加拟真人化、智能化,极大的方便了用户的使用和商业化的推广,还使得智能交互效果在准确性、判断能力方面显著提升,并进一步增强用户体验感。
附图说明
14.图1为本发明中打断交互方法的流程图;图2为本发明中语音关机方法的流程图;图3为本发明中语言纠正方法的流程图。
具体实施方式
15.下面结合附图对本发明作进一步详细的说明,但并不是对本发明保护范围的限制。
16.一种基于拟真人逻辑知识库的ai视频云交互系统,集成了打断交互方法、语音关机方法和语言纠正方法,所述打断交互方法实现人机交互的打断指令、打断次数、交互中断与唤醒的可控性,使
机器人交互更加拟真人化、智能化;所述语音关机方法是在系统中添加了关机的语音指令,通过语音指令直接控制系统的关机;所述语言纠正方法是在系统中增加对音相似字不同的词汇做预判纠正功能,对交互过程中即使存在大量该类词汇,也能快速实现文字转拼音的相应机制,使得智能交互效果在准确性、判断能力方面显著提升,并进一步增强用户体验感。
17.如图1所示,所述打断交互方法的步骤如下:当用户说出一句话后,先检测当前机器人是否正在讲话中,若正在讲话中,则检测当前交互系统已经被打断过几次,若大于设定的最大次数,则不允许打断当前机器人的讲话,直至机器人讲完当前话术,否则执行允许打断步骤。其中允许打断步骤具体如下:先提取用户说的该句话是否存在关键词,若无则不会打断,若有则检索该关键词属性,是否允许“打断”和是否需要“中断”,若均不是,则不允许打断;若有“中断”属性,则允许打断机器人当前讲话且机器人将在讲完中断词后,设置暂停交互系统的标志位为真,后续用户每次所讲的话,均被记录下来,并提取关键词,检测该关键词是否为“结束中断”属性,若是则设置暂停交互系统标志位为假,恢复交互系统,否则刷新当前已被打断次数为0,防止在暂停交互状态中,打断超次而无法恢复交互;否则若为“打断”属性,则允许打断机器人当前讲话且机器人将在讲完打断词后,将已被打断次数累加1,打断次数将在机器人完整讲完当前话术后重置为0,允许下次对话重复该流程。
18.如图2所示,所述语音关机方法的步骤如下:当用户说与关机相关关键词对应的语音指令后,系统通过识别程序将语音转换成文本,然后通过关键词表提取出关机相关关键词,以及每个关键词的权重属性,根据权重依次执行权重高的关键词,此时需将关机相关关键词权重设置为较高级别,后查询通用表检索关机相关关键词的详细属性,如是否需要结束交互,若查询到该关键词且配置了结束属性,则继续查询音频表该关键词需播放的音视频文件名称,此时需设置音视频文件名称为end.wav和end.mp4,后通过网络传输该音视频文件名给播放器,播放器在收到end.wav和end.mp4后将在播放完该音视频文件后中断与交互系统的连接并关闭播放界面,交互系统在监听到播放器中断连接后,将结束本次交互并清理交互缓存。其中关机相关关键词包括“关机”、“再见”和“结束”等。
19.如图3所示,所述语言纠正方法的步骤如下:当用户期望说的话在因上述情况识别成别的文字,如“xxx,你好”识别成“xxx,泥号”时,首先查询该句话是否有纠正词表中指定的待纠正关键词,若存在则查询该待纠正词在该句话中的位置,并在该位置替换掉该词汇,替换后的词汇为可自定义的、可带空格进行模糊查询的预判性关键词,后以替换后的整句话进行关键词表查询是否有关键词和关键词属性,执行交互逻辑;若未设置预判性纠正关键词,且查询关键词失败,则可以使用拼音查询的方式,将该句话全部转换成拼音,然后以拼音去关键词表查询关键词,若查到则执行交互逻辑,否则走未识别流程。
20.本发明的ai视频云交互系统拥有一套完整的话术逻辑库。
21.本发明集成了打断交互方法、语音关机方法和语言纠正方法,使机器人交互更加拟真人化、智能化,极大的方便了用户的使用和商业化的推广,还使得智能交互效果在准确性、判断能力方面显著提升,并进一步增强用户体验感。