← 返回列表

一种基于知识库的多轮问答意图识别方法及装置

申请号: CN202410175322.3
申请人: 创意信息技术股份有限公司
申请日期: 2024/2/7

摘要文本

本发明提供了一种基于知识库的多轮问答意图识别方法及装置,属于意图识别技术领域。方法利用预设知识库文本的关键词集合与预处理后的问题文本进行相似度匹配,获得与问题文本相似的候选文本集合和对应的关键词集合;同时依据对候选文本集合进行第一分级阈值筛选和二级阈值分流,筛选出合适的文本输入预设大模型进行回答。在未能筛选到合适文本时,将问题文本与最近的历史问题文本结合,得到新的问题文本后,将其与候选文本集合输入预设大模型进行回答。本发明通过对多轮问答的问题意图进行识别,将历史问题中的重要信息识别出来与当前问题组合后在知识库中进行匹配,提高了用户输入意图匹配度,解决了多轮问答意图难以识别的问题。 www.macrodatas.cn

专利详细信息

项目 内容
专利名称 一种基于知识库的多轮问答意图识别方法及装置
专利类型 发明申请
申请号 CN202410175322.3
申请日 2024/2/7
公告号 CN117743556A
公开日 2024/3/22
IPC主分类号 G06F16/332
权利人 创意信息技术股份有限公司
发明人 何维; 周正斌; 肖美虹; 姚易佳; 胡誉; 陈泽源
地址 四川省成都市青羊区万和路99号丽阳天下7-9室

专利主权项内容

1.一种基于知识库的多轮问答意图识别方法,其特征在于,包括:获取预处理后的问题文本;利用预设知识库文本的关键词集合与所述问题文本进行相似度匹配,获得与所述问题文本相似的候选文本集合和对应的关键词集合;依据文本相似度对所述候选文本集合进行筛选,若所述候选文本集合中存在文本相似度大于第一分级阈值的文本,则将文本相似度大于第一分级阈值的文本输入预设大模型进行回答;若所述候选文本集合中不存在文本相似度大于第一分级阈值的文本,则对所述问题文本进行成分句法分析,获得对应的问题关键信息集合;对所述问题关键信息集合与所述关键词集合进行编辑距离相似度匹配计算,获得编辑距离匹配结果;对所述编辑距离匹配结果进行二级阈值分流,若所述编辑距离匹配结果中存在编辑距离匹配个数大于第二分级阈值的文本,则将编辑距离匹配个数大于第二分级阈值的文本输入预设大模型进行回答;若所述编辑距离匹配结果中不存在编辑距离匹配个数大于第二分级阈值的文本,则将所述问题文本与最近的历史问题文本结合,获得新的问题文本;依据新的问题文本与所述候选文本集合输入预设大模型进行回答。