基于人工智能的数字化企业服务数据挖掘方法及系统
摘要文本
本申请提供一种基于人工智能的数字化企业服务数据挖掘方法及系统,通过利用文本数据挖掘网络中的文本语义解析单元,从各个范例对话文本中提取出第一文本语义向量序列。同时,它将这些对话文本分类为监督学习对话文本和非监督学习对话文本,进而实现上下文和整体语义嵌入表示的生成。此外,还针对非监督学习对话文本,依据其上下文语义向量序列和整体文本语义向量序列,找出与之相关性最大的范例对话文本,更准确地识别和理解非监督学习对话文本的语义内容。此外通过筛选非监督学习对话文本,并结合相应的范例对话文本确定混合训练Loss函数值,实现了对文本数据挖掘网络进行参数学习,优化了网络性能。
申请人信息
- 申请人:川投信息产业集团有限公司
- 申请人地址:610095 四川省成都市高新区天泰路112号
- 发明人: 川投信息产业集团有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于人工智能的数字化企业服务数据挖掘方法及系统 |
| 专利类型 | 发明授权 |
| 申请号 | CN202410078421.X |
| 申请日 | 2024/1/19 |
| 公告号 | CN117591662B |
| 公开日 | 2024/3/29 |
| IPC主分类号 | G06F16/332 |
| 权利人 | 川投信息产业集团有限公司 |
| 发明人 | 林杨; 叶桄希; 刘馨霖 |
| 地址 | 四川省成都市高新区天泰路112号 |
专利主权项内容
1.一种基于人工智能的数字化企业服务数据挖掘方法,其特征在于,所述方法包括:获取范例对话文本服务对话文本数据中的X个范例多轮对话文本,并依据文本数据挖掘网络中的文本语义解析单元,提取所述X个范例多轮对话文本中各个范例多轮对话文本的第一文本语义向量序列,所述范例对话文本服务对话文本数据为在本轮训练阶段中针对目标数字化企业服务的对话文本服务对话文本数据,所述X个范例多轮对话文本包括Y个监督学习对话文本和Z个非监督学习对话文本,Y和Z为大于0的整数,且X等于Y与Z的相加值,所述文本数据挖掘网络用于对多轮服务对话文本中关键对话节点的服务需求意图进行挖掘;对所述各个范例多轮对话文本的第一文本语义向量序列分别进行上下文和整体语义嵌入表示,生成所述各个范例多轮对话文本的上下文语义向量序列和整体文本语义向量序列;针对所述Z个非监督学习对话文本中的第x个非监督学习对话文本,依据所述上下文语义向量序列和所述整体文本语义向量序列,在所述X个范例多轮对话文本中除所述第x个非监督学习对话文本外的X-1个范例多轮对话文本中,确定与所述第x个非监督学习对话文本的上下文相关性最大的第一范例对话文本,以及与所述第x个非监督学习对话文本的整体相关性最大的第二范例对话文本,所述x为不大于Z的正整数;从所述Z个非监督学习对话文本中筛选Q个第一非监督学习对话文本,依据所述Q个第一非监督学习对话文本的整体文本语义向量序列以及对应的第二范例对话文本的整体文本语义向量序列,确定所述文本数据挖掘网络的混合训练Loss函数值,并依据所述混合训练Loss函数值对所述文本数据挖掘网络进行参数学习,所述第一非监督学习对话文本为对应的第一范例对话文本和对应的第二范例对话文本相同的非监督学习对话文本;依据文本数据挖掘网络中的文本语义解析单元,获取待进行服务意图挖掘的目标多轮服务对话文本的目标文本语义向量序列,依据所述目标文本语义向量序列,确定所述目标多轮服务对话文本属于M种服务需求意图的置信度评分,所述M为不小于2的正整数。