← 返回列表

目标索引模型的训练方法、信息检索方法及装置

申请号: CN202410043764.2
申请人: 中国科学技术大学
申请日期: 2024/1/12

摘要文本

本发明提供了一种目标索引模型的训练方法、信息检索方法及装置。该训练方法包括对产品数据进行向量转换,得到多个第一训练向量;产品数据包括图像数据或文本数据;针对每个第二训练向量,基于预设估计方法在多个第二训练向量中确定与第二训练向量对应的第一邻居向量,其中,第一邻居向量表征第二训练向量的第一标签向量;利用多个第二训练向量和多个第一标签向量训练基于Transformer构建的第一分类模型,得到第二分类模型,其中,第一分类模型中输出层的每个节点包括预设数量的第一训练向量;利用多个第三训练向量和多个第二标签向量对第三分类模型进行训练,得到目标索引模型,第三训练向量和第二标签向量是利用第二分类模型生成的。

专利详细信息

项目 内容
专利名称 目标索引模型的训练方法、信息检索方法及装置
专利类型 发明申请
申请号 CN202410043764.2
申请日 2024/1/12
公告号 CN117556068A
公开日 2024/2/13
IPC主分类号 G06F16/51
权利人 中国科学技术大学
发明人 连德富; 陈恩红; 黎武超; 冯超
地址 安徽省合肥市包河区金寨路96号

专利主权项内容

1.一种目标索引模型的训练方法,应用于信息检索系统,其特征在于,包括:响应于训练指令,从数据库中获取多个产品数据,其中,所述产品数据包括图像数据或文本数据;对所述产品数据进行向量转换,得到多个第一训练向量;针对每个第二训练向量,利用处理器基于预设估计方法在多个所述第二训练向量中确定与所述第二训练向量对应的第一邻居向量,其中,所述第一邻居向量表征所述第二训练向量的第一标签向量,所述第二训练向量是从多个第一训练向量中挑选得到的;利用多个所述第二训练向量和多个第一标签向量训练基于Transformer构建的第一分类模型,得到第二分类模型,其中,所述第一分类模型中输出层的每个节点包括预设数量的第一训练向量;利用多个第三训练向量和多个第二标签向量对第三分类模型进行训练,得到所述目标索引模型,其中,所述第三分类模型是利用平衡树算法构建的,所述第三训练向量和所述第二标签向量是利用所述第二分类模型生成的。