← 返回列表

目标内容生成及模型训练方法、装置、系统、设备及介质

申请号: CN202410096307.X
申请人: 山东海量信息技术研究院
申请日期: 2024/1/24

摘要文本

本发明公开了一种目标内容生成及模型训练方法、装置、系统、设备及介质,应用于人工智能技术领域。其中,方法包括通过将传统神经网络至少一层替换为浅层量子神经网络的方式搭建自动生成目标内容的自然语言处理模型。利用自然语言样本,基于量子向量数据库,将量子神经网络上一层输出转换的量子态化的自然语言数据输入量子神经网络,并转换量子神经网络输出。基于自然语言处理模型的预测目标内容和真实目标内容间的内容偏差调整模型参数,直至达到训练终止条件。本发明可以解决相关技术中自然语言模型的规模受限于算力资源的问题,能够在有限算力资源的情况下,实现大规模自然语言模型的构建,进而能够处理复杂以及计算量大的自然语言生成任务。

专利详细信息

项目 内容
专利名称 目标内容生成及模型训练方法、装置、系统、设备及介质
专利类型 发明申请
申请号 CN202410096307.X
申请日 2024/1/24
公告号 CN117634459A
公开日 2024/3/1
IPC主分类号 G06F40/20
权利人 山东海量信息技术研究院
发明人 李辰; 姜金哲; 张新; 李红珍; 赵雅倩; 李仁刚
地址 山东省济南市高新技术开发区国家信息通信国际创新园

专利主权项内容

1.一种用于生成目标内容的自然语言处理模型训练方法,其特征在于,包括:基于目标神经网络模型和量子神经网络模型,通过将所述目标神经网络模型的至少一层替换为所述量子神经网络模型的方式,搭建用于根据用户的目标内容生成请求自动生成相应目标内容的自然语言处理模型;所述量子神经网络模型的层数小于预设层数阈值;将自然语言样本数据集的自然语言样本输入至所述自然语言处理模型;基于量子向量数据库,将所述量子神经网络模型的上一层输出的自然语言特征提取信息转换量子态化的自然语言数据,并将所述量子态化的自然语言数据输入至所述量子神经网络模型;将所述量子神经网络模型输出的测量结果转换为满足预设后处理格式的自然语言特征数据;根据所述自然语言处理模型输出的预测目标内容和所述自然语言样本对应的真实目标内容之间的内容偏差,对所述自然语言处理模型的模型参数进行调整,直至达到模型训练终止条件。