← 返回列表

一种基于增强图注意力网络的敏感信息识别方法及系统

申请号: CN202410121012.3
申请人: 西南石油大学
申请日期: 2024/1/29

摘要文本

本发明涉及一种基于增强图注意力网络的敏感信息识别方法及系统,属于自然语言处理领域。包括:a)获取并预处理新闻文本分类数据集和敏感信息识别数据集的文本,分别得到新闻文本和敏感信息文本;b)构造基于新闻文本的文本图和基于敏感信息文本的文本图;c)将基于新闻文本的文本图作为训练数据输入基于增强图注意力网络的文本分类模型KGAX进行训练,并保存特征层参数;d)将KGAX的特征层参数迁移到基于增强图注意力网络的敏感信息识别模型KGAM中,再将基于敏感信息文本的文本图作为训练数据输入KGAM进行训练。本发明充分学习了敏感信息文本的潜在结构信息,提升了敏感信息识别任务的分类效果。

专利详细信息

项目 内容
专利名称 一种基于增强图注意力网络的敏感信息识别方法及系统
专利类型 发明申请
申请号 CN202410121012.3
申请日 2024/1/29
公告号 CN117648633A
公开日 2024/3/5
IPC主分类号 G06F18/241
权利人 西南石油大学
发明人 吴雨虹; 王欣; 张望
地址 四川省成都市新都大道8号西南石油大学

专利主权项内容

1.一种基于增强图注意力网络的敏感信息识别方法,其特征在于,包括以下步骤:S1、下载新闻文本分类数据集,并从互联网中获取文本以构造敏感信息识别数据集;对新闻文本分类数据集和敏感信息识别数据集中的文本进行预处理后分别得到新闻文本和敏感信息文本;S2、基于新闻文本和敏感信息文本构造以单词为节点、单词对的共现次数为边的文本图,分别得到基于新闻文本的文本图和基于敏感信息文本的文本图;S3、构建基于增强图注意力网络的文本分类模型KGAX,将基于新闻文本的文本图作为训练数据输入至KGAX中,经过参数调优得到最佳模型,并保存KGAX的特征层参数;S4、构建基于增强图注意力网络的敏感信息识别模型KGAM,将KGAX中的特征层参数迁移到KGAM中;将基于敏感信息文本的文本图作为训练数据输入至KGAM中,经过参数调优对模型参数进一步更新。