← 返回列表

一种中文电子病历实体识别与四诊分类的抽取方法及模型

申请号: CN202410162773.3
申请人: 成都中医药大学
申请日期: 2024/2/5

摘要文本

本发明公开了一种中文电子病历实体识别与四诊分类的抽取方法及模型。本发明提供的方法至少包括:对中医临床电子病历数据进行分词,以获取训练数据;将训练数据输入抽取模型进行训练;将中医临床电子病历数据输入训练后的抽取模型得到电子病历的实体识别结果与四诊分类结果。抽取模型为配置有自注意力机制的循环交互网络的神经网络模型,其至少包括将电子病历数据的分词结果映射为字符嵌入特征向量和上下文卷积特征向量并将字符嵌入特征向量和上下文卷积特征向量混合生成向量矩阵的混合嵌入层。本发明将中文电子病历实体识别任务和四诊分类任务联合执行,采用字符级卷积特征提取,融合自注意力机制,有效避免中文字符精确匹配任务的误差。

专利详细信息

项目 内容
专利名称 一种中文电子病历实体识别与四诊分类的抽取方法及模型
专利类型 发明申请
申请号 CN202410162773.3
申请日 2024/2/5
公告号 CN117708338A
公开日 2024/3/15
IPC主分类号 G06F16/35
权利人 成都中医药大学
发明人 许强; 曾小茼; 刘微微; 赵智慧; 李炜弘; 温川飙; 高原
地址 四川省成都市温江区柳台大道1166号

专利主权项内容

1.一种中文电子病历实体识别与四诊分类抽取方法,其特征在于,所述方法至少包括:对中医临床电子病历数据进行分词,以获取训练数据;将所述训练数据输入抽取模型进行训练;将所述中医临床电子病历数据输入训练后的所述抽取模型得到所述电子病历的实体识别结果与四诊分类结果;其中,所述抽取模型为配置有自注意力机制的循环交互网络的神经网络模型,其至少包括混合嵌入层,所述混合嵌入层将电子病历数据的分词结果映射为两种不同的稠密嵌入向量,并将两种稠密嵌入向量混合生成向量矩阵。 (来源 马克数据网)