← 返回列表

基于病理对齐扩散网络的医疗多模态内容分析及生成方法

申请号: CN202410048581.X
申请人: 中国科学技术大学
申请日期: 2024/1/12

摘要文本

本发明公开了基于病理对齐扩散网络的医疗多模态内容分析及生成方法,将给定图像输入到融合检测模型中,以生成与给定图像相匹配的文本报告;所述融合检测模型的训练过程如下:S1:构建训练集,并将训练集中的图像输送到融合检测模型;S2:提取图像的图像特征;S3:将图像特征与不同粒度的病理信息进行对齐,获得对齐特征;S4:将对齐特征进行特征增强得到增强特征,将对齐特征和增强特征相加后进行归一化操作得到归一化特征,基于归一化特征指导文本生成,得到文本报告;该医疗多模态内容分析及生成方法,解决现有基于自回归式的方法容易出现的错误传播问题,提高生成报告的质量。

专利详细信息

项目 内容
专利名称 基于病理对齐扩散网络的医疗多模态内容分析及生成方法
专利类型 发明申请
申请号 CN202410048581.X
申请日 2024/1/12
公告号 CN117557883A
公开日 2024/2/13
IPC主分类号 G06V10/80
权利人 中国科学技术大学
发明人 宋彦; 刘畅; 田元贺; 张勇东; 余晓凡; 蒋雪丽
地址 安徽省合肥市包河区金寨路96号

专利主权项内容

1.基于病理对齐扩散网络的医疗多模态内容分析及生成方法,其特征在于,将给定图像输入到融合检测模型中,以生成与给定图像相匹配的文本报告;所述融合检测模型的训练过程如下:S1:构建训练集,并将训练集中的图像输送到融合检测模型;S2:提取图像的图像特征/>;S3:将图像特征与不同粒度的病理信息进行对齐,获得对齐特征/>;S31:利用基于Transformer的多标签分类器作为病理对齐器从图像特征中计算报告粒度对齐特征/>;S32:利用基于Transformer的多标签分类器作为病理对齐器从图像特征中预测病理标签;S33:计算病理标签的平均池化值,得到病理术语粒度对齐特征;S34:将报告粒度对齐特征和病理术语粒度对齐特征/>相加并进行归一化操作,得到对齐特征/>;S4:将对齐特征进行特征增强得到增强特征/>,将对齐特征/>和增强特征/>相加后进行归一化操作得到归一化特征/>;S5:将归一化特征输送到扩散网络中指导文本生成,得到文本报告。