← 返回列表

面向资源受限场景的遥感基础模型轻量化方法、装置

申请号: CN202311498052.1
申请人: 中国科学院空天信息创新研究院
申请日期: 2023/11/10

摘要文本

本发明提供了一种面向资源受限场景的遥感基础模型轻量化方法、装置,可以应用于遥感技术领域。该方法包括:将训练好的第一模型做为专家模型,未完成训练的第二模型作为学生模型,对该未完成训练的第二模型进行蒸馏,得到训练好的第二模型;将该训练好的第二模型作为专家模型,未完成训练的第三模型作为学生模型,对该第三模型进行蒸馏,得到训练好的第三模型,第一模型的参数量等级大于第二模型的参数量等级,第二模型的参数量等级大于第三模型的参数量等级,可显著提高遥感大规模基础模型蒸馏过程的稳定性。

专利详细信息

项目 内容
专利名称 面向资源受限场景的遥感基础模型轻量化方法、装置
专利类型 发明申请
申请号 CN202311498052.1
申请日 2023/11/10
公告号 CN117521848A
公开日 2024/2/6
IPC主分类号 G06N20/00
权利人 中国科学院空天信息创新研究院
发明人 孙显; 付琨; 冯瑛超; 裴健宁; 刁文辉; 戴威; 毕涵博
地址 北京市海淀区北四环西路19号

专利主权项内容

1.一种面向资源受限场景的遥感基础模型轻量化方法,其特征在于,包括:将训练好的第一模型做为专家模型,未完成训练的第二模型作为学生模型,对所述未完成训练的第二模型进行蒸馏,得到训练好的第二模型;将所述训练好的第二模型作为专家模型,未完成训练的第三模型作为学生模型,对所述第三模型进行蒸馏,得到训练好的第三模型;其中,所述第一模型、所述第二模型和所述第三模型均为遥感基础模型;所述第一模型、所述第二模型和所述第三模型的参数量等级不同,所述第一模型的参数量等级大于所述第二模型的参数量等级,所述第二模型的参数量等级大于所述第三模型的参数量等级。