一种基于频域分解的图像压缩方法
摘要文本
本发明公开了一种基于频域分解的图像压缩方法,使用非线性分析变换网络将待编码图片转换成隐状态变量;将其输入到超先验分析变换网络,得到超先验变量,将解码的超先验变量输入到超先验合成变换网络,得到上采样的超先验变量;划分得到4个通道隐状态变量块;对于第一个变量块,将上采样的超先验变量输入到通道熵模型来预测均值和方差,然后使用算数编解码进行编码和解码。对于所述非第一个变量,将上采样的超先验变量和所有已经解码的变量块输入到通道熵模型来预测均值和方差,然后使用算法编码进行编码和解码;将上述解码的通道隐状态变量块在通道维度上合并,得到解码的隐状态变量;将其输入到非线性合成变换网络得到解码的图像。
申请人信息
- 申请人:中国科学技术大学
- 申请人地址:230026 安徽省合肥市包河区金寨路96号
- 发明人: 中国科学技术大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于频域分解的图像压缩方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410148424.6 |
| 申请日 | 2024/2/2 |
| 公告号 | CN117676149A |
| 公开日 | 2024/3/8 |
| IPC主分类号 | H04N19/147 |
| 权利人 | 中国科学技术大学 |
| 发明人 | 凌强; 王健; 李峰; 方毅 |
| 地址 | 安徽省合肥市包河区金寨路96号 |
专利主权项内容
1.一种基于频域分解的图像压缩方法,其特征在于,所述方法包括以下步骤:步骤1:使用基于频域分解的非线性分析变换网络将待编码图片转换成隐状态变量,非线性分析变换网络由卷积层,除法正则化层和频域分解块组成;步骤2:将所述隐状态变量输入到超先验分析变换网络,得到超先验变量,超先验变量的分辨率是隐状态变量的1/4,对超先验变量进行编码和解码,将解码的超先验变量输入到超先验合成变换网络,得到上采样的超先验变量;步骤3:将所述隐状态变量输入按照非均匀通道划分的方式得到4个通道隐状态变量块;步骤4:对于第一个通道隐状态变量块,将步骤2中上采样的超先验变量输入到通道熵模型来预测第一个通道隐状态变量块的均值和方差,然后使用算数编解码进行编码和解码,得到解码的第一个通道隐状态变量块;对于所述第k个通道隐状态变量块,k>1,将步骤2中上采样的超先验变量和已经解码的前k-1个通道隐状态变量块输入到通道熵模型来预测第k个通道隐状态变量块的均值和方差,然后使用算法编解码进行编码和解码;步骤5:将上述解码的4个通道隐状态变量块在通道维度上合并,得到解码的隐状态变量;将解码的隐状态变量输入到基于频域分解的非线性合成变换网络得到解码的图像,非线性合成变换网络由反卷积层,逆除法正则化层和频域分解块组成。。搜索马 克 数 据 网