← 返回列表
一种卷积神经网络计算加速方法及装置、设备、介质
摘要文本
本申请公开了一种卷积神经网络计算加速方法及装置、设备、介质。该方法至少包括:利用第一函数,对原始的输入张量和卷积核进行量化处理,得到定点数形式的输入张量和卷积核;利用第二函数,计算定点数形式的输入张量和卷积核分别的量化偏移,第一函数和第二函数包含相应的量化缩放系数,以及浮点数转定点数的转换逻辑;根据量化偏移,计算定点数形式的输入张量和卷积核的第一卷积结果;根据量化缩放系数和第一卷积结果,计算原始的输入张量和卷积核的第二卷积结果。本申请利用浮点数转定点数的转换逻辑,以及基于量化偏移的自适应量化处理,有利于提高卷积计算速度,提高算法性能,降低硬件功耗和设计难度。
申请人信息
- 申请人:嘉楠明芯(北京)科技有限公司
- 申请人地址:100094 北京市海淀区东北旺西路8号中关村软件园一期27号楼C座2层206号
- 发明人: 嘉楠明芯(北京)科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种卷积神经网络计算加速方法及装置、设备、介质 |
| 专利类型 | 发明授权 |
| 申请号 | CN201811286575.9 |
| 申请日 | 2018年10月31日 |
| 公告号 | CN111126558B |
| 公开日 | 2024年4月2日 |
| IPC主分类号 | G06N3/0464 |
| 权利人 | 嘉楠明芯(北京)科技有限公司 |
| 发明人 | 郭晖; 张楠赓 |
| 地址 | 北京市海淀区东北旺西路8号中关村软件园一期27号楼C座2层206号 |
专利主权项内容
1.一种卷积神经网络计算加速方法,其特征在于,包括:利用第一函数,对原始的输入张量和卷积核进行量化处理,得到定点数形式的输入张量和卷积核;利用第二函数,计算所述定点数形式的输入张量和卷积核分别的量化偏移,所述第一函数和所述第二函数包含相应的量化缩放系数,以及浮点数转定点数的转换逻辑;根据所述量化偏移,计算所述定点数形式的输入张量和卷积核的第一卷积结果;根据所述量化缩放系数和所述第一卷积结果,计算所述原始的输入张量和卷积核的第二卷积结果;其中,所述量化缩放系数包括用于输入张量的第一量化系数,以及用于卷积核的第二量化系数;所述第一量化系数根据指定的量化值域的最值和所述原始的输入张量的最值计算得到,和/或所述第二量化系数根据指定的量化值域的最值和所述原始的卷积核的最值计算得到。