← 返回列表
异构算力的耗时预测仿真方法、装置、设备、介质及系统
摘要文本
本发明公开了计算机技术领域内的一种异构算力的耗时预测仿真方法、装置、设备、介质及系统。本发明能够构建包括通信图节点和计算图节点的有向图,从而根据多个异构算力设备的网络拓扑信息仿真得到的仿真网络预测多个通信图节点的通信耗时,根据有向图预测多个计算图节点的计算耗时,累计通信耗时和计算耗时得到模型训练任务的训练耗时。由于无需部署实际的算力设备,因此没有部署难度,实现成本低,可根据预测的训练耗时优化算力设备的部署策略,预测准确度更高,适用于多元异构计算系统。
申请人信息
- 申请人:浪潮电子信息产业股份有限公司
- 申请人地址:250000 山东省济南市高新区草山岭南路801号9层东侧
- 发明人: 浪潮电子信息产业股份有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 异构算力的耗时预测仿真方法、装置、设备、介质及系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410230017.X |
| 申请日 | 2024/2/29 |
| 公告号 | CN117827619A |
| 公开日 | 2024/4/5 |
| IPC主分类号 | G06F11/34 |
| 权利人 | 浪潮电子信息产业股份有限公司 |
| 发明人 | 唐轶男; 赵雅倩; 郭振华; 王丽; 李仁刚; 高开; 曹芳 |
| 地址 | 山东省济南市高新区草山岭南路801号9层东侧 |
专利主权项内容
1.一种异构算力的耗时预测仿真方法,其特征在于,包括:确定模型训练任务、运行所述模型训练任务中的各算子的多个异构算力设备以及所述多个异构算力设备的网络拓扑信息;按照预设的训练并行模式确定多个通信图节点,基于所述多个异构算力设备及其运行的相应算子确定多个计算图节点;其中,所述通信图节点表示数据传输逻辑;按照所述训练并行模式和所述模型训练任务中的各算子间的关系建立所述多个通信图节点之间、所述多个计算图节点之间、任意通信图节点和任意计算图节点之间的有向边,得到有向图;根据所述网络拓扑信息仿真得到的仿真网络预测所述多个通信图节点的通信耗时,根据所述有向图预测所述多个计算图节点的计算耗时,累计所述通信耗时和所述计算耗时得到所述模型训练任务的训练耗时。