← 返回列表
一种区域级综合能源大规模数据清洗方法
摘要文本
本发明涉及数据处理技术领域,具体涉及一种区域级综合能源大规模数据清洗方法,包括:获取电力数据段;根据每个电力数据段中的数据,获取疑似异常电力数据段;根据疑似异常电力数据段中的相邻的数据,获取疑似异常电力数据段中每个疑似异常电力数据,计算每个疑似异常电力数据变化的无理程度;根据疑似异常电力数据变化的无理程度,获取疑似异常电力数据的正常程度,并得到对疑似异常电力数据段进行孤立森林算法中的根节点的选取范围,对疑似异常电力数据段中的异常数据,对电力数据进行清洗。本发明通过缩小孤立森林算法中的根节点的选取范围,能够能容易的将异常数据分割出来,达到提高数据清洗效率的目的。
申请人信息
- 申请人:国网山东省电力公司经济技术研究院
- 申请人地址:250000 山东省济南市槐荫区西市场街道纬十路111号
- 发明人: 国网山东省电力公司经济技术研究院
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种区域级综合能源大规模数据清洗方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410223567.9 |
| 申请日 | 2024/2/29 |
| 公告号 | CN117807547A |
| 公开日 | 2024/4/2 |
| IPC主分类号 | G06F18/2433 |
| 权利人 | 国网山东省电力公司经济技术研究院 |
| 发明人 | 杨扬; 梁荣; 崔灿; 刘钊; 綦陆杰; 赵韧; 邓少治; 王延朔; 杨波; 杨慎全; 刘淑莉; 李昭; 李昊; 王耀雷; 李凯; 张雯; 刘蕊; 张博颐 |
| 地址 | 山东省济南市槐荫区纬十路111号 |
专利主权项内容
1.一种区域级综合能源大规模数据清洗方法,其特征在于,该方法包括以下步骤:采集若干个连续时刻下供电系统的不同类型的电力数据分别形成的序列,统称为电力数据序列,将任意电力数据序列划分为若干个电力数据段;根据每个电力数据段中的数据的数值差异筛选出电力数据段中的疑似异常电力数据段;根据疑似异常电力数据段中的相邻数据之间的差异,计算疑似异常电力数据段中每个数据的变化程度;根据疑似异常电力数据段中每个数据的变化程度,获取疑似异常电力数据段中每个疑似异常电力数据;根据疑似异常电力数据所对应的其他类型的电力数据的差异,计算每个疑似异常电力数据变化的无理程度;根据疑似异常电力数据变化的无理程度,获取疑似异常电力数据的正常程度;根据疑似异常电力数据的正常程度,获取对疑似异常电力数据段进行孤立森林算法中的根节点的选取范围,根据对疑似异常电力数据段进行孤立森林算法中的根节点的选取范围,获取疑似异常电力数据段中的异常数据,对电力数据进行清洗。