基于数据挖掘的电力系统短期负荷预测毕业论文
2020-02-18 11:06:58
摘 要
电力是国家经济建设、社会稳定、生活质量的基础。电力系统负荷预测在电力规划中占据了重要的地位,是电网管理部门的基础工作之一。负荷预测[1]是根据系统的运行特性、增容决策、自然条件与社会影响等诸多因数,在满足一定精度要求的条件下,确定未来某特定时刻的负荷数据。
如今,数据爆炸式的增长使得数据处理难度越来越大,迫切需要一个功能强大的工具。数据挖掘,具有从数据中发现有价值信息的能力,已成为当下处理数据的重要手段之一。
本文将把数据挖掘合理地运用于电力预测中,结合实际情况,探讨基于数据挖掘的短期电力负荷预测方法。首先,本文将采用聚类分析中的K-means分析方法,根据负荷的相似性将其分类。历史负荷数据被分成三类后,针对每一类数据,利用人工神经网络法中的BP模型得到负荷预测值。最后,通过预测结果与实际数值进行横向对比,并与采用同结构BP法的预测结果进行纵向对比,探讨基于数据挖掘的电力负荷预测法的可行性。
关键词: 短期负荷预测;数据挖掘;聚类分析;BP模型
Abstract
Electricity is the foundation of national economic construction, social stability and quality of life. Power system load forecasting plays an important role in power planning and is one of the basic work of power grid management department. Load forecasting [1] is to determine the load data at a specific time in the future, based on the operating characteristics of the system, capacity-increasing decision, natural conditions and social impact and many other factors.
Nowadays, the explosive growth of data makes data processing more and more difficult, and a powerful tool is urgently needed. Data mining, with the ability to discover valuable information from data, has become one of the important means of data processing.
In this paper, data mining will be applied to power forecasting reasonably. Combining with the actual situation, the short-term power load forecasting method based on data mining will be discussed. Firstly, the K-means method of cluster analysis will be used to classify the load according to its similarity. After the historical load data are divided into three categories, the BP model in the artificial neural network method is used to obtain the load forecasting value for each type of data. Finally, the feasibility of data mining based power load forecasting method is discussed by comparing the forecasting results with the actual values horizontally and vertically with the forecasting results using the same structure BP method.
Key words: Short-term load forecasting ;data mining ;clustering analysis ;BP model
目录
1绪论………………………………………………………………………………….1
1.1选题背景及意义 1
1.2国内外研究发展 1
1.3本文主要工作 1
2短期电力系统负荷预测 3
2.1短期电力负荷预测的概念及原理 3
2.2短期电力负荷预测的步骤 4
2.3负荷预测方法 6
2.3.1传统预测方法 6
2.3.2人工智能预测方法 8
3基于数据挖掘的短期电力负荷预测方法 10
3.1数据挖掘 10
3.1.1数据挖掘的概念 10
3.1.2数据挖掘的发展及挑战 11
3.1.3数据挖掘的功能 11
3.2基于数据挖掘的负荷预测方法 12
3.3基于数据挖掘的短期负荷预测实施步骤 13
4基于数据挖掘的短期负荷预测实例 15
4.1K-means聚类分析 15
4.2BP神经网络法预测 16
4.3结果分析 18
5总结与展望 19
参考文献 20
致谢语 21
附录 22
1 绪论
1.1选题背景及意义
电能,诞生于第二次世界工业革命,发展至今,已经成为国家发展的基础能源行业。随着整体经济的发展和电力市场的进一步开放,电力供需矛盾日益加剧,人们对电能的要求也日益增高,由此,电力负荷预测越来越受到重视。电力负荷预测,是电力部门基础工作之一,也是电力系统安全和经济地运行的保障。通过电力负荷预测,电力部门能准确和有效地开展安排与调度工作,确保整个电力发、输、配到送电环节的稳定进行。精确地进行负荷预测,有助于用电管理安排,合理地规划电源建设,同时节省煤、油资源,降低发电成本,提高电力效益和社会效益。
提高负荷预测水平,必须要考虑相关因素对其的影响。近年来,关于负荷预测的研究重点已经由改良预测方法转为探寻相关因素的影响方式。传统的负荷预测方法已经无法满足如今数据的爆炸式增长,为了更好地处理相关影响因素,数据挖掘被运用于负荷预测工作中。基于数据挖掘的负荷预测,能改善传统预测方法的不足,有利于负荷预测精度的提高。
1.2国内外研究发展
最早在20世纪20年代就有学者开始了电力负荷预测的研究,但限制于当时规模较小的不成熟的电力系统,无法很好地展开调查分析工作,该方面的研究一直没有什么突破。但随着电力慢慢成为一个国家能源的刚需,能源的大量短缺和市场的不断刷新都使得负荷预测受到了空前的关注。近几十年,国内外很多学者都致力于负荷预测方法的不断修正改进,取得了卓越的成绩。从总体而言,短期负荷预测的研究热度相比于中长期负荷预测的要更加高,超长期的研究更是比较缺少。从预测方法的更新顺序来说,预测方法大致有5个发展阶段[2]。
(1)经典预测方法。其是依据专家积累的经验或者变量之间的简单关系对数值进行预测。
(2)线性回归方法作为代表的传统统计预测时期。
(3)Box-Jenkins[3]提出了著名的时间序列预测方法。
(4)灰色预测方法和组合预测方法阶段,其中组合负荷预测更受国内重视。
(5)近段时间以神经网络和支持向量机作为代表的智能预测阶段。
1.3本文主要工作
短期负荷预测不仅对电力系统规划有着重大的影响,而且随着电力市场的逐渐发展,其经济效益也越来越凸显。因此一套符合实际情况且有效的预测系统是当下的研究重点。
本文将以给定的某个地区实际电力系统数据为依据,基于数据挖掘技术,结合其自然因素,如日最高最低温度、平均温度、相对湿度和降雨量等,建立出适合于该地区的电力系统的短期负荷预测模型。
2短期电力系统负荷预测
2.1短期电力负荷预测的概念及原理
电力负荷预测,是根据电力系统的运行模式,自然条件,社会特征等重要因素,在满足一定的精度要求下,推测出未来某特定时刻的负荷量。从狭义上讲,电力负荷[4]指的是某时刻或某时段为满足各种社会需求而监测到的产生的电功率的总值。但从广义而言,不同的发电部门实际转化得到的电能、供电部门配送的电量、居民或商业等消耗的电能都是电力负荷的组成部分。所以电力负荷预测在电力经济调度中发挥着重大的作用,也是能量管理系统(EMS)中的一个重要组成模块。电力负荷预测有不同的分类标准,其中按照时间可以划分为超短期、短期和中长期负荷预测。短期负荷预测,一般是对一年以内以日、周、月为周期的电力负荷预测,预测对象常常包含最低负荷、最高负荷或平均负荷等指标。
因为负荷预测是根据过去的负荷和现在已知的或者是可预知的相关影响因素推测出将来的负荷数值,于是需要基本原理指导预测工作。电力负荷预测的基本原理[5]如下。
(1)可知性原理
事物的发展具有一定的规律,人们知道过去和现在的情况,可以基于此预知未来的负荷数值,并且是客观存在并被认同的。这是预测工作的最基本原理。
(2)可能性原理
由于负荷同时受到内因与外因的共同影响,且内因与外因对其影响原理,影响程度等都存在不确定性,其未来的发展趋势也存在各种可能性,不同的方法也存在着不同的利弊,这些都导致了预测结果的多样性,即可能性。
(3)连续性原理
所谓预测即是对未来结果的预知,依据是历史和当前的数据,而从过去、现在发展到未来,这是一个延续的过程。事物在一系列的发展过程中会保留一定的自身特点,电力负荷也存在这一特性,一些负荷指标能以相似的变化趋势与变化率继续发展下去。因此,基于这种惯性,负荷预测工作得以顺利展开。
(4)相似性原理
尽管事物的发展是客观存在的,但不同的事物由于本质的相似性,发展结果也会延续一定的相似性。在实际的预测过程中,若预测对象现在所呈现的状态与另一事物已存在的过去的特征条件存在一定的相似之处,往往会以另一事物的发展规律作为预测待测对象的依据。例如,我们将为一个新的经济开发区预测用电负荷时,由于此地区建立时间尚短,无法提供足够且有效的历史数据来作为基础规划。此种情况下,利用预测的相似性原理,可以找到一个区域特征相似的已建成的经济开发区作为参考,其初期发展阶段的数据能用于预测工作。
(5)反馈性原理
将输出结果返回到输入端并利用系统的调节模块对结果进行矫正的过程叫做反馈。反馈的存在旨在于提高预测结果的精准性,有利于更好地调整预测方法。在实际的预测活动中,预测结果往往会与实际情况有所差距,利用这个差距,可以利用反馈调节来减小后期的预测差值。具体而言,在电力负荷预测中发现实际数据与推测到的数据有所出入时,认真分析产生差值的原因再调整控制系统中的输入或者某一环节,以期达到利用反馈调节提高预测精度的目的。实际上来讲,反馈过程体现了预测值与实际值的紧密联系,两者之间的差距可以通过修正逐渐缩小。
(6)系统性原理
预测对象不仅内部存在一定的关联性,其外部的各种影响因素也构成了一个外界系统,而一个完整的系统包含了内在与外在系统。关于预测这项工作,除了关注预测对象本身的动态变化,其他影响因素的作用也必须考虑。因此只有合理地统一内部与外部的关系,增强两者的紧密度,才能为决策者提供高质量的预测方案。
2.2短期电力负荷预测的步骤
电力负荷预测的一般步骤[6]如下。
1.制定负荷预测目标,确定负荷预测计划
进行负荷预测时会有一定的要求,首先需要结合要求和实际情况,制定一个合理的预测目标,并确定围绕目标展开的具体计划。其中目标的决定有以下两个关键因素。
(1)负荷预测精度的大小。安排预测计划时,首先要明确电力预测的分类,对应的预测精度大致要求是多少。实际情况中,短期负荷预测的预测结果误差一般要求在3%左右,若为中长期负荷预测,误差要求在10%以下。
(2)确定需要搜集的资料种类及数量。巨量的历史数据搜集起来十分复杂麻烦,因此按照预测对象及预测类型,来确定需要搜集的资料种类、资料数量、资料来源和搜集方法能使该步骤更加高效。例如进行短期电力负荷预测时,根据其定义,需要找到以日为周期的历史负荷数据和相关的变量数据。其中,历史资料项数的确定存在不同的说法。一部分人认为历史资料的时期数不能少于待预测的时期数,假设a=历史资料时期数,b=待预测时期推测数,应存在ab。这种观点也被指过低地估计了短期负荷预测项数和过高地估计了长期负荷预测项数。实际上,从短期负荷预测的角度来看,利用长期的历史数据预测短期,比基于短期历史资料进行的长期预测更加有说服力,因为其依据性更高。
2.搜寻和汇集资料并整理
因为负荷受多个因素影响,所以搜集资料时,除了历史负荷数据序列,还要搜集相关因素的过去的资料,如监测到的各种气象指标。选择资料的基本原则是相关度、可靠度和时间新旧度。“近大远小”是一般公认的数据挑选的原理,意思是越靠近负荷点的数据,参考的意义越大。搜集到的资料的品质对预测精度起着至关重要的作用。
搜寻和汇集资料后,还需要对资料进行审查与整理,使数据的价值更高,首先是添补缺失的数据和筛选出显然非正常数值。有时需要根据预测模型特点,对影响变量数值进行标准化、归一化处理。这里往往利用数据挖掘的相关手段来解决问题。如下,电力预测中常采用的整理经验方法简单的介绍一下。
(1)缺失值的弥补。假如缺失值的相邻两边有数据,往往取两者的平均值作为替代。假如缺失值的位置为序列的起始,则利用变化趋势比例计算出其近似值来代替。
(2)异常值的处理。为了确定数值是否异常,常借助散点图来判断,一般规定与附近数据波动范围超过20%的点存在异常。经过仔细的核查,确定为异常值后,简单的处理方法是直接剔除,将此项数据所有对应时间点的数值当作空缺。另一种处理规则是:若将历史数据设为,令,若,取;若,取。
(3)归一化处理。由于数据可能统计的量纲和规格不同,为了方便后续工作展开,预测时往往会统一量纲,最常见的方法是把该同一类型的数据序列中每项值除以最大值,将所有变量范围固定在[0,1]之间,其中最大数值1为量纲。
3.初步分析资料,明确影响因素
在整理完数据后,需要对数据进行更加详细的分析。对负荷值产生影响的数据种类繁多,每一类数据或多或少都与负荷值有一定的联系。这时通常利用统计学的方法,找出影响程度较强的几项因素作为自变量。自变量的选取质量也直接影响了最后预测结果的准确度。
4.确定预测模型,给出预测结果
众所周知,预测方法发展至今,已经越来越多样化与智能化。预测模型的选择,往往要依据预测对象的特征以及影响因素的数值特点综合考虑。不同的预测模型与方法,会产生不同的预测结果。因此,为了衡量出更适合的预测方法,一般采用多方案进行预测。最后分析每个方法的利弊,得到最终结论。
5.交付预测报告
一份完整的预测报告需要包含前面所提到的预测目标和计划、作为预测依据的历史资料、预测模型及方法以及最后的预测结果与改进等等。
6.负荷预测管理
负荷预测的要求不仅仅在于得到未来的预测数值,也在于日渐提高的预测精度。由于预测十分复杂且环境也处于动态变化中,预测结果会出现不理想的情况,因此,现代的负荷预测管理需要对数据进行不断完善,可能还要更改模型。这样使得负荷预测管理在不断优化与循环,预测系统也越来越强大。
2.3负荷预测方法
负荷预测方法一般划分为传统预测方法和现代的人工智能预测方法两大类。以下分别简单介绍一下各类中常见的负荷预测方法。
2.3.1传统预测方法
1.趋势外推法[7]
假若收集到一组周期为T的负荷数据,该序列存在一定的水平趋势,其对应的散点图图像为上下随机波动于一条水平直线。由于趋势变化呈现一定规律性,可以通过这组数据求取内插值和预测值的方法被称作趋势外推法。其中比较简单及常用的趋势外推法为一次滑动平均预测法,其与平均法相对比,优点在于遵循了预测原则—“重近远亲”。即根据数据的远近进行不同的加权,距离待测负荷值越近,给予的权重值越大,目的在于加强近期数据的影响,削弱远期数据的影响。一次滑动平均预测法是分配等权给临近的N期数据,其中N定义为跨度,其取值根据实际情况而变化,平滑作用会随着N的增大而增强,反之减弱。一次滑动平均法的预测公式为:
(式3.1)
其中t=N,N 1,T。一般存在一些异常的数值时,为能使异常值变得平滑,N会取得大一点。
2.回归分析法
按照影响因素个数划分,回归分析法可分为一元线性回归分析和多元线性回归分析,这两者是回归分析的基础。在此衍生而来了利用曲线函数进行预测的几种回归分析法,曲线一般包含双曲线、对数曲线、倒指数曲线、指数曲线、幂函数曲线和S型曲线。这六种方法的原理都是可以转化为回归分析的思想,因此,这里着重介绍一元和多元线性回归。
对一元线性回归而言,自变量的选择往往是可精确监控或预测的变量,例如时间,用x代表,因变量则是随自变量变化而变化的随机变量,例如电力负荷,用y代表。x与y的关系可以用式子表示为
(式3.2)
式中的是随机误差,它服从正态分布,a、b则是与x无依赖关系的未知参数。x与y的这样的关系就被叫做一元线性回归模型。为了检验确定的模型是否具有实用性,常用显著性检验、相关性检验和可决系数三种方法进行评估。多元与一元的区别在于,影响因变量的因素不仅仅只一个,这也更符合实际情况。多元回归也是基于一元回归分析的原理,但由于其计算更加复杂,往往利用计算机估计参数。
3.时间序列分析法
时间序列,即将过去的数据按照时间先后顺序排列得到的一组时间数列。时间序列分析法也就是利用统计到的数据编制出时间数列,分析研究出该数列的变化特点以及发展趋势,再基于事物客观发展的延续性进行类推延展,得到未来某一时刻或某一时段的可能的数值。由于其会受到意外因子产生的随机影响,合理地处理历史数据能有助于消除带来的波动性。
用数学语言来解释,假设有一个随变量t变动而变动的量,于处的监测值为