登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 理工学类 > 电气工程及其自动化 > 正文

基于数据挖掘的风力发电机叶片结冰预测系统设计毕业论文

 2021-04-05 10:38:40  

摘 要

风电行业的发展开始于1973年的石油危机,20世纪80年代开始建立示范风电场,成为电网新能源。在过去的20多年里,风电发展一直保持着世界增长最快的能源地位,风力发电技术日益成熟。但是在一些寒冷地区风力发电机会出现叶片结冰的情况。叶片结冰对机构中的风电设备的影响展现在很多方面。例如风力发电机三个叶片上的覆冰程度不同会加大发电机组的不平衡负荷,在这种情况下运行风力机会导致发电机的转换效率降低,严重时甚至会导致风力机停机。而且如果叶片结冰的持续时间很长,会使得发电量有很大程度上的损耗,这也就带来了很大的经济损失。那么如何及时预测风力发电机叶片结冰也就成为了一个重要的研究方向。

本文首先对风力发电机叶片结冰的国内外研究现状进行综述,对于数据挖掘的概念进行介绍,分析数据挖掘各种经典算法的原理及优缺点。在数据挖掘中对于数据的分析方法有很多,包括分类、回归分析、聚类、神经网络等。叶片是否结冰则采用分类方法来实现学习与预测,分类是将目标对象根据其特征区分开来,分类想要达到的效果是将来自数据库的数据项映射到某个给定的类别中。本文采用基于决策树boosting的XgBoost算法进行分类预测。本预测系统先进行数据处理,将数据中各特征进行相关性分析找出相关性最高的特征,在利用数据清洗方法处理数据中的缺失值、离散值。之后取出正常时间段和故障时间段对应的数据形成特征矩阵和相应预测目标值。接下来建立决策树模型,导入Xg Boost模块,使用80%的数据对模型进行训练,用20%的数据对模型进行5折交叉验证,最后通过绘制Roc曲线以及拟出的准确率,召回率,F值表格来评估模型的准确性。

关键词:风力发电机叶片结冰、预测、数据挖掘、python、SVM、XG BOOST

Abstratc

The development of the wind power industry began in the oil crisis of 1973. In the 1980s, demonstration wind farms were set up to become new energy sources for the power grid. In the past 20 years, the development of wind power has maintained the world's fastest growing energy status, wind power technology is increasingly mature. But in some cold areas, wind turbines can freeze their blades. The effects of blade icing on wind power equipment in the mechanism are shown in many ways. For example, the different degree of icing on the three blades will increase the unbalanced load of the generator set. In this case, the operation of the wind turbine will reduce the conversion efficiency of the generator, and even lead to the shutdown of the wind turbine in severe cases. If the blade freezes for a long time, the power generation will be largely lost in this case, which will bring about a great economic loss. Therefore, how to timely predict the icing of wind turbine blades has become an important research direction.

This paper first summarizes the research status of wind turbine blade icing at home and abroad, introduces the concept of data mining, and analyzes the principles, advantages and disadvantages of various classical data mining algorithms. There are many data analysis methods in data mining, including classification, regression analysis, clustering, neural network, etc. Whether the leaves freeze or not is predicted by classification method. Classification is to distinguish the target objects according to their characteristics. The effect of classification is to map the data items from the database to a given category. In this paper, based on the decision tree of boosting XgBoost classified prediction algorithm. In this prediction system, data processing is carried out first, and correlation analysis of each feature in the data is carried out to find out the features with the highest correlation. Missing values and discrete values in the data are processed by data cleaning method. After that, the data corresponding to the normal time period and the failure time period are taken out to form the characteristic matrix and the corresponding prediction target value. Next, the decision tree model was established, the Xg Boost module was imported, the model was trained with 80% of the data, and the model was cross-verified with 20% of the data. Finally, the accuracy of the model was evaluated by drawing Roc curve and the accuracy rate, recall rate and f-value table.

Key Words:Wind turbine blade icing、 prediction、data mining、python、SVM、 XG BOOST

目 录

摘 要 1

Abstratc 2

第1章 绪论 1

1.1研究背景 1

1.2研究目的与意义 1

1.3国内外研究现状 2

1.4 本文研究内容 3

第2章 研究方法及相关理论 4

2.1数据挖掘 4

2.1.1数据挖掘及发展过程 4

2.1.2数据挖掘基本结构与一般步骤 4

2.1.3数据挖掘经典算法 5

2.2设计内容与方法 6

2.2.1设计内容目标 6

2.2.2 XG BOOST 相关介绍 6

2.2.3 设计方法及执行流程图 8

第3章 数据处理及特征工程 9

3.1数据来源及说明 9

3.2特征工程 10

3.2.1数据分析 10

3.2.2数据处理 13

第4章 风力发电机叶片结冰预测系统仿真与检验 16

4.1准确率、召回率、F值 16

4.2建模过程 16

4.3风力发电机叶片结冰预测结果 21

第5章 总结 25

参考文献 26

致谢 27

第1章 绪论

1.1研究背景

本论文是基于数据挖掘预测风力发电机叶片结冰的设计。在现在这个数据化的时代,数据随处可见,在工厂中随着传感器的布点的增加,数据的获取也变得容易起来,从各个类型的设备收集到的工况数据也越来越多,也就形成了大量的工业数据。大数据已经应用于很多领域,数据获取的途径也是越来越多,可以来自公司的数据管理系统、来自机械内的存储数据也有来自外界的数据。数据管理系统应用于工业自动化控制与信息化系统。例如在工业生产行业,如果对于大数据的使用恰当,完全可以使其成本得到满意的价格。

工业大数据也有着自己的特点,其中最为关键的就是可以用来直观的分析的数据并没有很多;一般工业的流水都是按照已有的模式工作,对于扰动以及各个方面的干扰因素会想办法避免其干扰,这也就是故障数据少的原因。特别是在分析故障原因和产品成品率出现问题的时候,样本的偏差程度很高。虽然可以特殊的进行故障实验,但是在很多情况下这样的试验所需的成本是不能够实现的,要拿出很多故障样本也是不现实的。这也正是工业大数据所需要解决的问题。当然对于工业数据的利用还是很普遍的也给人们带来了很多好处。例如我们要做的风力发电机叶片结冰预测系统,风机结冰就可以被预测,人们就可以降低其造成的危害。

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图