基于工业大数据的多源信息融合与故障诊断毕业论文
2022-01-08 21:49:06
论文总字数:29597字
摘 要
本文以工业大数据的多源信息融合与故障诊断作为背景,以风机叶片结冰故障与分析作为实例,对所提供的数据进行分析,对冬季寒冷地带的风机工况进行了有效的预测。
本文首先进行数据预处理,所获训练数据中数据缺失现象、数据不连续现象以及数据不平衡现象严重,通过数据清洗、下采样等方式完成了对数据初步的处理;之后进行特征工程,通过结冰对风机叶片影响的物理模型以及对所获数据的分析提取有效特征;再次是模型建立,本课题是一个很明显的时间序列问题,所以使用长短期记忆(LSTM)网络作为其基础模型,由于卷积神经网络(CNN)在处理序列问题以及特征提取方面的良好表现,综合构建CNN-LSTM联合神经网络;最后由于单CNN-LSTM联合神经网络训练时间较长,且在预测长时间工况仍会出现正确率达不到100%的情况,并且无法进行数据融合,故使用集成学习Stacking的方法进行特征融合,并与其他算法作对比,进一步验证了本算法的高精确度与高鲁棒性。
关键词:数据预处理 神经网络 特征融合 集成学习
Multi-source information fusion and fault diagnosis based on industrial big data
Abstract
This paper takes the multi-source information fusion and fault diagnosis of industrial big data as the background, and takes the wind turbine blade icing failure and analysis as an example to analyze the data provided and effectively predicts the fan operating conditions in the cold winter zone.
The first step is preprocessing the original data. The missing data, discontinuous data, and unbalanced data in the training data are serious. After the preliminary data processing is completed through data cleaning and downsampling. After that, feature engineering is carried out to extract effective features through the physical model of the effect of icing on the fan blades and the analysis of the obtained data. Then the step is model establishment. This subject is a very obvious time series problem, so long-term and short-term memory network (LSTM)is used as its basic model. Due to the good performance of convolutional neural network (CNN) in processing sequence problems and feature extraction, a CNN-LSTM neural network was constructed. Because the training time of the single CNN-LSTM joint neural network is long, and the prediction rate will still be less than 100% in the long-term working conditions, and data fusion cannot be performed, the ensemble learning Stacking method is used Feature fusion. Compared with other algorithms, it further verifies the high accuracy and high robustness of this algorithm.
Key Words: Data preprocessing; Neural network; Feature fusion; Ensemble learning
目 录
摘要 I
ABSTRACT II
第一章 引言 1
1.1 研究背景1
1.2 研究现状1
1.3风机叶片结冰预测及诊断现状3
1.4本文的主要工作4
第二章 机器学习与算法5
2.1机器学习概述5
2.1.1基本概念5
2.1.2三要素5
2.1.2模型评估与泛化能力8
第三章 数据预处理9
3.1数据分析9
3.2数据处理10
3.2.1基于BalanceCascade算法的数据下采样11
3.2.2特征工程11
3.3 数据标准化17
3.3.1最大-最小标准化17
3.3.2 Z-score标准化17
第四章 基于CNN-LSTM的故障诊断与预测模型19
4.1 模型概述19
4.2神经网络模型与激活函数19
4.3训练子集构建21
4.4卷积神经网络(CNN)22
4.5长短期记忆(LSTM)算法23
4.6 CNN-LSTM训练子模型24
4.7 批标准化25
第五章 基于集成学习的特征融合模型27
5.1基于集成学习的特征融合算法27
5.1.1 基础模型构建27
5.1.2 二级模型构建29
5.2 基于Stacking算法的特征融合模型29
5.3 算法比较30
第六章 结论与展望33
6.1 全文总结33
6.2 系统评价33
6.3 展望34
参考文献35
致谢37
附录1:模型代码(Python)38
附录2:训练过程44
第一章 引言
1.1研究背景
近年来,随着国家对工业发展的大力支持与推动,我国整体的工业水平在不断地稳步提升,在国务院印发的《中国制造2025》当中,也提出了对于目前中国工业制造的五大要求。在此过程中,人们逐步发现对于工业过程状态变量的监测,故障分析及诊断等技术是保障工业生产安全。同时,随着计算机的发展以及大数据时代的到来,之后将面对的是从一维到三维,甚至更高维度的数据、将面对线上和线下、历史和实时等等数据,如何对这些数据进行合理利用也成了人们讨论的话题;机器学习的快速发展也为更高层次的精准性和时效性的工业过程的监测与故障诊断创造了可能性[1-3]。
本项目将在风机结冰故障分析的基础上,挖掘SCADA系统产生的风机运行大数据环境,提取风机运行时不同状态下的特征参数,进行数据融合,通过建立机器学习模型,从而对叶片当前工作状态能够进行判断,从而能够及时发现故障并进行维修,提高风机的运行效率及延长寿命。
请支付后下载全文,论文总字数:29597字