基于互信息的模型变量选择及建模算法研究与实现毕业论文
2022-05-24 21:29:05
论文总字数:20019字
摘 要
目前,随着经济技术的迅速发展,工业过程的规模越来越大、复杂程度也越来越高,整个过程包含几十个甚至上百个操作变量和操作条件,我们通过互信息选择出使某种评估标准最优的变量子集,这部分变量能在最大程度上反映原始数据信息,用以建立预测能力强,稳定和解释性好的数学模型,此外,传统的集中式建模技术已经不能满足工厂对生产高效益的要求,因此,基于互信息的分布式建模技术逐渐成为研究的新热点。
本文从实验角度出发,选取TE(Tennessee Eastman)化工过程作为研究对象。首先先引入互信息的概念,再深入了解工艺流程,根据互信息计算各变量间的互信息值,将复杂的大系统分解成几个小系统。然后,本文系统地研究了基于偏最小二乘的建模方法,采用此算法分别建立对应的子模型,最后根据两部分的共同作用确定各个子系统的输出,得出模型的最终输出形式。
关键词:互信息 分布式建模 偏最小二乘 TE过程 变量选择
The research and realization of modeling algorithm and model variable selection based on mutual information
Abstract
At present, with the rapid development of economic and technological, industrial process of increasingly large scale, complex degree is also getting higher and higher, the whole process consists of dozens or even hundreds of operating variables and operational conditions, we to select a subset of variables by mutual information, this part of the variables reflect the original data information to the maximum extent.The variables is to build the mathematical model which have strong prediction ability, stability .In addition, the traditional centralized modeling technology has been unable to meet the plant's requirements of high production efficiency, therefore,distributed modeling technology based on the mutual information has gradually become the new hot spot.
From the experimental point of view, the chemical process of TE (Eastman Tennessee) is selected as the research object .At first, the concept of mutual information is introduced, and then we understand the process further . According to mutual information the mutual information value of each variable is calculated , and the complex system is decomposed into several small systems.Then, this paper studied systematically modeling method based on partial least squares ,and corresponding sub models are established by using the algorithm. Finally, according to the two parts together determine the output of each subsystem, it is concluded that the model of the final output form.
Key Words: mutual information; distributed modeling; PLS; TE process;
variable selection
目录
摘要 I
Abstract II
第一章 绪论 1
1.1 引言 1
1.2 国内外研究现状综述 2
1.2.1研究背景与现状 2
1.2.2研究目的与工程应用价值 3
1.3 论文工作简述 4
第二章 关键技术介绍 6
2.1 引言 6
2.2 互信息理论 6
2.2.1 互信息定义 6
2.2.2互信息原理 6
2.3 偏最小二乘法 7
2.3.1 概述 7
2.3.2 建模原理 8
第三章 TE过程介绍及模型分析 9
3.1 引言 9
3.2 TE过程简述 9
3.2.1工艺流程 9
3.2.2 TE模型控制策略 11
3.3 本章小结 14
第四章 TE过程变量选择及分布式建模 15
4.1 引言 15
4.2 分布式建模步骤 15
4.3 变量选择 15
4.3.1 变量选择步骤 15
4.3.2 输入输出变量的确定 16
4.3.3 子系统变量确定 17
4.4 基于偏最小二乘的TE过程建模算法 19
4.5 本章小结 23
第五章 总结与展望 25
5.1 总结 25
5.2 展望 25
参考文献 27
致谢 29
第一章 绪论
1.1 引言
随着流程工业过程的复杂化程度越来越高,经济迅猛发展、资源短缺、原料价格的飞速上涨,以及企业之间激烈的市场竞争,企业追求生产效益最大化的愿望也更加激烈,这也促进了现代仪器的产生和计算机技术的进步。我们可以通过这些手段获得大量的数据,整个数据包含几十个甚至上百个操作变量和操作条件,所以需要选出一些与过程相关的变量,在变量选择中,如果一个变量含有与某一样本类别相关的有意义的信息,那么这个变量就称为这个样本类别的有信息变量,反之,则认为该变量为无信息变量(或干扰变量),而信息论中,互信息(mutual information)是定量计算两个随机变量间共有信息量的良好计算工具,因此,它被广泛认为是作为表示两个随机变量相关性的有效指标。此外,由于互信息能够计算任意随机变量间的数值,这使得它能够适用于复杂分类任务中信息量的估计,因为若使用基于线性关系,如相关系数的方法容易产生误差。而通过互信息进行变量选择,可以从原始数据的变量集合中选择出使某种评估标准最优的变量子集,这部分变量能在最大程度上反映原始数据信息,且对模型的贡献处于较高水平,通过变量选择,一些与目标值无关或者冗余的变量被删除,用简化的数据集建模,常常会得到更精确、更稳定的模型,也更具有可解释性。
随着建模理论的深入发展,集中式建模作为一种建模手段已不能满足工业生产要求,而更多地为分布式建模所取代,这就对传统的建模问题带来了新的挑战和要求。实际系统中大量而广泛存在的是复杂高维的大规模系统,其变量和约束的数目常常是几十个甚至是上百个,对于这样一类大规模的模型构建问题就显得尤为重要,若这种大复杂化工系统采用集中式建模的方法,这一方法难以保证很高的精度,并且计算复杂,如果将分布式建模技术应用到目前一些大复杂化工系统中,必定能够降低建模问题的复杂性,简化计算,提高精度,带来更高的经济效益。此外分布式建模在现实一些行业中得到了研究与应用,并取得了很好的效果。
请支付后下载全文,论文总字数:20019字