江苏省环境治理分析研究
2023-06-15 16:04:00
论文总字数:12695字
摘 要
本文通过对两个星期的江苏省各城市空气质量指数(AQI)的数据进行分析。探讨在这十四天之内江苏省各城市的空气质量指数的变化趋势,并对它们进行聚类分析。按照空气质量指数这一标准将各城市进行分类,对比分析系统聚类以及K-均值聚类的结果。结合两会精神给出环境治理的若干建议。关键词:空气质量指数(AQI),聚类分析,对比分析
Abstract: Based on the two weeks of date of the Air Quality Index (AQI) in Jiangsu Province, this paper investigates the trends in air quality index in Jiangsu Province cities within fourteen days of this by cluster analysis. Then classify each city according to Air Quality Index by hierarchical clustering and K-means clustering. Combined with the spirit of two sessions, this paper gives recommendations about environmental governance.
Keywords:air quality index (AQI), cluster analysis, comparative analysis
目 录
1 引言 3
2 预备知识与数据的选取 4
2.1 聚类分析 4
2.2 样本数据的选择 5
3 数据的实证分析 6
3.1 均值处理 6
3.2 聚类分析 7
3.3 聚类分析对比及分析 10
结 论 14
参考文献 15
致 谢 16
附录1 17
附录2 18
1 引言
一个国家或地区在工业布局不完善、能源结构不合理、日常空气环境治理不足和应对突发天气应急预案缺位情况下发生的大气污染现象,我们称之为污染。在江苏省范围内,2013年入秋以来南京等地多次遭遇雾霾天气,空气质量出现“极重污染”或“危险”级别。阳光被有毒空气遮蔽了,能见度低于200米,“厚德载雾,自强不吸”这一新鲜词汇应运而生。在2014年地方两会上,雾霾治理被频繁的提到,全国各地纷纷开始了雾霾治理的工作。
雾霾主要是由空气中悬浮的大量微粒和气象条件共同作用造成的,其形成原因主要有三:一、水平方向静风现象的增多。静风现象的增多,对大气中悬浮颗粒物的扩散与稀释不利;二、垂直方向出现逆温。逆温层覆盖在城市的上空,使得低空的气温低于高空的气温,大气层低空的空气的垂直运动受到限制,空气中悬浮颗粒物难以向高空飘散而停滞在近地面;三、空气中悬浮颗粒的增加。工业的发展、机动车辆的增加、污染排放物的增加,导致了能见度的降低。
雾霾具有严重的灾害性,对交通系统、供电系统、农作物的生长等均有重要影响。不仅如此,雾霾对我们人类的呼吸道的危害也是十分大的。空气中的一些病原体会引发头痛,严重的还会诱发高血压、脑溢血等诸多疾病。
党的十八大报告指出:要把生态文明建设放在突出地位,融入经济建设,政治建设,文化建设,社会建设各方面和全过程,努力建设美丽中国,实现中华民族的永续发展。这是我们站在新的时代起点上对全国人民作出的庄严承诺。
本文通过对比系统聚类与K—均值聚类这两种聚类方法来对我省13个城市按照污染程度进行分类。旨在找出更合理的聚类方法给各城市分类。有利于相关部门制定有效的策略针对不同污染等级的城市进行不同程度的治理。这样不仅可以节省治理费用,还能够快速有效的建设出一个山清水秀的“美丽中国”。
2 预备知识与数据的选取
2.1 聚类分析
聚类分析将个体或者对象进行分类,使得同一类中的对象之间的相似性比其他类的相似性更强。目的在于使类间对象的同质性最大化和类与类间对象的差异性最大化,聚类分析是统计学中用以研究“物以类聚”问题的多元统计方法。
聚类分析不仅可以用来对样品进行分类(Q型聚类分析),也可以用来对变量进行分类(R型聚类分析)。本文采用的是Q型聚类分析。在一些社会、经济问题中,我们面临的研究对象往往比较复杂,如果能把相似的样品(或指标)归成类,那么处理起来相对方便,聚类分析的目的就是将相似的对象归为一类。
2.1.1 系统聚类
系统聚类又有凝聚方式聚类和分解方式聚类两种,SPSS中的系统聚类采用的是凝聚方式,其过程是:
1:计算个样品两两间的距离,记作;
2:构造个类,每个类只包含一个样品;
3:合并距离最近的两类为一个新类;
4:计算新类与当前各类的距离;
5:画聚类图;
6:决定分类个数和类。
兰斯和威廉姆斯在1967年针对系统聚类法给出了统一的公式:
其中,,,,对于不同的聚类方法有不同的取值,常用有最短距离法、中间距离法、重心法。如下表所示:
方法 | ||||
最短距离法 | 1/2 | 1/2 | 0 | -1/2 |
中间距离法 | 1/2 | 1/2 | -1/4 | 0 |
重心法 | / | / | - | 0 |
本文采用中间距离法。
2.1.2 K—均值法
K—均值法又称快速聚类法,它将数据看成k维空间上的点,以距离作为测度个体“亲疏程度”的指标,并以牺牲多个解为代价换得高的执行效率。麦克奎因(Macqueen)于1967年提出该方法。该方法的思想是把每个样品聚集到其近形心类中去,其过程是:
1:把样品粗略分成K个初始类;
2:进行修改,逐个分派样品到其最近均值的类中去(通常用标准化数据或非标准化数据计算欧式距离)。重新计算接受新样品的类和失去样品的类的形心(均值);
3:重复第二步,直到各类无元素进出。
剩余内容已隐藏,请支付后下载全文,论文总字数:12695字