基于语义本体的城市垃圾危机知识库设计毕业论文
2020-04-08 12:37:08
摘 要
近年来,我国城市规模不断扩大,城市人口也迅速增长,如何解决城市垃圾危机成了城市规划和建设中的一个难题。我国关于城市垃圾危机管理的现有研究缺乏对城市垃圾危机数据的提取与挖掘,这使得城市垃圾危机管理难以实现深度探索,使得城市垃圾危机解决方案缺乏数据和知识支撑。本设计通过对国内众多垃圾焚烧“邻避”事件的研究,利用语义本体和知识库的概念,将城市垃圾危机术语、数据集等各类数据模型规范集成,使用本体开发工具设计城市垃圾危机所涉及的各项本体,构建一个“城市垃圾危机大数据”本体,通过推理机实现原始数据向知识本体的转化,能在一定程度上解决上述城市规划过程中的问题。本知识库的实现能提供对城市垃圾危机知识的智能解读,使得多维异构的城市垃圾危机数据规范且具有关联性,为城市垃圾危机管理研究提供新的思路,另外本设计对推动我国城市垃圾危机管理发展有积极促进作用。
关键词:本体,城市垃圾危机,邻避危机,知识库,知识元
Abstract
In recent years, the scale of cities in China has continuously expanded, and the urban population has also grown rapidly. How to solve the urban garbage crisis has become a problem in urban planning and construction. The existing research on urban garbage crisis management in our country lacks the extraction and excavation of urban garbage crisis data, which makes it difficult to achieve in-depth exploration of urban garbage crisis management, making the urban garbage crisis solution lack of data and knowledge support. Through the study of numerous "NOT IN MY BACK YARD" incidents of domestic waste incineration, this design uses the concepts of semantic ontology and knowledge base to integrate various data model specifications such as urban waste crisis terminology and data sets, and to design urban garbage crisis using ontology development tools. Ontologies involved in the construction of a "urban garbage crisis big data" ontology, The inference engine can realize the transformation from the original data to the ontology, which can solve the above problems in the urban planning process to some extent. The realization of this knowledge base can provide an intelligent interpretation of urban garbage crisis knowledge, make multi-dimensional and heterogeneous urban garbage crisis data standardized and relevant, and provide new ideas for research on urban garbage crisis management. In addition, this design promotes urban garbage in China. The development of crisis management has a positive promotion effect.
Key Words:Ontology; Urban garbage crisis; " NOT IN MY BACK YARD " crisis; Knowledge element; Knowledge element
目录
I
第1章 绪论 1
1.1研究目的及意义 1
1.1.1设计(论文)的目的 1
1.2.1 设计(论文)的意义 1
1.2 国内外研究文献综述 2
1.3 研究内容和方法 2
第2章 基本概念和理论 4
2.1本体的概念和理论 4
2.1.1 本体的概念 4
2.1.2 本体描述语言 4
2.1.3 OWL ——Web本体语言 5
2.2 知识元的概念和理论 5
2.2.1 知识元的概念 5
2.2.2 知识元的理论 5
第3章 城市垃圾危机知识库模型设计 7
3.1 城市垃圾危机知识元本体设计 7
3.1.1 危机案例元本体模型 7
3.1.2 城市垃圾危机本体模型 7
3.2 数据库设计 8
3.3 知识规则设计 9
3.3.1 知识规则定义 9
3.3.2 知识规则规范化 11
第4章 城市垃圾危机知识库构建 12
4.1 知识获取与抽取 12
4.1.1 知识获取 13
4.1.2 知识抽取 13
4.2 知识生成与表示 14
4.3 知识推理和应用 16
第5章 全文总结与研究展望 19
5.1 全文总结 19
5.2 创新点 19
5.3 研究展望 19
参考文献 20
致谢 21
第1章 绪论
1.1研究目的及意义
1.1.1设计(论文)的目的
近年来,我国城市规模不断扩大,城市人口也迅速增长,如何解决城市垃圾迅速增多和积累的问题成了城市规划和建设中的一个难题。尤其是垃圾焚烧场的建设导致的“邻避”事件日益频发,给我国的社会稳定和社会和谐带来了严重威胁。据不完全统计,自2016年4月以来,我国由于百姓反对而被迫中止的垃圾焚烧项目预计垃圾可处理量就已达3000吨/日[1],解决垃圾处理与百姓生活的矛盾问题迫在眉睫。此时,非常需要一个较为完备的系统,来帮助城市规划决策者及普通居民来对解决城市垃圾相关问题做出参考方案。
本设计是将传统的数据库(DB)技术和人工智能(AI)技术相结合的产物,旨在通过分析城市垃圾危机知识类、知识属性之间的属性关系,引入可信约束和逻辑约束,结合各类理论与方法,对UML/SysML概念模型及OWL本体描述语言进行模糊扩展,实现城市垃圾危机知识元的语义标注,建立知识元的类关系图。通过本体开发工具设计城市垃圾危机所涉及的致灾因子、孕灾环境、承灾体以及应急活动本体,通过推理机实现原始数据向知识本体的转化。本系统基于C/S模式,实现对城市垃圾危机知识的智能解读。
1.2.1 设计(论文)的意义
(1)理论意义
随着我国城市规模的不断扩大,城市垃圾的处理问题面临极大考验,如今城市垃圾危机的应对措施必须应用智能化思维,结合“互联网 ”,充分利用互联网的优化和集成作用。
本设计通过对国内众多垃圾焚烧 “邻避”事件的研究,利用语义本体和知识库的概念,将城市垃圾危机术语、数据集各类数据模型规范集成为一个“城市垃圾危机大数据”本体,使得多维异构的城市垃圾危机数据规范且具有关联性。
本设计对于城市垃圾危机的处理的解决思维,改变了传统的研究模式和服务方式,对进一步完善我国城市垃圾危机处理体系有着深刻意义。
(2)实际意义
第一,我国对于城市垃圾危机管理的现有研究缺乏对城市垃圾危机数据的提取与挖掘,这使得城市垃圾危机管理难以实现深度探索、问题揭示、原因剖析,使得城市垃圾危机解决方案缺乏数据和知识支撑。本设计能初步解决这一问题,实现城市垃圾危机知识元的语义标注,建立知识元的类关系图,为城市垃圾危机管理研究提供新的思路。
第二,本设计对推动我国将来的城市垃圾危机管理发展有积极促进作用。本设计建立城市垃圾危机转化的知识库,为城市垃圾危机转化管理提供数据和智力支撑,可以改变传统的城市垃圾危机转化研究方式,进而提供研究水平,为将来的研究提供持续的帮助。
1.2 国内外研究文献综述
当今世界处于一个知识经济时代,知识对于人和社会的价值逐渐凸显,它既可以作为一种战略性的资源,也是各类组织赖以生存和不断进步的源泉[1]。将传统载体上粒度较大的知识碎化成为粒度最小的知识单元,并以知识元作为基本单位对知识进行组织和集成,这对于知识的获取、传播和利用有着非常重要的意义。并且以知识元为基本单位进行知识的整体集成管理,可以建成各种类型的知识元库[2]。知识库作为一个存储、组织和处理知识以及提供知识服务的重要集合,它正逐渐成为各行各业进行知识管理和知识服务的基础。随着互联网技术的不断发展、知识管理的理念日渐成熟,国内外关于知识库建设方面的研究均取得了丰硕的成果[1]。
知识库与数据库最大的区别在于前者除了需要存储事实类数据外,还需对过程性、启发式数据进行处理与存储,并将知识灵活地运用到实际问题的分析与解决过程中[3]。
近年来,我国城市垃圾处理问题虽有所好转,但仍然会有不少垃圾焚烧场“邻避”事件等危机情况出现。例如在2009年,北京拟建造阿苏卫垃圾焚烧场,却因遭遇周边居民反对而不得不暂缓建设,五年后经过两次环评才再次启动项目,也仍然引起居民的担忧。如何应对城市垃圾危机,最主要的关注点一是处理技术,二是如何监管。目前,基于本体的知识库的研究在医学、航空航天、生物科技等领域均取得了丰富的成果[4],但对于城市垃圾危机的管理和应用方面仍有欠缺。鉴此,本课题将研究将基于语义本体的知识库应用到城市垃圾危机管理上,旨在实现对城市垃圾危机知识的智能解读,为城市垃圾危机管理研究提供新的思路。
1.3 研究内容和方法
本设计是建立一个城市垃圾危机知识库,将传统的数据库(DB)技术和人工智能(AI)技术相结合。将城市垃圾危机术语、数据集各类数据模型规范集成为一个“城市垃圾危机大数据”本体。
本文首先由Python编写网络爬虫,在网络平台搜集关于城市垃圾危机的相关知识文本,再将获取的文本通过分词得到关键词并进行词性标注,利用Protégé平台构建领域模型和知识本体,最终得到可以进行知识推理的城市垃圾危机知识库。
技术路线如图1.1所示。
图1.1 技术路线图
第2章 基本概念和理论
2.1本体的概念和理论
2.1.1 本体的概念
本体这一概念最早出自于哲学,客观存在的实体及实体间的关系是本体的主要研究内容,本体可以深入的解释说明相对应的应用领域的概念,可以在指定的应用领域中,使某个具体概念的理解被更多客体接受,本体最终的目的是对某概念进行有效沟通和理解[5]。
到了20 世纪 90 年代,人工智能、知识工程和图书情报等领域成为热门领域,本体概念也被引入其中,并且一度成为这些领域的热门研究课题[6]。当时美国的研究人员把本体概念定义为,解释领域构成的词汇术语,能够表达领域中存在的联系,同时可以通过这些术语以及所反映的关系延生本体概念以及其规则[7]。
从哲学意义上讲,我们可以将本体论称为一种特定的类别系统,用以解释世界的某种看法,因此,这个系统不依赖于某种特定的语言。另一方面,本体论在人工智能中最普遍的用法指的是一种“人造物”,由用于描述某种现实的特定词汇构成,以及一套关于词汇词的预期含义的明确假设[16]。
目前与本体论相关的研究有很多,且逐渐成熟,现在提到的本体概念与最早哲学提出的本体论已经没有很密切的联系[5]。不过近十多年来,关于“本体到底是什么”的问题在信息系统领域仍然存在争议。学术界关于本体定义一直没有定论,但各领域关于本体存在基本的共识,即本体的五大特征为: 形式化、概念化、可共享、明确、描述领域知识[6]。
本体的涵义在信息技术领域中多体现以下两个方面:
(1)作为表示性的词汇,一般出现在指定的主题或者是领域中。
(2)作为表示性的词汇对指定领域进行描述的概念化语言[5]。
2.1.2 本体描述语言
本体需要用事先规定的语言对其进行描述或表示。在本体研究领域中,存在众多具有不同特点的本体描述语言[6]。在本文的研究中,主要使用OWL——一种基于Web的本体描述语言。
这类语言除了OWL还主要有 XOL、RDFS、SHOE、OIL、DAML OIL。其中XOL 是基于XML 的本体交换语言,SHOE 是简单 HTML 本体的扩展。RDFS、OIL、DAML OIL 和 OWL 都是基于 RDF 的进一步扩充 [6]。
2.1.3 OWL ——Web本体语言
目前网络上的信息呈几何级数爆炸增加,但非常缺乏合理组织和整合,人们难以充分利用这些资源。传统使用网络信息资源的方式主要是搜索关键词,这样的方式存在不少缺点,包括需要人工干预、查询效率低下,不易选取适当的关键字,返回无关信息[10]等等。
另外仅仅通过关键词搜索出现的一词多义或一义多词现象计算机无法主动处理,因此必须存在一种机器可以直接处理的语言,在这种需求下,本体描述语言OWL应运而生。OWL是W3C推出的一种Web本体描述语言,它以DAML OIL作为发展基础,是一种严格的逻辑描述语言[11]。
2.2 知识元的概念和理论
2.2.1 知识元的概念
长期以来,人们对于知识的归纳、控制、管理一直停留在文献级别,但信息时代的来临,人们对知识的需求达到了更高的要求,追求更加细致,更加精确的知识,希望得到粒度尽量小的知识。于是在研究中需要引入知识元的概念,将知识管理达到知识元的级别。
美国的Volodymyr在20世纪70年代后期提出了关于知识元概念最早的定义,即知识的控制单位将从文献深入到其中的数据、公式、事实、结论等最小的独立的“数据元” [9]。
1984年,我国科学计量学开创者赵红州最早提出了“知识单元”的概念,并将它定义为“能够用数学公式表示的科学概念” [8]。国内知识元相关研究的开端可以认为是朱晓芸等学者在1993年提出的“原子知识元”概念 [9]。
目前学术界对于知识元的定义还没有明确统一,由于缺乏关于知识元特征和属性的描述,它仍是一个不确定的概念,虽然各领域普遍认同知识元是不能被分割的最小的独立知识单位,但已有的研究对“最小”的程度没有明确的描述[9]。
如今各学科和研究领域在逐渐深入研究的过程中,也在不断引入知识元的概念,在数字图书馆领域,知识科学与知识工程领域,知识挖掘与知识发现领域和知识管理领域等,许多学者都提出了自己的见解和应用[8]。
2.2.2 知识元的理论
众学者关于知识元的理论有各种不同的主张。赵红洲认为,知识元就是粒子化了的科学概念[8],并认为“创造过程乃是知识元的重组过程,乃是新知识元的创生过程。”[18]刘则渊认为,在一定条件下,某个关键的知识元可以决定特定领域知识的进化与突变[8]。
温有奎将知识元分为描述型和过程型[19]。廖开际认为知识元分为事实型、任务型和主体型[21]这三类。张静则认为知识元可以分为概念、方法、原理、事实和陈述 [20]这几个大类。
现阶段国内关于知识元的研究还在探索阶段,包括涉及知识元标引、知识抽取在内的许多方面的技术还缺乏成熟的理论依据支撑。我国关于知识元的研究在应急管理、数字图书馆等领域已经取得一定的成果,但针对以上领域情景库的研究仍然不够成熟和充分 [9]。
第3章 城市垃圾危机知识库模型设计
3.1 城市垃圾危机知识元本体设计
如前文所述,城市垃圾危机发生情况的种类众多,成因复杂,涉及范围广,所以城市垃圾危机知识所包含的概念、属性、实例规模庞大,关系复杂。因此本文利用本体来表示核心概念及其关系。
3.1.1 危机案例元本体模型
为了能更好描述城市垃圾危机案例,将城市垃圾危机知识的概念及其之间的关系按图3.1所示表示。
图3.1 城市垃圾危机案例本体概念模型关系图
如图3.1中所示,隐患表示在某一个危机事故案例中,事故发生前已经存在的危机隐患,成因表示导致该危机发生的直接原因。人员表示在该案例中涉及到的各方人员,包括处理方和受影响的一方。后果即该危机发生之后该危机事故造成的各项后果,解决办法指针对该危机事故采取的各项解决方案,以及通过本次危机对之前存在隐患的排查。于是可以将一个事故案例表示为一个向量:C=(H,R,P,L,R,S),依次表示上述隐患、成因、人员、地点、后果和解决办法。
3.1.2 城市垃圾危机本体模型
本设计使用Protégé来实现城市垃圾危机本体知识库的构建,实现类和属性的添加。Protégé是斯坦福大学医学院生物信息研究中心基于Java开发的一个本体开发工具,也是一个基于知识的本体编辑器。
本设计可以根据获取的城市垃圾危机关键词表,根据以上构建的本体概念关系模型,使用Protégé构建各项本体类及其属性,Protégé允许用户只在概念层次上进行领域本体模型的构建。构建结果举例如图3.2,3.3所示:
以上是毕业论文大纲或资料介绍,该课题完整毕业论文、开题报告、任务书、程序设计、图纸设计等资料请添加微信获取,微信号:bysjorg。
相关图片展示: