基于贝叶斯的机器学习系统设计文献综述
2020-05-01 08:46:59
1、研究背景及意义 在网络计算环境下,数据已成为各应用领域的重要资源,其中有可能蕴藏着许多前所未知的可贵信息或有用知识,这些信息或知识可能提供或预示重要的商机、关键的技术改进和有意义的科学发现等,可能产生显著的社会经济效益。
因此如何更为有效地分析和挖掘这些广域分布的海量数据,获取新的科学知识、规律和决策支持信息,并加以利用,已成为当今社会所面临的、具有战略决策意义的问题。
而机器学习和数据挖掘的产生和发展为上述问题的解决提供了有效的实现途径。
由于知识发现是一个交互的、循环往复的整体过程,因此普遍观点认为数据挖掘是这一过程,即机器学习的核心环节。
近年来数据库、人工智能、统计学、决策科学等方面的研究都结合进来了,使得机器学习领域不断发展与进一步融合。
知识可以划分为确定性知识和不确定性知识两大类:数学公式、经典逻辑推理规则等特定问题能给出确定解答的知识被认为是确定性知识;而模糊规则、概率规则等对于特定问题不能给出确定解答,但能给出指导性意见的知识,被认为是不确定性知识。
研究概率依赖关系与因果关系发现就是一种不确定性知识发现,通常以条件独立、条件概率等形式表现出来。
目前,在人工智能的研究中,核心问题之一就是如何表达已有知识以及如何应用已有知识进行分析处理或推理,已得到新的知识。
其中,尤以不确定性知识表达和推理最为重要,也十分困难。
不确定知识表达可以分为两大类:一类是基于概率的方法,包括贝叶斯网、马尔科夫网等;另一类非概率方法,包括模糊逻辑、证据理论等。