基于机器学习的网络多核心外围结构探测的分析与设计文献综述
2020-04-14 21:38:49
-
目的及意义
随着信息技术的迅猛发展、Internet应用的广泛普及以及人们社交生活的日益全球化,复杂网络逐渐成为倍受关注的研究领域。目前复杂网络的研究己经遍及计算机、物理、通讯、交通、生物、数学、化学、经济等领域[1],而对于这些极其复杂的交互作用网络的结构的认识已经成为二十一世纪的关键性研究课题与挑战之一。尽管不同领域具有不同特点,但研究者发现这些领域的许多实际网络具有一些共同性质,如小世界[2]、无标度[3]等。这些共同的网络特性吸引了越来越多不同学科的研究者致力于复杂网络的研究。一方面,通过对复杂网络这门学科的不断研究与探索使得我们对诸如社会学、自然科学以及信息科学等领域有了更加深刻和广泛的认知。另一方面,分析复杂网络模型也有助于我们从这些领域中认识到更多现象和规律。很多现实系统皆可抽象成网络模型,其中节点对应系统中的实体,边对应实体间的关系[4]。例如,蛋白质交互网络的节点对应蛋白质或基因,边代表蛋白质或基因间的调节关系;网的节点对应计算机或路由器等设备,边对应设备间的物理连接关系等[5]。网络模型可用于描述生活中的多种复杂关系和多种不同类型的中尺度结构,但是对于这种类型结构的探索主要集中在社团结构的研究与发现上,而另一种广泛存在的中尺度结构,即网络核多心-外围结构更值得学习和研究。而如何有效地识别网络核心-外围结构便成为了一个非常重要的问题,对于网络核心-外围结构的发掘将在社会、医疗、信息、金融等各个领域有着广泛的应用前景与研究价值[6]。
在早期的研究中,Borgatti和Everett提出了一个与具有理想化核心-外围结构的网络进行比较从而衡量实验结果的过程[7]。在他们的研究之后,许多核心外围检测算法得到了迅速发展。Rombach等人基于相同的想法并使用了更为灵活的模型[8]。Holme采取对比以往聚类系数所使用的方法来度量网络连通性[9]。Csermely等人提出了核心-外围结构的动态性研究方法[10],Silva等人利用中心性以及模块度的方法对新陈代谢网络的核心-外围结构进行了研究[11],Rossa等人通过随机游走的方法研究核心-外围结构[12]。使得人们对于诸多领域如社会学、国际关系以及经济学具有更加直观的理解。Snyder和Kick在基于贸易流和外交关系的国际关系网络中进行了实验,他们证实了所期望的块模型核心-外围结构在网络数据中是真实存在的[13]。而其他多个数据集,如国际贸易网络、学术刊物、人类社会学网络、猴群社交网络以及科学家之间的合作关系网络也普遍存在典型的核心-外围结构[14]。
在国际网络科学的推动下,我国网络科学从2000年起步,也迈过了十多年征程。为了纪念、总结和推动国内网络科学与工程的进一步发展,在张嗣赢院士的领导下,2010年我国《复杂系统与复杂性科学》杂志上专门出版了《网络科学专刊:共话我国网络科学—十年回眸与展望》,专刊与年美国《Science》的《复杂系统与复杂网络专辑》遥相呼应[15]。同时也涌现出大批优秀的科研团队与个人。例如,香港城市大学陈关荣小组,上海交通大学汪小帆小组,中科院郭雷院士、张嗣赢院士、程学旗小组,西安电子科技大学高琳、黄建斌小组,成都电子科技大学周涛小组,青岛理工大学张子柯小组,哈尔滨工业大学李建中小组等。因此,国内外对于复杂网络的网络模型已经有一定的研究,并且在不断地深化和提高之中,张其林等提出了一种具有无标度特性的核心-外围结构网络演化模型[16]。金弟等提出了基于随机游走的蚁群算法的复杂网络簇结构[17]。马小科等研究了复杂网络社团模型和算法在生物网络中的应用[18]。岳清唐等研究了利用核心-外围结构分析中国贸易结构、条件和国民经济结构[19]。
近年,机器学习(Machine Learning)成为学者们的研究热点,并开始用于复杂网络的网络结构分析,但相关工作仍然非常少。机器学习是通过从已有大量数据中不断自我学习和自我提升并优化性能的方法[20]。机器学习分类算法主要分为模型建立和分类两个过程,首先选定分类算法通过训练数据集训练模型参数得到一个分类模型,然后使用训练出的模型对未知待测样本数据进行打标签。根据人类学习的不同模式,人们提出了很多机器学习方法,如实例学习、观察和发现学习、神经网络和遗传算法等[21]。其中某些常用且较成熟的算法已被人们运用于实际的应用系统及智能计算机的设计和实现中。针对复杂网络的多核心外围结构探测的分析与设计,机器学习有望提供一个更准确且更新颖的方法。
探测复杂网络的多核心外围结构具有重要的实际意义。相比社团结构而言,多核心外围结构更能够直观地反映出网络的特点,对于多核心外围结构检测算法的研究和应用将在解决实际问题方面带来巨大的影响和提高。本文详细分析了研究复杂网络的多核心外围机构的实际意义,并且总结了国内外研究学者的相关成就,本文主要是在这些研究的基础上,对复杂网络模型的多核心-外围结构进行建模以及仿真设计。同时,近年,机器学习成为学者们的研究热点,并开始用于复杂网络的结构分析。在研究工作有章可循的基础上,本文将以机器学习为切入点,对复杂网络的多核心外围结构进行分析与设计,尝试用不同的方法对复杂网络进行核心-外围结构检测,对比和分析不同方法的有效性与局限性。
2. 研究的基本内容与方案
{title}2.研究的基本内容、目标、拟采用的技术方案及措施
1)本设计研究的基本内容包括:
-
熟悉机器学习的相关知识和方法
机器学习主要包括无监督分类和有监督分类。无监督分类主要用于聚类,即在不知道训练数据集的分类情况下,自动从数据集中寻找规则建立簇,相同簇中各数据之间的相似性相对比较高,而不同簇之间各数据之间的相似性相对较低,然后通过对各簇进行标记形成类别。主要分基于划分、层次、密度、网络和模型的五种聚类算法,目前常用的聚类方法主要有 K-means 算法、DBSCAN 等算法。有监督分类主要通过训练数据集构建分类模型,将未知数据打归类到已知类别中。常用的有监督分类算法主要包括支持向量机(SVM)、决策树(decision tree)、K-近邻算法、逻辑回归(Logistic Regression, LR)、朴素贝叶斯和 ANN 等算法。
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付