基于空间分布的数据线性可分离性判定方法研究开题报告
2022-01-13 21:49:00
全文总字数:4229字
1. 研究目的与意义及国内外研究现状
线性可分问题是模式识别中的一个基本问题。目前,线性可分问题的研究还存在一些缺陷:一、时间复杂度通常很高,特别是对于高维数据集。二、这些方法主要是基于理想的两类数据集设计的,然而在实际应用中,数据集的空间分布要复杂得多,这直接限制了现有方法的实用性。
鉴于已有算法的缺陷难以改进,本课题提出了一种基于空间几何计算的自适应线性可分判定方法,为线性可分问题的解决提出了一条新的技术方向。首先,本课题重点研究了空间分布的区域数据集的线性可分性,而不是传统的两个数据集之间的线性可分问题。这可以反映实际数据的空间分布,这对模式分类中的应用更有帮助。其次,基于空间几何理论,本课题证明并设计了一种区域数据集线性可分性的自适应构造方法。最后,设计了相应的线性可分算法并进行了一些模拟验证实验。实验结果表明了该方法的正确性和有效性。
2. 研究的基本内容
传统上,人们往往是基于两类数据集(空间上,分属两个区域)来推导和设计线性可分方法。事实上,实际应用中的数据集在空间分布上要复杂的多,单从两类数据集来看,它们可能是线性不可分的;但从空间区域分布来看,每个区域数据子集都可能是线性可分离的。这种分布上的复杂性表明:讨论“空间分布层面上的区域数据集相对于其他数据集的线性可分离性”比“类别层面上数据集之间的线性可分性”更合理,也更有意义。因此,为了更加透彻的研究线性可分问题的相关理论,本文从数据空间分布的角度,提出了一种基于空间几何计算的自适应线性可分判定方法,希望得到更好的分类效率。本文的研究内容如下:
3. 实施方案、进度安排及预期效果
1、2019.1~2019.2 查阅中英文论文资料,对现有的算法做大致了解。
2、2019.3拟定论文提纲,列出论文所涉及的各种实验清单。
4. 参考文献
[1]rosenblatt, f.: the perceptron: a probabilistic model for information storage and organization in the brain. psychological review 65(6), 386-408 (1958).
[2]minsky,m. l.,papert,s.: perceptrons:anintroduction tocomputationalgeometry. perceptrons: an introduction to computational geometry. the mit press (1969).