基于代表点的增量式聚类算法开题报告
2022-01-14 22:01:30
全文总字数:1406字
1. 研究目的与意义及国内外研究现状
随着互联网信息量的迅速增长,大多数的聚类算法只能处理静态数据,这就意味着在运行聚类算法之前,必须输入完整的数据,当聚类算法运行时,无法向该算法添加任何新的数据。
然而,在大多数情况下,信息随时都会出现,如果将原始数据和新的数据一起使用来构建新的聚类模型会浪费很多时间,并且没有使用已经从原始数据中获得的知识。
因此,增量聚类算法非常适合动态环境和非常大的数据集。
2. 研究的基本内容
总结常见的聚类算法,建立增量数据在聚类中目标函数的表示方法,利用类别中的特征点信息表示聚类的历史信息,实现对增量数据的类别标记任务,并与一般的聚类算法和批处理式的增量式算法进行对比实验,验证方法的可行性。
3. 实施方案、进度安排及预期效果
2019年1月到2月:通过查阅各方面资料,分析和整理,规划出该论文算法实现的大致进度流程,并完成开题报告,外文翻译等论文的前期工作;2019年2月到4月:总结常用的聚类算法,建立增量数据在聚类中目标函数的表示方法,利用类别中的特征点信息表示聚类的历史信息,实现对增量数据的类别标记任务。
2019年4月到5月:基本完成算法的实现以及对比实验,验证方法的可行性。
4. 参考文献
[1] 陈爱国, 王士同. 基于多代表点的大规模数据模糊聚类 算法[j]. 控制与决策, 2016, 31(12): 2122-2130.
[2] 伍育红.聚类算法综述[j]. 计算机科学, 2015, 42(6a): 491-499.
[3] 孟凡荣,李晓翠,周 勇. 一种基于代表点的增量聚类算法[j]. 计算机应用研究, 2013, 29(8): 2 865-2 867
最新文档
- 华北地区夏季降水多年、少年近地层水汽场及风场分布特征开题报告
- 天山地区典型流域降雪分布研究文献综述
- 2016年台风狮子山路径突变原因的初步分析开题报告
- 北京和寿县地区边界层急流观测与模型的对比文献综述
- 具有双Kelvin波结构MJO活动的再分析开题报告
- 基于单片机的温控风扇设计文献综述
- 1961-2015年江苏省气候资源的时空分布规律开题报告
- 智能搬运机器人文献综述
- 基于类型的电影推荐系统文献综述
- Bi6S2O15的合成及其降解有机污染的研究开题报告
- 不确定时滞奇异摄动系统的鲁棒控制器设计文献综述
- 小型双模SIW滤波器的研究与设计开题报告
- 我国绿色出行政策执行研究——以南京市为例文献综述
- 试论李碧华小说中的爱情悲剧开题报告
- 基于FPGA的电子相册设计文献综述