基于K中心点的聚类算法及其应用研究开题报告
2022-10-30 09:39:24
1. 研究目的与意义
网络科技技术的快速发展,电子商务成为当今热门话题,同时也产生并积累了大量数据,大数据就是这个时代的产物,大数据时代已然到来。
大数据的出现使人们越来越重视数据的价值,但同时也无形间增加了处理整合这些数据的难点。
通过大数据分析并发现它们所需的模型来帮助预测和预防未来运行中断和性能问题。
2. 课题关键问题和重难点
关键问题: 1、提出面向大数据的新聚类算法,建立数学模型;2、将各模型理念进行编程实现,便于算例验证,应用分析;3、将收集的案例基础数据,代入理论模型,得出相应结论。
难点:本文的难点在于数学模型的建立并通过编程实现。
作为一名经济管理类电子商务的本科生,平时不会遇到需要数学建模的问题,对计算机的运用能力更是捉襟见肘,由于需要进行编程实现,需要在课余花费大量时间进行自主学习研究探索,不断测试调试,最终才能完成算法的编程。
3. 国内外研究现状(文献综述)
1.聚类算法综述(1)聚类算法的产生聚类分析起源于分类学,也称群分析,通过对某样指标进行分类的一种多元统计分析的方法。
一开始人们依靠经验将事件的集合分为若干个子集。
由于科技的发展,人们将数学工具引入到分类学中,聚类算法便随之细化的归入数值分类学领域。
4. 研究方案
通过借鉴聚类分析研究中的若干问题以及众多学者对于现存的聚类方法提出的改进措施的理论成果和实践经验,本文试图调研发现面向大数据的聚类算法中存在问题,分析影响聚类精度的措施。
研究方法:本课题采用文献研究和案例分析方法进行研究。
通过文献研究,提出了新的聚类算法;通过案例分析,对新建的聚类算法进行验证与应用。
5. 工作计划
1)查阅关于聚类算法,以及数据挖掘等方面的相关资料;进行文献的阅读及整理,写出文献综述;2)根据文献理论回顾,进行理论分析,初步建立分析框架;3)建立模型,进行编程设计,收集案例,对案例进行分析比较、总结等;最终进行研究课题成果的撰写工作;论文周计划:第 11-17 周 完成初稿撰写。
第 18-19 周 根据导师意见修改论文,完成二稿。
第 20-21 周 再次修改论文,完成毕业论文定稿,并上传到毕设网。