基于TextRank关键词提取算法的共词网络构建开题报告
2020-02-20 09:58:26
1. 研究目的与意义(文献综述)
1.1目的和意义
如今,随着互联网信息技术的不断进步与发展,网络上各类信息海量增长。而信息量的剧增,信息内容的丰富多样、信息结构的复杂多变,信息传递的速度加快同样使得网络文本数据杂乱无章,因此如何从中快速的检索并掌握有用的数据变得尤为重要。
关键词作为对文章内容的简要概括,它可以帮助用户通过一种有意义的方式来对信息进行分类。因此关键词提取是从网络上的资源内容中获取有用的数据的有效方法。textrank是一个基于图排序的、用于文本处理的关键词提取算法。使用textrank算法,不需要有深入的语言学和专业领域知识,它是一个无监督的算法,这个特性使得它可以很方便的应用到其他领域和语言中。
2. 研究的基本内容与方案
2.1设计的基本内容
使用python语言编写程序,通过textrank算法对一百篇文献进行关键词提取,并通过关键词之间的联系构建出共词矩阵。
2.2目标
3. 研究计划与安排
(1)2019/1/11—2019/1/22:查阅参考文献,明确选题;
(2)2019/1/23—2019/3/7:进一步阅读文献,并分析和总结;确定技术路线,完成并提交开题报告;
4. 参考文献(12篇以上)
[1] 柳林青,余瀚,费宁,陈春玲.一种基于textrank的单文本关键字提取算法[j].计算机应用研究,2018,35(3):705-710.
[2] 李 航 ,唐超兰,杨 贤,等.融合多特征的textrank关键词抽取方法[j].情报杂志,2017,36(8):183-187.
[3] 陈万振.textrank关键词提取算法与som文本聚类模型的优化研究.[d].广西:广西大学,2016