基于中文在线评论的主题识别方法的设计与研究任务书
2020-02-18 15:59:08
1. 毕业设计(论文)主要内容:
(1)学习java 技术和eclipse软件的相关知识。
(2)分析购物网站上的产品展示页面,利用爬虫脚本抓取网站上的在线评论,对在线评论信息进行采集以及数据预处理,构建中文在线评论资料库。提取出用户评论信息中的主题信息,然后结合词语语义特性,采用优化的文本分类方法,将提取出的主题分类到预先定义的主题关注点集合中,最后按主题关注度的降序进行排序,得到主题热点。
(3)对各品牌用户所关注的主题热点进行研究,构建一个主题热点分析系统。
2. 毕业设计(论文)主要任务及要求
(1)具备一定的java 开发语言和数据库的相关知识。
(2)开发一个在线评论的主题识别系统,对各品牌用户所关注的主题热点进行研究。
(3)阅读的参考文献不少于15篇(其中近五年外文文献不少于3篇),参考文献撰写格式必须规范(详见《武汉理工大学本科生毕业设计(论文)撰写规范》)。
3. 毕业设计(论文)完成任务的计划与安排
第1周—第3周 搜集资料,撰写开题报告;
第4周—第5周 论文开题;
第6周—第12周 撰写论文初稿;
4. 主要参考文献
[1] 毕蓉蓉,王进科,于亚君. java web程序设计的案例库研究[j]. 电子技术与软件工程, 2014(11):270-270.
[2] 刘俊,邹东升,邢欣来,等.基于主题特征的关键词抽取[j]. 计算机应用研究,2012,29(11):24:-4227
[3] a semantic matching energy function for learning with multi-relational data[j] . antoine bordes,xavier glorot,jason weston,yoshua bengio. machine learning . 2014