登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 计算机类 > 计算机科学与技术 > 正文

基于主题模型的用户兴趣建模与应用毕业论文

 2021-04-29 21:42:44  

摘 要

随着移动互联网的普及,越来越多的用户开始通过互联网来获取新闻信息。相对比较于传统的报纸,互联网信息具有极高的时效性,如何即时给用户推荐他们感兴趣的新闻是当前新闻系统中要解决的首要问题。

本文采用基于内容的推荐技术,使用新闻主题和关键词对新闻和用户兴趣建模,在计算主题相似度的基础上,通过计算新闻模型中的关键词与用户兴趣模型中的关键词之间的词义相似度来分析新闻与用户兴趣在模型语义方面的相似度,最终设计并实现了一套基于用户兴趣主题模型的新闻推荐系统。本文的主要工作包括:

(1)学习了与自然语言处理以及个性化推荐相关的技术。

(2)设计了一种通过计算关键词之间的词义相似度来分析文本在语义层面的相似度的方法。

(3)设计并实现了一套基于用户兴趣主题模型的新闻推荐系统。

(4)通过实验验证了模型的有效性。

关键词:个性化推荐;用户兴趣;新闻文本;主题模型

Abstract

With the popularity of mobile Internet, more and more users begin to get news and information through the Internet, relatively in the traditional newspaper. The information on the Internet has high timeliness. It is the most important question to be solved in the current news system that how to recommend the news that they are interested in.

In the dissertation, the content-based recommendations is used to establish a news and user interest model by the means of the topic and keywords of the news. On the basis of calculating the similarity of topic, the thesis firstly calculates the semantic similarity of the keywords between the news and the user interest model, and then analyses the similarity between news and user interest in semantic aspect, lastly designs and implements a recommendation system based on user interest topic model of the news. The main work of the thesis includes:

(1) the technology associated with Natural Language Processing and personalized recommendation are researched.

(2) a method is designed to analyze the similarity of text on the semantic level by calculating the semantic similarity between keywords.

(3) a news recommendation system based on the subject model of user interest is designed and implemented.

(4) The validity of the system is verified by the experiments.

Keywords: personalized recommendation; user interest; news text; topic model

目 录

摘 要 I

Abstract II

第1章 绪论 1

1.1研究背景及意义 1

1.2 国内外研究现状 1

1.2.1主题模型 2

1.2.2 推荐算法 2

1.3 论文的主要研究内容 3

1.4论文的组织结构 4

第2章 新闻推荐系统中基于主题模型的用户兴趣建模 5

2.1问题描述 5

2.2 新闻文本的建模 5

2.3 用户兴趣的建模 7

2.4 推荐列表的生成 8

2.4.1 主题相似度计算 9

2.4.2 关键词相似度计算 10

2.4.3 生成Top-N推荐列表 10

第3章 基于用户兴趣主题模型的新闻推荐系统的设计与实现 11

3.1 新闻推荐系统的总体架构 11

3.2 新闻推荐系统功的详细设计 12

3.2.1 功能模块的设计 12

3.2.2 数据库设计 12

3.3 新闻推荐系统的实现 16

3.3.1 开发运行环境 16

3.3.2 新闻管理模块的实现 16

3.3.3 注册登录模块的实现 20

3.3.4 用户行为管理模块 24

3.3.5 用户兴趣管理模块 26

3.3.6 新闻推荐模块 27

第4章 基于用户兴趣主题模型的新闻推荐系统的实验评估 31

4.1 评估的目的 31

4.2 实验方案设计 31

4.2.1 实验一:预测准确度的评估 31

4.2.2 实验二:用户满意度的评估 32

4.3 实验结果分析 33

4.3.1 预测准确度实验结果分析 33

4.3.2 用户满意度实验结果分析 34

4.4 本章小结 35

第5章 总结与展望 36

5.1 工作总结 36

5.2 工作展望 36

参考文献 37

致 谢 38

第1章 绪论

1.1研究背景及意义

随着信息技术和移动通信技术的飞速发展,每时每刻都有大量的信息产生与传播。用户获取信息的方式也逐渐从传统的报纸、广播等,转向通过互联网获取。最新数据表明超过80%的互联网用户会通过网络获取新闻信息,且这个数据还在不断增长。网络信息相对传统信息具有个性化、便捷性、高时效性等优点,但面度铺天盖地而来的信息,由于其数量之大,用户也难以在其中获取所需要的信息。人们已经从信息匮乏时代走进了信息过载时代。

目前解决信息过载问题的主要方法是利用搜索引擎,他能根据用户的需求返回一组相关的结果给用户。在搜索领域,比较出名的公司有很多,比如Google、百度、搜狗,它们都能很好的为用户提供信息搜索服务。然而,很多时候用户可能没有明确的需求,或者说他们的需求难以用搜索引擎能够识别的语言来描述,比如用户只是想看看最近的资讯,通过搜索方法就很难满足他的要求,这时候推荐系统恰好能起到作用。正如Twitter联合创始人埃文•威廉斯(Evan Williams)在接受美国国家公共电台(NPR)采访时表示,如何为所有用户提供有意义的个性化服务,将是Twitter今后面临的最大挑战[1]。个性化推荐技无疑将成为信息服务领域的研究热点。

不同于普通网络信息,新闻报道作为一种信息资讯方式,有着相对严谨的写作风格。而且新闻具有较高的时效性,一篇报道一般最多持续2-3天的时间,为了能即时的项用户报道真实的信息,新闻报道必须要在简短的篇幅中包含人物、时间、事件等要素,而这些要素能够用于对新闻主题建模。对于用户,阅读新闻时也有着自己特定的兴趣偏好。针对以上新闻以及用户阅读兴趣的特点,本文引入主题模型,设计并实现一个个性化新闻推荐系统。

1.2 国内外研究现状

随着Web2.0技术的发展成熟,个性化推荐系统从诞生到现在不到20年的时间里,迅速发展成为一个独立的研究领域。越来越多的互联网应用中使用了推荐系统,比较著名的有豆瓣利用推荐系统给用户推荐电影、音乐、书籍;Amazon、京东、淘宝给用户推荐商品;Facebook、Twitter给用户推荐资讯等。个性化推荐系统的核心内容是个性化建模和推荐算法,本文基于主题模型来展开研究。

1.2.1主题模型

传统的文本模型表示方法主要有空间向量模型与统计语言模型,它们都没有分析文本的语义,对同义词部分存在问题。主题模型在语义层面上表示文本,能够解决传统文本表示方法中存在的这些问题。

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图