基于ASP的反垃圾邮件管理系统的设计毕业论文
2021-04-12 13:09:04
摘 要
随着人们对及时通信和大量信息传输方式的逐渐重视,电子邮件越来越受到人们的重视,电子邮件的使用也越来越多。但它带来的缺点——垃圾邮件也很猖獗,垃圾邮件不仅占据了网络上的大量空间和资源,也是人们日常学习生活中的一大困扰,影响日常工作效率。如何解决垃圾邮件这一问题已然成为了全世界需要共同面对的难题。
本文首先介绍了课题背景以及对电子邮件和反垃圾的简单介绍,然后介绍了几种反垃圾邮件技术,包括黑白名单过滤技术、关键字过滤技术和贝叶斯算法。在这其中也了解了现代的垃圾邮件过滤不能单单靠一种技术来实现,需要从单点单项技术研究到多技术融合研究,本文重点介绍了贝叶斯算法的实现。以及最后介绍了自己在这过程中遇到的各种难题。
关键词:电子邮件;垃圾邮件;黑白名单;贝叶斯策略
Abstract
With the increasing emphasis on timely communication and a large number of information transmission methods, e-mail has received more and more attention, and the use of e-mail has become more and more. But the accompanying disadvantages - spam is also rampant, spam not only takes up a lot of network resources and space, but also a major annoyance in people's daily lives, affecting the efficiency of daily work. How to solve the problem of spam has become a common problem facing the whole world.
This thesis first introduces the background of the topic and a brief introduction to e-mail and anti-spam, and then introduces several anti-spam technologies, including black and white list filtering technology, keyword filtering technology and Bayesian algorithm. In this, we also understand that modern spam filtering cannot be achieved by a single technology, from single-point single-item technology research to multi-technology fusion research. This paper focuses on the implementation of Bayesian algorithm. And finally introduced the various problems that I encountered in the process.
Key words: email; spam email; black and white list; Bayesian strategy
目 录
第1章 绪论 2
1.1 课题背景 2
1.2 开发概述 2
1.2.1电子邮件概述 2
1.2.2反垃圾技术概述 3
1.3 电子邮件的结构 4
1.4 电子邮件的传输过程 5
第2章 需求分析 6
2. 1 数据库需求分析 6
2. 2 开发环境需求 8
第3章 系统功能和技术介绍 9
3.1 系统功能模块设计 9
3.2基本功能 10
3.3黑白名单过滤技术 10
3.4 关键字过滤技术 11
3.5 贝叶斯过滤技术 11
3.5.1贝叶斯过滤算法的基本步骤 11
3.5.2贝叶斯过滤算法案例分析 12
第4章 系统详细设计和工作流程 14
4.1 系统工作流程图 14
4.2邮件统计设计 14
4.3邮件夹设计 15
4.4垃圾邮件过滤设计 16
4.4.1黑白名单过滤 16
4.4.2主题关键字过滤 17
4.4.3贝叶斯过滤 18
4.4.4邮件过滤参数设置 21
第5章 测试与分析 22
5.1系统测试 22
5.2设计中的难点问题 23
5.3三种过滤技术分析 23
第6章 结论 24
参考文献 25
致 谢 26
学位论文原创性声明
本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包括任何其他个人或集体已经发表或撰写的成果作品。本人完全意识到本声明的法律后果由本人承担。
作者签名:
年 月 日
学位论文版权使用授权书
本学位论文作者完全了解学校有关保障、使用学位论文的规定,同意学校保留并向有关学位论文管理部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权省级优秀学士论文评选机构将本学位论文的全部或部分内容编入有关数据进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
本学位论文属于 1、保密 □,在 年解密后适用本授权书
2、不保密 □
(请在以上相应方框内打“√”)
作者签名: | 年 | 月 | 日 |
导师签名: | 年 | 月 | 日 |
第1章 绪论
1.1 课题背景
电子邮件给人们学习与生活带来了极大便利,人与人之间的沟通因此而变得便捷,是一种便捷快速的沟通方式。但是在网络的世界里是没有健全的法则的,垃圾邮件的随意发送不仅不受社会的限制,国家也是没有确切的方法。因此人们可以通过电子邮件肆意群发广告、链接和很多有危害的东西。垃圾邮件已经被人们认为是互联网很受争议的一种产品,它的扩散可以说让互联网压力山大。
垃圾邮件占用了很大部分的网络带宽,使得邮件服务器拥堵不堪,从而削减了整个网络的运行速度。并且垃圾邮件也侵犯了邮件使用者的个人隐私权和个人邮件空间的安全,很大程度上浪费了使用者的时间和钱财。一些垃圾邮件的发送方也会盗取他人的电子邮箱地址作为自己的垃圾邮件发送地址,极大的损坏了被盗者的个人隐私与安全。在全球范围里,大量发送垃圾邮件的地址的主机会导致高级互联网提供商将其拉入国际垃圾邮件数据库中[1],并且之所以接受垃圾邮件的用户会被转向其他ISP,是因为ISP没有繁杂的垃圾邮件过滤方法。 以上的种种垃圾邮件的危害,影响了中国社会经济的发展,同时有损中国在国际的形象,对国内的众多企业与公司造成巨大影响。因此,必须开发一种有效的反垃圾邮件系统。
1.2 开发概述
1.2.1电子邮件概述
电子邮件程序(Email program)是一种便捷的网络通信方式,它主要通过电子信息通信手段来提供服务。用户通过互联网的电子邮件方式,可以以极快的速度和便宜的价格将信息发送至全球范围内,可以与任何用户取得沟通联系。电子邮件能包含多种信息方式,可以有文本,图像和声音等。
1971年10月,发送了第一封电子邮件。如今,e-mail已经完全成为我们日常生活工作中必不可少的一部分。与其他互联网产品相比,电子邮件具有无与伦比的开放性——任何地方的任何人都可以向其他人发送电子邮件以建立连接。据统计,2015年全球电子邮件用户数为25.9亿,全球每天发送和接收的电子邮件数量为2056亿。据估计,到2019年,电子邮件用户将接近30亿人,每天发送和接收的电子邮件数量将达到2465亿次。如今,电子邮件在家庭中的使用也趋于平凡,这也是经济社会发展的必然结果。随着互联网的发展,电子邮件开发商推出了许多电子邮件软件,例如QQ邮箱,网易邮箱。并且随着社会的进步,电子邮箱容量与体积也越来越大,邮件的传输速度也越来越快。记得当初自己接触QQ时也没有用过QQ邮箱,自认为邮箱的信息传输没有QQ的及时通信更加快速与方便,但是当时忽略的一点——大容量信息传输的便捷与否。但随着自己的学习与交流的更加繁多,邮箱的使用成为了我们学生日常学习中的首选文件交流方式,这也符合邮箱的安全便捷的特性,更进一步拉近了人与人之间的距离。
1.2.2反垃圾技术概述
垃圾邮件已经被人们认为是互联网很受争议的一个产品,它的扩散可以说让互联网背负了很大压力。《中国互联网络发展状况统计报告》于2003年发布,根据此报告显示,中国网民平均每周收到16.1封电子邮件,这16.1封垃圾邮件中有8.9封是垃圾邮件,垃圾邮件数量所占的比例大大超过了正常邮件的比例。照着这个趋势发展,垃圾邮件的数量会持续增加,正常邮件的比例终将会被超过。垃圾邮件(spam)至今为止都没有一个相对较严的定义。通常这样认为,凡是未经邮件收件人的同意就将邮件强行发送到用户邮箱内的都是垃圾邮件。垃圾邮件通常以批量递送为特征。其内容包赌博信息,骚扰广告,商业或个人网站广告,电子杂志等。垃圾邮件可以分为良性和恶性的。良性垃圾邮件就是一些对人们生活造成不了什么影响的邮件,其中就包含一些商业宣传广告。但是恶性垃圾邮件是指对个人隐私与钱财会造成巨大威胁的邮件,具有很大的安全隐患[11]。