分享到:

邮件服务器垃圾邮件过滤技术研究及实现

随着互联网的普及,电子邮件正成为一种最快捷、最经济的通信手段。而垃圾邮件占用大量传输、存储和计算资源,影响了网络的正常运行;它严重干扰了人们正常生活,甚至造成很多额外的经济支出和安全隐患。据统计,全世界的公司企业每年大概要花费80亿至100亿美元来解决垃圾邮件问题,并且这一数字每五个月会翻一番。因此,对反垃圾邮件技术的研究已经成为影响互联网发展的重要课题之一。目前对付垃圾邮件的主要方法是基于规则的过滤,这种方法存在查全率低、容易出现误判、适应性差、维护麻烦、无法阻挡病毒通过邮件传播、不支持中文邮件等不足。针对目前垃圾邮件过滤系统的不足,如何提高垃圾邮件过滤系统的查全率和降低误判率,如何改善邮件过滤系统的适应性,以及对邮件进行病毒检测是本课题需要解决的问题。这些问题的解决是实现本文研究目标的关键。本课题以垃圾邮件过滤为目标进行研究,设计并实现了一个垃圾邮件过滤系统SpamBlocker。该系统整合规则过滤、贝叶斯分类、病毒检测和黑  (本文共77页) 本文目录 | 阅读全文>>

厦门大学
厦门大学

垃圾邮件过滤技术研究

电子邮件已经成为人们日常生活中通信、交流的重要手段之一,但垃圾邮件问题也日益严峻,网民平均每天收到的垃圾邮件数量已超过了正常邮件。因此目前反垃圾邮件技术的研究成为了一个热门的话题。目前经常采用的垃圾邮件过滤技术可以分为两类,一类是基于规则的过滤方式。一般包括白名单与黑名单技术、规则过滤以及基于关键词匹配的内容扫描等。另一类是从电子邮件的文本内容入手,使用文本分类、信息过滤的算法,在训练邮件集合上学习垃圾邮件分类器。常用的文本分类方法有贝叶斯、k-近邻、决策树、boosting等。朴素贝叶斯方法计算简便,在大样本的情况下表现出较好的性能。其他的几种方法有的效果比朴素贝叶斯好一些,但计算较复杂。目前基于文本内容的垃圾邮件过滤器得到了广泛的应用,这类过滤器主要是基于朴素贝叶斯算法。随着基于以贝叶斯为代表的基于内容的反垃圾邮件技术的普及,垃圾邮件发送者也想出了一些行之有效的方法来对付它,例如插入干扰词。然而,当前关于反垃圾邮件的学术研究...  (本文共75页) 本文目录 | 阅读全文>>

四川大学
四川大学

基于多规则的垃圾邮件过滤技术的研究与实现

随着互联网的越来越普及,电子邮件正成为一种最快捷、最经济的通信手段。但是,在用户接收到有用的邮件的同时,各种各样的广告邮件、邮件炸弹以及邮件病毒等都不请自来的充斥着用户的邮箱,使得用户不得不花费大量的时间和精力来处理这些垃圾邮件。此外,这些垃圾邮件在互联网上不分昼夜的大量传输造成了邮件服务器拥塞,降低了整个网络的运行效率,给邮件服务提供商们带来了很大的损失。所以,如何准确的从大量邮件中寻找到所需要的有用邮件,减少垃圾邮件的干扰,已经成为无论是电子邮件提供商还是普通用户都很关心的焦点问题。因此研究开发垃圾邮件过滤系统变的极为迫切。文章在对电子邮件协议进行深入剖析的基础上,首先讨论了主要的垃圾邮件过滤技术,包括:内容过滤技术、黑/白名单技术和SMTP认证技术。文章对各种技术的优缺点进行了阐述,并对垃圾邮件的过滤技术进行了小结。接着探讨了垃圾邮件的数学描述,这是本文的重点部分。首先讨论了数学描述的基础,包括:垃圾邮件的发送机制、垃圾邮...  (本文共68页) 本文目录 | 阅读全文>>

兰州理工大学
兰州理工大学

基于内容的垃圾邮件过滤技术研究

随着Internet的迅速普及,垃圾邮件问题引起了社会广泛的关注。目前解决垃圾邮件问题有众多的途径和思路,其中基于内容的垃圾邮件过滤是一个较为重要的方法。本文从国内垃圾邮件泛滥的现状出发,以中文垃圾邮件过滤的相关技术为研究方向,重点对潜在语义分析方法、“邮件指纹”生成策略、基于模糊支持向量机的邮件过滤方法、模糊聚类算法在邮件过滤中的应用方式以及基于博弈论的邮件特征选择对过滤性能所产生的影响进行了深入研究:1为了解决潜在语义分析方法(LSA)在权重计算上因继承向量空间模型,而忽视自身特点,导致缺乏文档先验信息和文档全局信息植入,使得在实际应用中过分机械的问题,提出一种新的权重函数来改进原有权重的定义方式,使得基于主动学习的潜在语义分析方法能构造出更适合于实际应用的垃圾邮件过滤模型。并针对现阶段在拥有数万用户的大型局域网中,多数垃圾邮件采用动态改变主体或发件人地址,而其正文及附件内容却基本一致的群发方式在网内传播的现象,提出利用Me...  (本文共105页) 本文目录 | 阅读全文>>

内蒙古大学
内蒙古大学

中文垃圾邮件过滤技术的研究与应用

随着Internet应用在全球的快速普及,电子邮件以其成本低廉、传播迅速的特点,已经成为人们日常生活中通信、交流的重要手段之一。然而,一些人出于个人目的,利用Internet滥发垃圾邮件,不仅浪费了大量的网络资源,而且给整个社会带来很大危害。其中中文垃圾邮件也占很大的比重。目前,随着垃圾邮件过滤技术的不断发展,已经有一些垃圾邮件过滤系统在英文环境中取得了较好的过滤效果,但在中文环境中,这些过滤系统的过滤效果均不够理想,不能满足用户的要求。针对中文垃圾邮件,本文在对电子邮件系统工作原理进行分析的基础上,对文本分类、邮件编解码、中文分词以及特征选取等做了详细分析,并将DFR方法应用于特征选取过程,取得较好的实验效果。本文对几种常用的过滤算法进行了研究,分析了它们在中文环境中存在的问题,根据各算法的优缺点,提出了一种中文环境中的垃圾邮件综合过滤方法,首先通过白名单过滤,将在白名单中的正常邮件直接接收,然后通过第二层基于规则的过滤方法,...  (本文共78页) 本文目录 | 阅读全文>>

西南大学
西南大学

基于粗糙集的垃圾邮件过滤研究

电子邮件是互联网的最重要应用之一。它在给人们日常工作和生活带来很大便利的同时,也带来了一种令人讨厌的副产品——垃圾邮件。随着垃圾邮件越来越泛滥,人们在技术和法律方面都进行了不断的努力,垃圾邮件已经得到了一定的控制。垃圾邮件过滤的主要技术包括白名单与黑名单技术、规则过滤、基于关键词匹配的内容扫描,以及基于内容的文本分类方法等。目前的垃圾邮件过滤系统如贝叶斯过滤系统等,从过滤效果来看,并不是十分理想,存在的主要问题是将非垃圾邮件判定为垃圾邮件的几率较高,使用户宁愿接收到垃圾邮件也不愿意使用邮件过滤系统。基于粗糙集的垃圾邮件过滤是一种基于规则的内容过滤方法,将粗糙集理论用于垃圾邮件过滤是一个新的研究方向,可以降低垃圾邮件错判率。本文的选题正是基于上述背景,本文的工作主要包括以下几个方面:1.给出了垃圾邮件的定义,探讨了垃圾邮件的危害;2.分析并总结了当前主要的垃圾邮件过滤技术,对常用邮件分类方法的基本原理及分类准确率进行了介绍;3.介...  (本文共56页) 本文目录 | 阅读全文>>

南京信息工程大学
南京信息工程大学

基于内容的垃圾邮件过滤研究与实现

随着Internet的迅速普及,电子邮件以其快捷、方便、低成本的特点逐渐成为人们进行信息交流的主要媒介之一,但是随之而来的垃圾邮件也越来越泛滥。垃圾邮件占用了有限的存储、计算和网络资源,耗费了用户大量的处理时间,影响和干扰了用户的正常工作、生活和学习。如何有效地治理垃圾邮件问题是全世界共同面临的一道难题,也是互联网上目前亟待解决的问题。本文首先深入研究了大量近期垃圾邮件样本,归纳总结了当前垃圾邮件发送者经常采用的欺骗手段和方法,并参阅国内外大量反垃圾邮件文献和数据,对已有的反垃圾邮件技术作出分析和总结,尤其是基于内容的垃圾邮件过滤方法进行了研究。并针对在基于内容的垃圾邮件过滤中使用最广的简单Bayes算法进行分析,提出了一种改进算法。该算法能在正确分类邮件的同时,减少合法邮件的误判率,在对垃圾邮件进行分类与过滤时具有较好的性能。本文还研究了基于复制检测技术的垃圾邮件过滤方法,实现了Nilsimsa算法。最后针对一种以HTML形式...  (本文共64页) 本文目录 | 阅读全文>>