分享到:

基于多规则的垃圾邮件过滤技术的研究与实现

随着互联网的越来越普及,电子邮件正成为一种最快捷、最经济的通信手段。但是,在用户接收到有用的邮件的同时,各种各样的广告邮件、邮件炸弹以及邮件病毒等都不请自来的充斥着用户的邮箱,使得用户不得不花费大量的时间和精力来处理这些垃圾邮件。此外,这些垃圾邮件在互联网上不分昼夜的大量传输造成了邮件服务器拥塞,降低了整个网络的运行效率,给邮件服务提供商们带来了很大的损失。所以,如何准确的从大量邮件中寻找到所需要的有用邮件,减少垃圾邮件的干扰,已经成为无论是电子邮件提供商还是普通用户都很关心的焦点问题。因此研究开发垃圾邮件过滤系统变的极为迫切。文章在对电子邮件协议进行深入剖析的基础上,首先讨论了主要的垃圾邮件过滤技术,包括:内容过滤技术、黑/白名单技术和SMTP认证技术。文章对各种技术的优缺点进行了阐述,并对垃圾邮件的过滤技术进行了小结。接着探讨了垃圾邮件的数学描述,这是本文的重点部分。首先讨论了数学描述的基础,包括:垃圾邮件的发送机制、垃圾邮  (本文共68页) 本文目录 | 阅读全文>>

西南大学
西南大学

基于粗糙集的垃圾邮件过滤研究

电子邮件是互联网的最重要应用之一。它在给人们日常工作和生活带来很大便利的同时,也带来了一种令人讨厌的副产品——垃圾邮件。随着垃圾邮件越来越泛滥,人们在技术和法律方面都进行了不断的努力,垃圾邮件已经得到了一定的控制。垃圾邮件过滤的主要技术包括白名单与黑名单技术、规则过滤、基于关键词匹配的内容扫描,以及基于内容的文本分类方法等。目前的垃圾邮件过滤系统如贝叶斯过滤系统等,从过滤效果来看,并不是十分理想,存在的主要问题是将非垃圾邮件判定为垃圾邮件的几率较高,使用户宁愿接收到垃圾邮件也不愿意使用邮件过滤系统。基于粗糙集的垃圾邮件过滤是一种基于规则的内容过滤方法,将粗糙集理论用于垃圾邮件过滤是一个新的研究方向,可以降低垃圾邮件错判率。本文的选题正是基于上述背景,本文的工作主要包括以下几个方面:1.给出了垃圾邮件的定义,探讨了垃圾邮件的危害;2.分析并总结了当前主要的垃圾邮件过滤技术,对常用邮件分类方法的基本原理及分类准确率进行了介绍;3.介...  (本文共56页) 本文目录 | 阅读全文>>

南京信息工程大学
南京信息工程大学

基于内容的垃圾邮件过滤研究与实现

随着Internet的迅速普及,电子邮件以其快捷、方便、低成本的特点逐渐成为人们进行信息交流的主要媒介之一,但是随之而来的垃圾邮件也越来越泛滥。垃圾邮件占用了有限的存储、计算和网络资源,耗费了用户大量的处理时间,影响和干扰了用户的正常工作、生活和学习。如何有效地治理垃圾邮件问题是全世界共同面临的一道难题,也是互联网上目前亟待解决的问题。本文首先深入研究了大量近期垃圾邮件样本,归纳总结了当前垃圾邮件发送者经常采用的欺骗手段和方法,并参阅国内外大量反垃圾邮件文献和数据,对已有的反垃圾邮件技术作出分析和总结,尤其是基于内容的垃圾邮件过滤方法进行了研究。并针对在基于内容的垃圾邮件过滤中使用最广的简单Bayes算法进行分析,提出了一种改进算法。该算法能在正确分类邮件的同时,减少合法邮件的误判率,在对垃圾邮件进行分类与过滤时具有较好的性能。本文还研究了基于复制检测技术的垃圾邮件过滤方法,实现了Nilsimsa算法。最后针对一种以HTML形式...  (本文共64页) 本文目录 | 阅读全文>>

《计算机与数字工程》2020年03期
计算机与数字工程

基于改进贝叶斯原理的垃圾邮件过滤算法研究

为了提高垃圾邮件过滤系统的对邮件过滤的准确性和返回率,论文改进了传统的贝叶斯定理。提出一种改进的垃圾邮件过滤方法,该方法使用基于单词提取特征值和使用特征向量来描述频率...  (本文共5页) 阅读全文>>

《电信科学》2017年11期
电信科学

基于主题模型的垃圾邮件过滤系统的设计与实现

垃圾邮件过滤技术在保证信息安全、提高资源利用、分拣信息数据等方面都发挥着重要作用。然而,垃圾邮件的出现影响了用户的体验,并且会造成不必要的经济与时间损失。针对现有的垃圾邮件过滤技术的不足,基于多个主题词理论,构建了基于朴素贝叶斯的垃圾邮件分类方法。在邮件主题获取中,采用主题模型LDA得到邮件的相关主...  (本文共10页) 阅读全文>>

《电脑知识与技术》2017年13期
电脑知识与技术

基于贝叶斯算法的垃圾邮件过滤的方法研究

随着互联网行业的迅速发展,电子邮件营销得到快速发展,但垃圾邮件的日趋严重浪费着网络资源,因此过滤垃圾邮件刻不容缓。该文通过介绍朴素贝叶斯算法的原理及它在垃圾邮件过滤这方面的应用...  (本文共3页) 阅读全文>>