分享到:

基于贝叶斯网络的信息过滤模型研究

传统信息过滤模型很难描述对信息过滤结果产生影响的各种因素 ,如质量、内容、用户偏好之间复杂的关系 ,也无合适的方法让用户将知识加入到信息过滤系统中 .因此 ,提出了基于贝叶斯网络的信息过滤模型 BMIF(Bayesian m od  (本文共8页) 阅读全文>>

山东师范大学
山东师范大学

基于校园网的网络信息过滤系统的设计与实现

校园网给用户提供便利的同时也带来了危害,大量的不良信息充斥在网络世界里,给高校校园网的管理和维护带来了严重挑战。信息过滤是一种系统化方法,他能够自动的将网络上的动态信息流与过滤模板进行匹配,过滤掉有害信息。贝叶斯理论在信息过滤中得到了很好的应用,他与KNN、支持向量机等相比,加油高效、节约空间以及有利于实现个性化过滤的优势。但是也存在忽略了特征词之间的联系、忽略误判所带来的风险以及不支持增量学习机制等缺陷。本文针对校园网垃圾和不良信息问题,将朴素贝叶斯引入到信息过滤中,并且针对其存在的问题提出了改进方案,最终构建了基于改进贝叶斯的校园网信息过滤系统。本文主要工作包括:1、深入研究了网络信息过滤关键技术及相关过滤模型探讨了信息过滤的一般模型及其相关算法,分析了现有的信息过滤模型中存在的问题,重点研究了网络信息过滤中的网络数据的获取和表示、特征权值的计算方法、文本信息的表示、分类算法等。2、提出一种对朴素贝叶斯的改进算法针对传统的朴...  (本文共44页) 本文目录 | 阅读全文>>

昆明理工大学
昆明理工大学

虚拟社区不良信息过滤技术研究

随着我国计算机技术的飞速发展,网络虚拟社区大量出现,网络舆论的活跃性也达到了前所未有的程度。但是,大量的网络不良信息、反动言论也在虚拟社区中出现,给社会发展造成了精神污染,给我国的国家安全带来严重的危害和挑战。对网络虚拟社区不良信息进行过滤,净化网络环境刻不容缓。针对网络虚拟社区中不良信息的特点,本文研究了虚拟社区中不良信息的用词特征、结构特征、特征词提取以及过滤系统建模等问题。分别采用贝叶斯方法和支持向量机方法构建了虚拟社区不良信息过滤模型进行了实验对比,并设计实现了虚拟社区不良信息过滤原型系统,取得了比较好的效果。具体说来,本文的主要内容如下:首先,针对网络虚拟社区文本特点,对虚拟社区文本进行预处理,采用正则表达式对非常规词或符号进行处理,获得待过滤的文本。根据虚拟社区文本特点,建立了停用词表,采用文档频率(DF)法的特征选择算法,选择了235个词作为虚拟社区文本过滤特征项。其次,标记了虚拟社区不良文本训练和测试语料,分析了...  (本文共61页) 本文目录 | 阅读全文>>

长安大学
长安大学

基于朴素贝叶斯算法的不良文本过滤技术研究及应用

随着互联网技术的迅猛发展,网络信息逐渐成为个人及企业的主要信息来源,这些丰富多样的信息资源在给人们带来便利的同时,也充斥着大量不良信息,如反动、色情、毒品、赌博、非法营销的产品广告等,既不利于建设绿色健康的网络环境,也会对获取信息的过程造成障碍。鉴于网络信息中文本信息所占比例较大,对不良文本过滤技术的研究有助于净化整体网络信息,从而快速有效地取得有用文本信息,具有很高的实际应用价值。本文以基于向量空间模型(VSM)的朴素贝叶斯算法为核心,提出了一种面向大量流动网络信息的不良文本过滤技术,并对其中所包含的方法、模型进行研究及改良,最终实现针对指定系统的不良文本过滤。本文主要研究工作和成果如下:(1)使用VSM作为文本表示方法,通过对特征选择方法的改良,确定类中心向量集合。优化朴素贝叶斯算法的方法模型,从而训练得到适用于文本过滤的分类算法,为后续技术的提出奠定基础。(2)提出一种基于朴素贝叶斯算法的不良文本过滤技术,该技术引入假设检...  (本文共73页) 本文目录 | 阅读全文>>

辽宁工程技术大学
辽宁工程技术大学

贝叶斯数据挖掘算法在反垃圾邮件中的研究

目前,解决垃圾邮件问题有众多的途径和思路,其中基于内容的垃圾邮件过滤方法是一个较为重要的方面,也是当前解决垃圾邮件问题的主流技术之一,它主要包括基于规则的方法和基于贝叶斯方法两个方向。文中重点介绍了朴素贝叶斯垃圾邮件分类模型,并在此基础上提出了一种新的垃圾邮件分类方法—贝叶斯参数估计邮件分类方法。通过采用基于朴素贝叶斯方法和基于贝叶斯参数估计方法两种方法进行邮件过滤对比试验,最终得出结论认为:基于贝叶斯参数估计方法是一种更有效的垃圾邮件过滤方法,新方法与朴素贝叶斯邮件过滤方法相比具有更高的准确性。  (本文共71页) 本文目录 | 阅读全文>>

南京航空航天大学
南京航空航天大学

基于语义的多领域草图符号识别研究

在设计领域中草图符号得到了广泛地应用,人们一般利用草图符号记录设计思想,再利用设计软件作进一步处理。为了实现设计软件中对草图输入方式的支持,手绘草图符号的识别研究得到了人们广泛地关注。单个领域的草图符号识别由于其底层识别具有一定的独立性,这为多领域符号的识别提供了可能。同时,相关领域中的草图符号作为语义单元同样具有一定的语义信息,因此,领域语义对于精确草图符号识别具有重要意义。据此,本文给出了一种基于语义贝叶斯网络的多领域草图符号识别系统框架,初步实现了基于贝叶斯网络的草图语义符号推理及识别。本文主要研究内容如下:(1)设计了一种基于感知的草图符号描述语言PLE_Sketch。PLE_Sketch建立在人类感知信息的基础之上,语法结构中嵌入了人类感知权重信息。PLE_Sketch的语法结构包括几何基和约束两部分,建立时均设定初始权值,而具体领域符号对应的权值可以通过感知过滤器作适应性调整。PLE_Sketch采用线性不可递归的语...  (本文共104页) 本文目录 | 阅读全文>>