分享到:

贝叶斯网络结构增量学习研究

贝叶斯网(Bayesian Networks,BN)又称信度网,起源于20世纪80年代中期对不确定性问题的研究,其清晰的语义结构揭示了研究对象的内在统计关系,是复杂联合概率分布的紧凑表示方式,它凭借结构化的自然表述方式,有效的学习能力及方便的推理机制,使其成为人工智能领域的一个重要理论工具。针对贝叶斯网络结构的批量学习算法无法适应初始训练数据集的不完整和模型的动态变化问题,贝叶斯网络结构的增量学习算法成为贝叶斯网络结构学习的研究热点之一。本文研究了贝叶斯网络结构的增量学习算法,所做的主要工作和创新点如下:研究了基于TOCO(Traversal Operators in Correct Order)和RSS(Reduced Search Space)启发函数的贝叶斯网络结构的增量学习算法。TOCO启发函数通过分析爬山算法的搜索路径,做出是否需要更新网络结构的决定。可以使得算法能够在新数据无效的情况下,利用当前网络结构作为初始化的网  (本文共64页) 本文目录 | 阅读全文>>

杭州电子科技大学
杭州电子科技大学

增量式贝叶斯网络结构学习研究

20世纪80年代,在不确定性问题的研究方面,人们将概率论、统计论和图论结合,从而发展起来一门新的学科——贝叶斯网络(Bayesian Networks)。由于贝叶斯网络使用形象而清晰的图论知识说明变量之间的内在统计关系,使得它能够将复杂的概率分布用清晰而紧凑的形式表示出来,贝叶斯网络也以其显著的优点成为复杂系统中数据分析和不确定性推理的一种有效工具。传统的贝叶斯网络结构学习算法都是批量学习算法,这些传统批量学习算法在面对现实情况中动态变化的训练样本集数据时,算法的执行时间较长而且需要占用巨大的存储空间。为了提高贝叶斯网络结构学习算法的效率以及解决这些传统批量学习算法的缺点,本文所做的主要工作以及创新点如下所示:首先,研究了群智能优化算法,将粒子群算法和遗传算法相结合提出一种适用于贝叶斯网络结构学习的搜索算法——MPS (Mixed PSO Search)算法。并通过实验验证了MPS算法的有效性。然后,研究了增量式学习的思想,增量...  (本文共67页) 本文目录 | 阅读全文>>

北京邮电大学
北京邮电大学

基于大数据平台的贝叶斯网络增量学习方法研究与应用

贝叶斯网络作为随机变量之间因果关系的一种不确定性的表达手段,被认为适于应用于分类预测或成因分析等任务。使用贝叶斯网络模型完成的分类预测任务的准确率往往高于其他通用算法。然而由于贝叶斯网络的学习过程的空间与时间复杂度,及对其结构理解的难度,贝叶斯网络在分类预测任务的情境中没有得到广泛的应用。其中,基于计算确定贝叶斯网络结构的算法,以MMHC算法为例,通常为启发式算法,其时间复杂度具有不确定性。在计算数据量较大的情况下,算法收敛的时间可能随数据量的增加呈指数级增长。本文从减少学习算法所用时间的目标出发,提出一种结合MapReduce编程框架与MMHC算法的学习贝叶斯网络结构的方法。该方法首先将训练数据分块,利用分块数据训练得到多个贝叶斯网络子网,然后利用这些子网同时进行分类预测任务。多个子网的预测结果的组合过程用到了 Boosting方法。实验证明,该方法在大大加快贝叶斯网络的训练过程的同时,保证了较高的分类预测准确率。通常对于一个...  (本文共76页) 本文目录 | 阅读全文>>

吉林大学
吉林大学

基于贝叶斯网络的生态工业园区清洁生产评价方法

随着国内外越来越多的生态工业园区的建设,科学地评价生态工业园区建设水平已成为极待解决的问题。国内外对生态工业园评价方法的研究仅局限于灰色关联分析、模糊综合评判法、层及分析法和人工神经网络。清洁生产是园区建设的前提和生态工业系统中构建必不可少的环节。若将评价方法应用到生态工业园区企业的清洁生产推进中,可以对清洁生产的次序进行决策。由于园区清洁生产是一个持续改进的过程,本文采用了基于免疫遗传算法的增量贝叶斯网络学习算法,对生态工业园区现有企业的各种评价指标进行建模,学习贝叶斯网络,然后通过对贝叶斯网络的推理,对生态工业园区企业进行清洁生产次序的决策。本文在基本的免疫遗传算法的基础上改进和增加了部分免疫算子,通过进化过程中的适应度函数来使个体适应新数据,通过接种疫苗,使个体与旧数据也有较好的匹配,使得学习算法更加适合增量学习环境和企业清洁生产决策问题。最后以某地区生态工业园区焦化企业为例进行建模验证,结果表明本文提出的评价方法是可行的...  (本文共61页) 本文目录 | 阅读全文>>

广西师范大学
广西师范大学

贝叶斯分类器的增量学习及缺失数据处理的研究

随着数据库、数据仓库以及Internet 技术的应用发展,使得数据挖掘(Data Mining)和知识发现(Knowledge Discovery)引起了大量学者与专家的关注,越来越显示出其强大的生命力。分类是数据挖掘中一项十分重要的任务,目的是找出分类函数或者分类模型。贝叶斯网络作为一种有效的知识表示方式和概率推理模型,是处理不确定信息的强有力图形决策化分析工具。近年来,基于贝叶斯网络的数据挖掘取得了良好的效果,成为研究热点。本文首先阐述了数据挖掘中分类的主要的方法,介绍、分析了现有的分类方法的定义以及作法,着重介绍了贝叶斯分类技术。贝叶斯网络G=(Bs,Bp)是一个带有概率注释的有向无环图,由网络的拓扑结构Bs和局部概率分布Bp两部分组成。它是以贝叶斯定理、最大后验假设、贝叶斯网络理论为基础的。用于分类的贝叶斯网络叫做贝叶斯分类器。贝叶斯分类器是特殊形式的贝叶斯网络,变量的选取和状态数均已确定,属性结点已知,类结点未知。贝叶...  (本文共51页) 本文目录 | 阅读全文>>

东南大学
东南大学

基于贝叶斯网络的个人生活数据分析

当今社会,人们的日常生活日益多元化,运动、网购、游戏、读书、社交等日常行为越来越多地影响人们的日常生活。随着互联网和智能设备的发展与普及,可以方便地采集人们日常生活中所产生的数据,这些数据中隐藏着许多关于个人的信息,通过对这些信息的分析,可以有效地改善人们的生活质量。贝叶斯网络作为一种广泛应用的不确定知识表示模型,提供了一种表示变量间因果关系的方法,用来发现隐藏在数据中的知识。本文对贝叶斯网络结构学习算法和联合树推理算法进行了相关研究,并将其应用于个人日常生活数据的分析。针对现有贝叶斯网络结构学习算法的不足,本文提出了两种改进算法:混合结构学习算法和增量学习算法。现有结构学习算法大多未充分考虑图连通性,存在易丢失弱连通边的不足,且边方向的确定方法具有局限性,导致学习结果准确率较低,本文结合依赖分析方法和评分-搜索方法,提出了一种基于贪婪搜索的混合结构学习算法(NITDO),有效提高了学习结果的准确率;日常生活数据随着时间地推移,...  (本文共88页) 本文目录 | 阅读全文>>