分享到:

树的离散度

利用离散度的定义 ,给出了树的离散  (本文共3页) 阅读全文>>

《控制与决策》2008年01期
控制与决策

基于离散度的决策树构造方法

在构造决策树的过程中,属性选择将影响到决策树的分类精度.对此,讨论了基于信息熵方法和WMR方法的局限性,提出了信息系统中条件属性集的离散度的概念.利用该概...  (本文共5页) 阅读全文>>

浙江师范大学
浙江师范大学

基于邻域离散度和隔离树的异常点检测算法研究

异常点检测是数据挖掘领域中一项重要的研究任务,其主要目标是检测数据集中不合群的数据点,从而帮助人们发现反常的行为模式,揭示异常现象。当前异常点检测技术已经在各项生产实践活动中得到了广泛应用,例如欺诈检测、入侵检测、环境监控、基因表达式分析等。根据模型的不同,现有的异常点检测算法大致可分为以下几类:基于统计模型的异常点检测算法、基于邻近度的异常点检测算法、基于子空间的异常点检测算法、基于图论的异常点检测算法,以及基于集成学习的异常点检测算法。本文回顾了上述五类异常点检测算法,分析了它们的不足,提出了两种新的异常点检测算法:(1)经典异常点检测算法存在的问题是边缘数据点的异常度较高,这种效应会模糊正常点和异常点的边界,导致在某些情况下,边缘处的正常数据点被误判为异常点。针对这一问题,提出了基于邻域离散度的异常点检测算法(DON算法)。该算法将数据点所在邻域的离散度作为该数据点的异常度,从而避免边缘数据点的异常度过高。实验结果表明,该...  (本文共56页) 本文目录 | 阅读全文>>

山东科技大学
山东科技大学

基于离散度的决策树算法改进

分类挖掘是数据挖掘中最重要的技术之一,是数据挖掘中的一个重要课题,而分类技术中的决策树方法又是重点研究的方向。目前,很多学者已经提出了许多利用决策树对大规模数据集进行分类的算法,但这些算法都是从不同的角度对经典ID3算法的改进,也都存在着各方面的不足。为此,本文把传统的决策树归纳学习算法与模糊集理论相结合,提出了模糊化的归纳学习方法。这样可以减少由于域值的硬化对分类的误差程度。然后,我们还提出了一种改进的决策树分类算法—基于离散度的决策树算法,利用该算法挖掘分类规则,不仅提高了分类的正确率,而且非常高效。最后用实验证明改进的决策树算法比经典的ID3算法在性能上更高效。  (本文共71页) 本文目录 | 阅读全文>>

吉林大学
吉林大学

决策支持系统中模型管理相关问题研究

由于模型在问题处理和决策制定中的重要作用,“模型驱动”是决策支持系统区别于一般信息系统的重要特征。模型管理系统是决策支持系统的核心部件,是决策支持系统发展的决定性因素。本文对决策支持系统中模型管理相关问题进行了深入的研究,主要工作有:通过分析在构建模型库时必须考虑的关键因素及其这些因素之间的关系,提出了模型网的概念,以表示和分析模型库的逻辑结构;进一步讨论了模型网的构造方法;给出了基于模型网的模型组合方法,该方法不仅可以减小模型搜索空间,提高模型组合效率,而且可以找到满足给定决策问题的所有可能的组合模型供决策者选择;设计了基于模型网的模型管理系统的体系结构;讨论了数据类型匹配知识的决策树表示方法,以提高数据类型匹配推理效率和自动化程度;为了进一步提高效率,对决策树构造方法进行了研究,提出了基于离散度的决策树构造方法,并给出了相应的决策树构造算法。  (本文共107页) 本文目录 | 阅读全文>>

《计算机工程与应用》2010年25期
计算机工程与应用

一种多变量决策树的构造与研究

单变量决策树算法造成树的规模庞大、规则复杂、不易理解,而多变量决策树是一种有效用于分类的数据挖掘方法,构造的关键是根据属性之间的相关性选择合适的属性组合构成一个新的属性作为...  (本文共4页) 阅读全文>>