分享到:

基于粗集理论的决策树剪枝

本文在理论上分析比较了基于粗糙集理论的剪枝方法和C4.5中  (本文共3页) 阅读全文>>

《东北师大学报(自然科学版)》2005年03期
东北师大学报(自然科学版)

基于粗集理论的新决策树剪枝方法

提出了一种基于粗糙集理论的新决策树剪枝方法.在剪枝的过程中,不仅考虑了树...  (本文共5页) 阅读全文>>

东北师范大学
东北师范大学

基于粗糙集理论的决策树生成与剪枝方法

数据挖掘,也称之为数据库中知识发现是一个可以从海量数据中智能地和自动地抽取一些有用的、可信的、有效的和可以理解的模式的过程。分类是数据挖掘的重要研究内容之一。目前,分类己广泛应用于医疗诊断、天气预测、信用证实、顾客区分、欺诈甄别等许多领域。决策树是一种常用的分类模型,与其他分类模型相比,决策树简洁易懂,容易转换成规则,而且具有与其他分类模型同样的,甚至是更好的分类准确性。粗糙集理论是由波兰数学家 Z.Pawlak 教授提出的一种处理模糊,不精确,不完整和不确定数据的有效工具,现已经过了 20 多年的发展,在理论和应用上都取得了丰硕的成果。本文主要研究了基于粗糙集理论的决策树生成和剪枝方法,具体如下:1)对决策树生成方法进行研究。Pawlak 粗糙集理论由于其分类过于精确的特性而无法很好的处理含有噪声的数据,基于 Pawlak 粗糙集理论构造的决策树也因此而不能很好的对噪声进行抑制,易产生过匹配训练数据的缺陷,从而不能很好的指导决...  (本文共65页) 本文目录 | 阅读全文>>

哈尔滨工程大学
哈尔滨工程大学

基于粗糙集数据挖掘技术的客户价值分析

当今的客户已经成为左右企业发展的一种决定性的力量。菲利普·科特勒指出以客户为中心的企业不仅需要建设产品,更重要的是建设客户。在现实的市场条件下任何企业要想成功,必须以客户需求为出发点,以满足市场或客户的需求为归宿,把客户对企业的信任和忠诚作为企业最重要的资产。国内外的理论和实践都已证明了忠诚的客户能为企业带来稳定而丰厚的利润,一个企业拥有了忠诚的客户群,就拥有了稳定的利润源和竞争优势,拥有了对市场的控制权。一个客户能保持忠诚越久,企业从他那里获得的利益越多。企业在培养客户忠诚时必须首先明确不同客户对企业具有不同的价值,企业应向最可能盈利的客户推销产品。基于客户差别及企业能力的限制,任何一个企业都不可能为市场上的全体客户服务。为了能与无处不在的竞争者竞争,企业需要确定它能为之最有效服务的细分市场,把目标关注于为企业带来最大利润的客户,提高他们的忠诚度。为了获得客户的忠诚,企业必须为客户提供优异的价值,因为只有价值才能驱动客户忠诚,...  (本文共159页) 本文目录 | 阅读全文>>

合肥工业大学
合肥工业大学

基于知识粗糙度度量的决策树构造方法研究

分类是数据挖掘的一个重要研究分支,决策树模型是分类中最常用的一种方法,得到了广泛的研究和应用。然而,由于存在种类偏见和抗噪音差等问题,使决策树的优化成为关注的热点之一。本文基于粗糙集理论对决策树的构造方法和优化问题展开研究,主要工作如下:(1)综述并分析了决策树经典构造及优化方法。(2)以知识粗糙度作为决策树属性选择判据,提出决策树构造算法KRD,所构造的决策树的规模和分类精度比ID3有所提高。(3)提出一种混合变量决策树构造方法KRDH,根据知识粗糙度情况的不同,确定最佳的属性选择,以适应现实数据中噪音、属性相关性弱等问题。(4)为了提高决策树的抗噪性,提出基于统计模型的算法KRDlc,KRDlc算法在构造决策树的同时加上叶子生成控制参数,达到决策树的预剪枝,减少了噪音对属性选择的影响,避免了过拟合问题,同时减少了决策树的规模。  (本文共63页) 本文目录 | 阅读全文>>

吉林大学
吉林大学

基于粗糙集理论的决策树算法研究

决策树分类方法是解决数据挖掘分类任务的一种重要的技术,鉴于其分类速度快、效率高和容易理解等特点受到了人们的广泛关注和重视。粗糙集理论是一种处理不准确、不确定和不完备信息的智能数据决策分析工具,将不精确或不确定的知识利用已知的知识库中的知识来近似刻画处理。本文将粗糙集理论与决策树算法相结合,给出了一种基于近似精度的决策树属性选择度量标准,并且为了削弱噪音数据和孤立点对于边界的影响,应用变精度粗糙集的理论将近似精度扩展到变近似精度,并利用变精度正域对决策树进行预剪枝,防止数据的过度拟和,抑制噪音数据的影响。实验表明,该算法具有较好的分类效果。为了让数据挖掘的结果模型具有通用性,研究了数据挖掘标准的相关内容,结合PMML标准参与设计和开发了基于Eclipse插件技术的数据挖掘平台,在其中负责数据库接口插件、PMML标准接口插件、数据源导入插件和决策树算法插件的设计和实现。  (本文共78页) 本文目录 | 阅读全文>>