分享到:

基于粗糙集合和朴素贝叶斯模型的分类问题研究

KDD是在数据库和人工智能的相互融合渗透中逐渐发展起来的一个有着广阔应用前景的新兴研究领域,是从数据中提取人们感兴趣的、潜在的、可用的知识,并表示成用户可理解的形式。分类是KDD领域中重要的研究分支。由波兰数学家Pawlak提出的料糙集合理论是一种表示和处理不确定性知识的方法,在KDD领域中具有越来越重要的地位。朴素贝叶斯分类技术是以贝叶斯定理、最大后验假设等理论为基础,其分类模型由于简单、易于实现而受到普遍青睐。本文对基于粗糙集合和朴素贝叶斯的分类问题进行了研究,主要包括以下几个方面的内容:研究了不完备信息系统中粗糙集合理论的扩展,提出了一种基于属性重要度的粗集扩展模型。将粗糙集合理论引入朴素贝叶斯分类模型的研究中,提出了基于信息熵的近似属性约简算法(MAIR),改善条件属性间的依赖关系,最大程度上满足朴素贝叶斯分类条件独立性假设的要求。在MAIR算法的基础上提出了基于粗糙集合理论的朴素贝叶斯分类算法(RSBC),实验证明,该  (本文共66页) 本文目录 | 阅读全文>>

山东师范大学
山东师范大学

粗糙集在数据挖掘中的应用研究

当今,社会已经进入了网络信息时代,计算机与网络技术的飞速发展使整个应用领域的数据和信息急速增加,并且由于人类的参与,数据与信息系统中的不确定性更加显著。因此,如何从大量的、杂乱无章的、强干扰的数据中挖掘出潜在的、有利用价值的信息,便成为人类智能信息处理中面临的前所未有的挑战。由此产生了人工智能研究的一个崭新领域——数据挖掘(DM)。目前,数据挖掘中常用到的技术有:统计分析方法、决策树、神经网络、遗传算法、模糊集方法、粗糙集理论、可视化技术等等。在诸多方法中,粗糙集理论与方法对于处理复杂系统不失为一种较为有效的方法。粗糙集理论是近年来发展起来的一种处理不精确、不完全信息的软计算方法。该理论是波兰数学家Z.Pawlak 于1982 年提出的一种数据分析理论。它的主要思想是:在保持信息系统分类能力不变的前提下,通过知识约简导出问题的分类或决策规则。将粗糙集理论应用于数据挖掘具有明显的优越性——它无需提供所需处理的数据集合之外的任何先验...  (本文共68页) 本文目录 | 阅读全文>>

国防科学技术大学
国防科学技术大学

粗糙集理论及其对信息表处理中的若干问题研究

粗糙集理论是由波兰数学家Z.Pawlak于1982年提出一种新的处理不精确和不确定问题的数学工具,近年来得到了迅速地发展,并在很多领域取得了成功的应用。粗糙集理论建立在论域中的不可分辨关系之上,用上、下近似来描述概念,基于粗糙集理论的数据分析无需提供任何先验知识。本文完成的工作和取得的创新在于:本文揭示了约简在数量上的一个重要性质,给出了又一种属性重要性的定义以及相应的启发式算法,并且对算法作了详细的分析,在此基础上还类似讨论了相对约简。经典的粗糙集理论是基于完备信息系统的,然而实际中由于种种原因会碰到不完备信息系统,本文给出了一种不完备信息系统的完备化方法以及其相应的规则提取方法。近似集是粗糙集理论中的基本概念,本文通过对约简和近似集的关系研究,定义了一种新的相对约简—保近似约简,并通过实例验证了保近似约简的实践意义。最后作者规范地给出了基于序关系的粗糙集模型并做了相应的讨论,还给出了一个利用基于序关系的粗糙集来处理有序信息表...  (本文共44页) 本文目录 | 阅读全文>>

东北师范大学
东北师范大学

基于粗糙集理论的决策树生成与剪枝方法

数据挖掘,也称之为数据库中知识发现是一个可以从海量数据中智能地和自动地抽取一些有用的、可信的、有效的和可以理解的模式的过程。分类是数据挖掘的重要研究内容之一。目前,分类己广泛应用于医疗诊断、天气预测、信用证实、顾客区分、欺诈甄别等许多领域。决策树是一种常用的分类模型,与其他分类模型相比,决策树简洁易懂,容易转换成规则,而且具有与其他分类模型同样的,甚至是更好的分类准确性。粗糙集理论是由波兰数学家 Z.Pawlak 教授提出的一种处理模糊,不精确,不完整和不确定数据的有效工具,现已经过了 20 多年的发展,在理论和应用上都取得了丰硕的成果。本文主要研究了基于粗糙集理论的决策树生成和剪枝方法,具体如下:1)对决策树生成方法进行研究。Pawlak 粗糙集理论由于其分类过于精确的特性而无法很好的处理含有噪声的数据,基于 Pawlak 粗糙集理论构造的决策树也因此而不能很好的对噪声进行抑制,易产生过匹配训练数据的缺陷,从而不能很好的指导决...  (本文共65页) 本文目录 | 阅读全文>>

南京工业大学
南京工业大学

基于粗糙集理论的薄膜蒸发器过程参数的研究

薄膜蒸发器是一种真空条件下采用机械搅拌进行降膜蒸发的新型高效蒸发器。薄膜蒸发器以其设备传热系数高(蒸发强度大)、低温蒸发效果好、物料停留时间短、适用的粘度范围宽、操作弹性大等优越的性能,在化工、轻工、制药、环保、食品等行业中正逐步得到推广和应用。在薄膜蒸发器数据采集及监测系统的研究中,产生并积累了大量的过程数据,如温度、流量、压力等。如何有效地利用这些信息,并使用这些信息提高生产效率成为迫切需要解决的问题。对这些过程数据进行挖掘,可以从中发现参数的优化及产量、蒸发强度的预测方法等知识,从而指导工程实践。薄膜蒸发过程高度复杂,因此其信息结构表现为高度非线性、强关联性和交错性的特点。这给产品产量预测带来了相当的难度。国内已在生产中使用的系列薄膜蒸发器(F=1~20m~2)的工艺计算由于采用较粗糙的工程估算方法,当各个参数确定时,设计产量与生产产量存在较大误差。另一方面,粗糙集理论是一种处理含糊和不精确性信息的数学工具,它不需要提供所...  (本文共93页) 本文目录 | 阅读全文>>

《哈尔滨师范大学自然科学学报》2019年01期
哈尔滨师范大学自然科学学报

可变多粒度粗糙集粒度约简研究

为了研究可变多粒度粗糙集的粒度约简,首先,提出一个适合各种多粒度粗糙集模型的粒度矩阵定义,围绕粒度矩阵,研究多粒度粗糙集模型的...  (本文共7页) 阅读全文>>