分享到:

基于粗糙集的信息粗传递

0引言波兰数学家Z.Pawlak在1982年提出粗糙集理论[1],给出了粗糙集的一般结构。粗糙集理论作为一种处理不确定、不精确和不完全数据的数学理论,已被成功地应用于数据挖掘、知识发现、机器学习、决策分析及模式识别等领域[2-3]。近几年,由于实际问题的需要,粗糙集理论和应用又得到了迅速发展[4-7]。在现实世界中,人们对很多事物的认识是不精确和不完全的。因此,任给概念X U,U为非空有限论域,由于人们知识的限制,不同的人对概念X有不同理解和认识,因而在信息传递时不能进行精确传递,使信息传递出现粗糙性,这种传递称为粗传递[8]。在实际中进行信息传递时,我们常常会遇到两种情况:一是我们需要准确可靠的信息,不能是模糊的;一是我们不能丢失任何可能有用的信息,以免造成损失。对这两种实际情况下的信息粗传递,我们自然提出如下问题(1)粗糙集能用来描述和研究这两种情况下的粗传递吗?(2)如何用粗糙集描述这两种情况下的粗传递?(3)什么情况下粗...  (本文共6页) 阅读全文>>

山东大学
山东大学

信息粗传递及其特征

人类认识、推理和作决策都是在大量的信息中进行的,人类所具有的分析问题和解决问题知识是有粒度的。在现实世界中,人们对很多事物的认识是不精确和不完全的。粗糙集理论被认为是一种处理不精确、不确定、模糊性知识的新的数学工具。相对于概率统计、证据理论、模糊集等处理含糊性和不确定性问题的数学工具而言,粗糙集理论的主要优点之一在于它不需要关于数据的任何预备或额外的信息,没有人的干预,尊重知识的原貌。粗糙集为人们研究粗信息和它的特性提供了理论支持。本论文共分六章,分别研究了两种实际信息传递背景下精确概念的静态粗传递,动态粗传递及模糊概念的动态模糊粗传递,粗集的不确定性度量与变异粗集的数值特征。第一章介绍了粗集、变异粗集、S-粗集的基本概念及发展概况。第二章讨论了信息的静态粗传递问题。根据两种实际信息传递情况,利用Z.Pawlak粗集理论建立了两种静态粗传递模型、给出了这两种模型的性质及应用。得到了粗传递信息不变定理,信息损失定理,信息增益定理,...  (本文共270页) 本文目录 | 阅读全文>>

《计算机工程与设计》2008年13期
计算机工程与设计

基于粗糙集和信息增益的决策规则生成

0引言属性集的约简是粗糙集理论的关键问题之一[1]。属性约简的方法有很多如:王珏等提出的基于差别矩阵的属性约简策略,苗夺谦提出的基于属性互信息的MIBARK算法等[2-3]。基于差别矩阵的属性约简能约简冗余属性,减少冗余规则的产生,给推理过程提供了方便。但是若决策表过大,则差别矩阵的计算量变大,计算复杂性增加。MIBARK算法具有较好的约简效果,但是在确定属性约简集时,计算过程中多次用到知识的熵及互信息的比较,计算繁琐。本文利用信息增益对决策表进行属性相关分析,删除信息量较少的属性,然后利用差别矩阵的方法进行属性约简,并运用相关系数分析得出决策规则。实例对比分析表明,基于信息增益分析的差别矩阵的属性约简可节省存储空间,减小属性约简复杂度,缩短计算时间。1基本概念[4-7]定义1(不可分辨关系)设信息系统=,,集合,,且=,且=,其中称为条件属性集,称为决策属性集,则DS=(,,,)为一个决策表。其中为论域,A是一非空有限对象集,...  (本文共3页) 阅读全文>>

《计算机工程与应用》2007年01期
计算机工程与应用

基于粗糙集的故障诊断特征提取

1引言随着设备结构日趋复杂,其故障类别越来越多,反映故障的状态、特征也相应增加。在实际诊断过程中,为了使诊断准确可靠,总要采集尽可能多的数据样本,以获得足够多的信息。但是,数据样本的分类边界常常是不确定的,并且故障与征兆之间的关系往往也是不确定的。因此,需要进行故障特征提取,从数据样本中提取对诊断故障贡献最大的信息。故障特征提取的方法受到了广泛的重视。研究成果很多[1,2]。有主元特征提取,基于人工神经网络的提取,模糊信息优化处理提取及基于互信息熵提取方法等。但是,主元特征提取会因为输入变量的变化而改变主分量的特征值计算结果;当特征输入太多时,基于人工神经网络的方法存在耗时费工以及合适的网络结构选取问题;模糊信息优化处理和基于互信息熵的方法需要预先确定隶属函数或数据样本的概率分布。粗糙集(Rough Set,RS)理论由波兰的Z.Pawlak教授于上世纪80年代初提出[3],被认为是处理模糊和不确定性问题的新的数学工具,近年来在...  (本文共4页) 阅读全文>>

《电脑知识与技术(学术交流)》2007年07期
电脑知识与技术(学术交流)

粗糙集理论在心脏病诊断中的应用

1引言粗糙集(Rough Set)理论是波兰数学家Z.Pawlak在1982年提出的一种可以分析模糊和不确定问题的数学理论[1]。这一理论从新的视角出发对知识进行了定义,它把知识看作是关于论域的划分,并引入代数学中的等价关系来讨论知识。它提供了一整套方法,从数学上严格地处理数据分类问题,是一种比较适用的归纳、分类方法。这个理论的特点是:无需提供除问题所需处理的数据集合之外的任何信息。随着粗糙集理论的日趋成熟,它在各个方面的应用也越来越广泛,例如大气质量预测分析、股票数据分析、模式识别、地震预报、空间数据分类以及医学上面的各种病情分析诊断等等[2,3]。本文就是叙述粗糙集理论在心脏病诊断中的应用。2粗糙集理论的相关概念[4]2.1知识与不可分辨关系在粗糙集理论中,“知识”被认为是一种分类的能力。不可分辨关系的概念是粗糙集理论的基石,它揭示出论域知识的颗粒状结构。假定我们具有关于论域的某种知识,并使用属性及其值来描述论域中的对象,如...  (本文共2页) 阅读全文>>

《模糊系统与数学》2007年06期
模糊系统与数学

基于覆盖粗糙集理论中的约简与求核

1引言粗糙集理论是由波兰数学家Paw lak于1982年提出的一种用确定性方法来处理不确定性知识的理论方法,它可从数据或经验中获取知识,在基于知识的各种信息系统中占有独特的优势。目前,粗糙集理论已被成功应用于机器学习、决策分析、过程控制、模式识别与数据挖掘等领域[1,2]。经典的粗糙集理论以等价关系为基础,但在很多实际问题中,等价关系看起来过于严厉以致于限制了Paw lak粗糙集模型在很多领域的应用,为解决这个问题,人们相继提出变精度粗糙集模型,程度粗糙集模型,基于一般二元关系的粗糙集模型等。其中,Zakow sk i从实际应用出发,提出覆盖粗糙集模型并讨论了相关性质[3-6]。2003年,W illiam Zhu和FeiyueW ang在覆盖粗糙集的基础上给出了约简的概念和方法[7],并证明了一个覆盖通过约简得到的最简覆盖是唯一的,而且最简覆盖相同的两个覆盖产生相同的覆盖上、下近似。这说明:他们给出的覆盖约简方法是信息系统和数...  (本文共5页) 阅读全文>>

《自动化学报》2007年03期
自动化学报

实域粗糙集理论及属性约简

1引言在Pawlak粗糙集理论[l,2]或其他的扩展粗糙集理论,如可变精度粗糙集Is]和相容粗糙集理论l’]的研究中,属性值的离散化或量化问题是一个重点研究问题.而离散化过程中断点集的选取是离散化效果优劣的关键.这是因为断点的存在使得离散化对噪声非常敏感.如果断点的位置很微妙,数据被噪声污染前后的大小恰好位于断点位置的前后,而这类断点又很多的话,那么离散化数据表前后的差别就很大了.因此离散化的优劣对于问题的解决影响很大.为了避免离散化不当造成不良后果,本文提出了实域粗糙集理论.对于属性值集为连续实数的决策系统,它不需要经过离散化过程,而根据属性的特征定义了属性的广义重要度,从而可以重新度量空间中样本之间的相似性距离,然后以广义欧氏距离为基础构成了空间中的广义近邻关系,在此关系下定义了实域粗糙集及集合的关系和性质.另外,本文给出了实域粗糙集理论的属性约简的定义,它与Pawlak粗糙集理论的属性约简定义不同.实域属性约简是以全局的一...  (本文共6页) 阅读全文>>