分享到:

基于粒计算理论的数据挖掘模型研究

数据挖掘是从存放在数据库、数据仓库或其它信息库中的大量数据中挖掘有趣知识的过程。在众多的数据挖掘方法中,粒计算不失为一种有效的方法。粒计算涵盖了所有有关粒的理论、方法、技术和工具的研究。所谓粒,就是一组对象,它通过不分明性、相似性或功能性被链接到一起。粒计算的内容包括两个主要的方面,粒的构建和使用粒的计算。前者处理粒的形成、表示和解释,后者处理怎样利用粒进行问题求解。目前,对粒计算的研究已取得了不少成果,研究的主要方法有Rough集理论、模糊集理论和商空间理论等。Rough集的创立和发展,大大地影响和推动了粒计算的研究和发展,Rough集提出后,立即发现它在数据分类和约简上有成功的应用,并且迅速反映到用粒计算理论来研究这些分类和约简似乎更为得当,因此,近些年粒计算极快的形成了国内外学术界研究的热点。作者主要从Rough集理论上对粒计算理论进行探讨。本文首先回顾经典的Rough集理论,并根据当前信息系统多呈现不完备性的特征构建一种  (本文共67页) 本文目录 | 阅读全文>>

武汉理工大学
武汉理工大学

基于粒计算的数据挖掘研究及应用

数据挖掘技术具有较高的有效性和良好的可操作性,被广泛应用于各个领域。近年来,基于数据挖掘技术的研究方法不断涌现:如基于决策树分类、统计分类、贝叶斯分类、神经网络等方法均能有效解决小规模数据库的数据挖掘问题。面对海量数据处理,人们提出了用不同粒度或不同概念层观测问题,从不同的粒度中得到不同层次的信息和知识,满足人们对不同层次知识的要求。粒计算是人工智能领域中的一种新理念和新方法。粒计算方法凭借自身的特质在数据挖掘中显示出较大的优势。它主要用于解决海量数据的挖掘和复杂问题的求解,通过系统访问粒结构来解决问题。本文在对数据挖掘和粒计算相关技术进行深入研究的基础上,将粒计算与数据挖掘方法相结合,建立了基于粒计算的数据挖掘模型,给出基于粒计算的数据挖掘模型的关联规则算法。应用此方法对阅马场城市隧道监控交通数据信息数据挖掘方法进行改进,构建了基于粒计算的商空间挖掘模型,结合时间粒度概念进行了相关划分。研究工作表明,运用此方法对数据仓库在不同...  (本文共75页) 本文目录 | 阅读全文>>

鲁东大学
鲁东大学

基于粗糙集和粒计算的不完备数据挖掘研究

不完备数据在现实世界的各个领域中广泛存在,如何正确分析不完备数据带来的不确定性,并从中获取对人们行为或决策有用的知识一直是数据挖掘领域的研究热点。粗糙集已被证明是一种能够有效处理不精确、不完备数据的数学工具,而粒计算作为一种新型的智能计算理论,可以从不同层次和视角对问题进行处理,为不确定数据的处理提供了有效的机制,但是目前基于粒计算理论的不完备数据挖掘研究成果相对较少。本文面向不完备数据挖掘问题,采用粗糙集和粒计算相结合的研究方法,在求核与属性约简等问题上进行了相关理论分析和实验验证,所做的工作主要有以下几方面:1、基于阈值的差别矩阵求核算法。首先基于不完备决策表,给出了新的差别矩阵定义,将差别矩阵元素中的属性分为两类;然后引入属性的综合分类能力的概念并设定阈值;最后从差别矩阵的单属性元素中分两步得到核属性集合。实验表明新的求核方法可以避免那些对决策表分类作用很小的属性被判定为核属性,因此更具有客观性,可以保证后续挖掘结果的可靠...  (本文共74页) 本文目录 | 阅读全文>>

北京交通大学
北京交通大学

面向本体学习的粒计算方法研究

随着Web发展,面向主题的领域数据源(本文称为领域信息系统)不仅越来越多,而且其包含的信息非常丰富。这类数据源可以归属于半结构化数据源,具有内部结构不完整、内容不完备或不精确或不确定、数据量大、动态和分布式存储等特点。如今,从这类数据源中用于实现知识抽取和知识表示的方法正变得日益重要。然而,现有的本体学习方法基本上是基于非结构化和结构化数据源下提出的,对半结构化数据源进行本体学习时一般按基于非结构化方法进行相应处理,而没有充分考虑半结构化数据源本身具有的隐含结构特征。从现有的文献资料看很少专门介绍基于半结构化数据源的本体学习方法与技术的阐述。因此,从领域信息系统中实现知识抽取以构建近似本体必然给本体学习算法带来很大的挑战。另一方面,虽然在粒计算数据挖掘方面有不少学者进行了广泛深入的研究,但从领域信息系统这类数据源中进行基于粒计算的数据挖掘方法研究还不多见。由于粒计算在不完备、不确定信息处理和对复杂问题近似求解方面具有特殊的优势,...  (本文共181页) 本文目录 | 阅读全文>>

南昌大学
南昌大学

基于信息粒与粒计算理论的数据约简研究

在20世纪80年代末期人们就意识到,信息系统中的信息量积累越来越大,以至造成信息爆炸的危险。信息系统约简主要是使信息量减少,将一些无关或多余的信息丢掉而不影响其原有功能。粒计算理论是上个世纪70年代由模糊集创始人美国学者L.A.Zadeh首先提出,用来解决现实世界中信息的不连续性问题。目前,粒计算已经成为Rough集理论研究的一个热点,它为Rough集理论在数据约简的应用中将发挥重要作用。本文主要针对Rough集理论本身以及粒计算理论进行了研究,并对Rough集理论和粒计算理论在数据约简的应用中作了有意义的探索。本文的创新之处在于:1)提出了基于二进制粒计算的数据约简算法。2)以粒计算理论为依据在一国外经典的汽车数据库中进行数据约简,提取出合适的决策规则。全文共分为五个部分:第一部分讨论了数据挖掘的概念、数据挖掘的过程、常用到的一些技术和工具以及目前研究的热点和未来研究方向。第二部分讨论了Rough集基本理论、Rough集的拓广...  (本文共87页) 本文目录 | 阅读全文>>

南昌大学
南昌大学

粒计算在私有数据保护中的应用研究

随着互联网上收集和使用个人信息变得越来越容易,个人信息的公开对未授权的用户来说,即使不是故意地,也可能会导致个人隐私权的问题。当然,如果使用的恰当,这些数据对于科学家们、分析师们以及决策者们来说是非常宝贵的资源。所以,假如没有有效的防御措施的话,隐私信息被侵犯的可能性则很大。因此,寻求对隐私信息的公开发布与关键内容的隐含化之间的平衡,就显得尤其重要。粒计算(Granular Compuling,GrC)是信息处理的一种新的概念和计算模式,其基本思想是在不同的粒度层次上进行问题求解。本文在深入研究粒计算的基础上,将其应用到隐私保护这一新的领域中,旨在探索出一种基于粒计算的隐私保护方法。本文针对不完备信息系统采用基于粗糙集粒计算模型来进行隐私保护的研究。首先,在研究粒计算理论及粒计算相关模型的基础上,提出了基于约简属性来构建层次相容粒度空间的方法,并设计了相应算法。该方法根据约简属性的幂集来构建各层次粒度知识,为后续的算法做好准备。...  (本文共72页) 本文目录 | 阅读全文>>