分享到:

模糊聚类有效性研究

数据库技术的不断发展及数据库管理系统的广泛应用,数据库中存储了海量数据。数据作为信息的主要载体在当今信息化社会中扮演着重要的角色。人们希望计算机帮助我们从海量数据中提取有趣的知识、规律或高层信息,帮助我们基于丰富的数据作出决策,由此产生了数据挖掘,并得到广泛的研究。数据挖掘的其中一个重要分支是聚类分析。聚类是指根据“物以类聚”的原理,将样本聚集成不同的组,使同一个组的样本之间应该彼此相似,而不同组的样本之间应足够不相似。传统的聚类对数据的划分比较严格,具有“非此即彼”的性质。然而,许多客观事物具有“亦此亦彼”的性质,比较适合“软”划分,将模糊集理论引入聚类分析,这种软划分具备了较强的理论基础,模糊聚类分析由此产生了。聚类是一种无监督的分类,需要预先设定一些参数,尤其是聚类数c和模糊因子m。评估数据集的模糊划分是否符合客观事实,这属于模糊聚类有效性问题。对模糊聚类来说,有效性问题又往往可以转化为最佳类别数c的决策问题。经典的Xie  (本文共68页) 本文目录 | 阅读全文>>

中国地质大学(北京)
中国地质大学(北京)

模糊聚类分析的有效性研究

当今社会已发展成为信息化的社会。信息一般是以数据的形式存在的,数据是信息的载体。因此数据对于信息化社会是相当重要的。大量的数据存在于数据库中,需要使用一定的方法对其进行分类。其中重要的一个分支就是聚类分析。聚类分析的基本原理通俗的来说就是“物以类聚”的原理,就是将一个数据样本根据某一属性值分为相似的“类”的过程。同一“类”中对象彼此相似,而与其它“类”中的对象相异。传统聚类分析方法对“类”的划分要求较为严格,一个对象通常只能属于某一个“类”。然而在现实客观情况下,有些客观对象却具有属于多个“类”的性质,因此对其划分不能用硬性的标准,而要使用“软划分”。于是模糊理论就被引入到聚类分析中来了,使用模糊理论能够从理论上很好的支持这种“软划分”。通常情况下,聚类分析是在无监督的状态下进行的分类。如何对聚类分析中“类”的划分情况是否符合客观事实进行评价。一般来说采用的是有效性评估,即模糊聚类的有效性问题。在模糊聚类中,由于有效性问题研究不...  (本文共52页) 本文目录 | 阅读全文>>

西南大学
西南大学

模糊聚类分析及其有效性研究

聚类分析是非监督模式识别的一个重要分支,模糊聚类由于建立起了样本对于类别的不确定性描述,更能客观地反映现实世界,从而成为聚类分析研究的主流。模糊聚类已经被广泛应用于模式识别、数据挖掘、图像处理等许多领域。本文的研究工作主要包括以下两个方面:1.针对传统模糊核聚类算法没有考虑各维特征对聚类的不同贡献程度,以及易陷入局部最优等缺点,提出一种改进的模糊核聚类算法。该算法构造了一个简单有效的适应度函数,结合遗传算法全局搜索的优点,避免算法陷入局部最优。还为各维特征引入一个权系数,并利用ReliefF算法为特征加权。该算法比传统模糊核聚类算法有较大改进。实验结果表明了其有效性。2.提出一个新的模糊聚类有效性指标。该指标能确定由模糊c均值算法得到的模糊划分的最优划分和最优聚类数。该指标结合了模糊聚类的紧致性和分离性信息。用类内加权平方误差和计算紧致性,用类间相似度计算分离性。在3个人造数据集和3个著名的真实数据集上的对比实验证明了该指标的性...  (本文共53页) 本文目录 | 阅读全文>>

厦门大学
厦门大学

模糊聚类算法及其有效性研究

随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据。目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。缺乏挖掘数据背后隐藏的知识的手段,导致了“数据爆炸但知识贫乏”的现象。计算机网络化时代,如何有效、快速地从大量数据中获取我们需要的知识成为了人们关注的焦点。数据供给能力和数据分析能力间的矛盾日益突出,迫切需要一种能够对数据进行深层次加工的自动化技术。数据挖掘技术应运而生。作为数据挖掘的一个重要分支,聚类分析引起了人们的广泛关注,它可以作为独立的数据挖掘工具或者作为其他数据挖掘算法的预处理步骤。聚类是一种无监督的分类,是人们认识社会和自然界的一种重要方法。在现实世界中,许多客观事物之间的界限往往是模糊的,对事物进行分类时就必然伴随...  (本文共82页) 本文目录 | 阅读全文>>

《武汉大学学报(信息科学版)》2009年04期
武汉大学学报(信息科学版)

遥感影像分类中的模糊聚类有效性研究

通过不同遥感影像对常用的模糊聚类有效性指数进行测试,检验这些指数能否适用于遥感影像分...  (本文共4页) 阅读全文>>

江南大学
江南大学

模糊聚类有效性研究

聚类是模式识别、机器学习和图像处理等领域的重要研究内容。聚类分析已经成为聚类领域的研究热点,受到了国内外学者的广泛关注。其中,模糊聚类由于引进模糊集概念,能够有效处理现实中的模糊性问题,已经成为聚类分析中不可或缺的一部分。模糊C-均值聚类算法(Fuzzy C-Means,FCM)是模糊聚类最常用的实现算法之一。FCM算法设计简单,运行效率高,可以有效地处理大数据集,在模糊聚类算法中占据非常重要的地位,但是该算法在某些方面还存在一些欠缺,比如需要预先给定最佳聚类数、不同的模糊度m会导致不同的聚类数结果等缺陷。针对以上缺点,目前主要通过聚类有效性进行验证,以判断聚类结果的好坏。聚类有效性分析主要通过提出合适的聚类有效性指标,作为算法的判断依据,但是现有的聚类有效性指标大多数只能处理分离性较好的数据集,对于噪声污染以及多类型结构并存的数据集,无法有效地做出正确判断。因此,本文从多角度分析,寻找更加合适的聚类有效性指标,使得FCM算法能...  (本文共64页) 本文目录 | 阅读全文>>