分享到:

模糊聚类和模糊聚类有效性的研究

由于模糊聚类算法在众多领域内得到广泛应用,因此成为重要的研究课题,备受学者和专家们的关注.而其中模糊C-均值(FCM)聚类算法由于其高效、简单、易于操作,使其成为理论体系成熟完善、应用范围广的模糊聚类算法之一.然而,模糊C-均值聚类算法对初值敏感、容易陷入局部极值以及需要提前指定聚类数是其不容忽视的缺点.本文针对FCM算法所存在的问题,结合粒子群优化和层次聚类分析技术,研究得到一系列新方法,经应用实验结果令人满意.主要包括如下:1.在模糊聚类方面,分别提出基于模糊自适应粒子群优化的FCM算法和基于初始中心点优化选择的FCM算法.基于模糊自适应粒子群优化的FCM算法将FCM算法和模糊自适应粒子群优化算法进行结合,克服FCM算法对初值敏感和容易陷入局部极值的缺点.为验证提出算法的有效性和优越性,将其应用到6个经典数据集上,并将实验结果与FCM算法进行比较,结果表明提出方法从聚类稳定性以及聚类结果方面均优于FCM算法.基于初始中心点优  (本文共75页) 本文目录 | 阅读全文>>

西南交通大学
西南交通大学

模糊聚类有效性研究

数据库技术的不断发展及数据库管理系统的广泛应用,数据库中存储了海量数据。数据作为信息的主要载体在当今信息化社会中扮演着重要的角色。人们希望计算机帮助我们从海量数据中提取有趣的知识、规律或高层信息,帮助我们基于丰富的数据作出决策,由此产生了数据挖掘,并得到广泛的研究。数据挖掘的其中一个重要分支是聚类分析。聚类是指根据“物以类聚”的原理,将样本聚集成不同的组,使同一个组的样本之间应该彼此相似,而不同组的样本之间应足够不相似。传统的聚类对数据的划分比较严格,具有“非此即彼”的性质。然而,许多客观事物具有“亦此亦彼”的性质,比较适合“软”划分,将模糊集理论引入聚类分析,这种软划分具备了较强的理论基础,模糊聚类分析由此产生了。聚类是一种无监督的分类,需要预先设定一些参数,尤其是聚类数c和模糊因子m。评估数据集的模糊划分是否符合客观事实,这属于模糊聚类有效性问题。对模糊聚类来说,有效性问题又往往可以转化为最佳类别数c的决策问题。经典的Xie...  (本文共68页) 本文目录 | 阅读全文>>

厦门大学
厦门大学

模糊聚类算法及其有效性研究

随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据。目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。缺乏挖掘数据背后隐藏的知识的手段,导致了“数据爆炸但知识贫乏”的现象。计算机网络化时代,如何有效、快速地从大量数据中获取我们需要的知识成为了人们关注的焦点。数据供给能力和数据分析能力间的矛盾日益突出,迫切需要一种能够对数据进行深层次加工的自动化技术。数据挖掘技术应运而生。作为数据挖掘的一个重要分支,聚类分析引起了人们的广泛关注,它可以作为独立的数据挖掘工具或者作为其他数据挖掘算法的预处理步骤。聚类是一种无监督的分类,是人们认识社会和自然界的一种重要方法。在现实世界中,许多客观事物之间的界限往往是模糊的,对事物进行分类时就必然伴随...  (本文共82页) 本文目录 | 阅读全文>>

中国地质大学(北京)
中国地质大学(北京)

模糊聚类分析的有效性研究

当今社会已发展成为信息化的社会。信息一般是以数据的形式存在的,数据是信息的载体。因此数据对于信息化社会是相当重要的。大量的数据存在于数据库中,需要使用一定的方法对其进行分类。其中重要的一个分支就是聚类分析。聚类分析的基本原理通俗的来说就是“物以类聚”的原理,就是将一个数据样本根据某一属性值分为相似的“类”的过程。同一“类”中对象彼此相似,而与其它“类”中的对象相异。传统聚类分析方法对“类”的划分要求较为严格,一个对象通常只能属于某一个“类”。然而在现实客观情况下,有些客观对象却具有属于多个“类”的性质,因此对其划分不能用硬性的标准,而要使用“软划分”。于是模糊理论就被引入到聚类分析中来了,使用模糊理论能够从理论上很好的支持这种“软划分”。通常情况下,聚类分析是在无监督的状态下进行的分类。如何对聚类分析中“类”的划分情况是否符合客观事实进行评价。一般来说采用的是有效性评估,即模糊聚类的有效性问题。在模糊聚类中,由于有效性问题研究不...  (本文共52页) 本文目录 | 阅读全文>>

西南大学
西南大学

模糊聚类分析及其有效性研究

聚类分析是非监督模式识别的一个重要分支,模糊聚类由于建立起了样本对于类别的不确定性描述,更能客观地反映现实世界,从而成为聚类分析研究的主流。模糊聚类已经被广泛应用于模式识别、数据挖掘、图像处理等许多领域。本文的研究工作主要包括以下两个方面:1.针对传统模糊核聚类算法没有考虑各维特征对聚类的不同贡献程度,以及易陷入局部最优等缺点,提出一种改进的模糊核聚类算法。该算法构造了一个简单有效的适应度函数,结合遗传算法全局搜索的优点,避免算法陷入局部最优。还为各维特征引入一个权系数,并利用ReliefF算法为特征加权。该算法比传统模糊核聚类算法有较大改进。实验结果表明了其有效性。2.提出一个新的模糊聚类有效性指标。该指标能确定由模糊c均值算法得到的模糊划分的最优划分和最优聚类数。该指标结合了模糊聚类的紧致性和分离性信息。用类内加权平方误差和计算紧致性,用类间相似度计算分离性。在3个人造数据集和3个著名的真实数据集上的对比实验证明了该指标的性...  (本文共53页) 本文目录 | 阅读全文>>

青岛理工大学
青岛理工大学

模糊聚类算法及其聚类有效性的研究

伴随着数据挖掘的发展,对聚类的研究越来越深入。目前存在很多种聚类方法,其中模糊C-均值聚类算法应用最广泛,基于该算法提出了很多改进的算法以达到更好的聚类效果。对于聚类后的效果,需要聚类有效性指标进行评价。针对模糊C-均值聚类算法和聚类有效性指标的研究现状,本文在以下方面进行了改进:(1)针对模糊C-均值聚类算法提出了属性加权的思想。由于数据集中不同的属性对聚类的影响是不同的,因此有必要对属性赋予不同的权重。基于属性加权的思想,本文得到了新的模糊C-均值算法的目标函数、聚类中心和隶属度函数的迭代公式,并通过实验对改进后的聚类进行验证。(2)提出两种新的聚类有效性指标。由于聚类问题的多样性,没有统一的聚类有效性指标衡量所有的聚类结果,只能从不同的聚类有效性指标分别进行改进。本文提出了两种聚类有效性指标,第一种:基于N.Zahid指标,通过改进该指标中的模糊类间分离度和类内紧密度,形成新的聚类有效性指标;第二种:结合Vxie指标、Vb...  (本文共77页) 本文目录 | 阅读全文>>