分享到:

模糊聚类算法及其有效性研究

随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据。目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。缺乏挖掘数据背后隐藏的知识的手段,导致了“数据爆炸但知识贫乏”的现象。计算机网络化时代,如何有效、快速地从大量数据中获取我们需要的知识成为了人们关注的焦点。数据供给能力和数据分析能力间的矛盾日益突出,迫切需要一种能够对数据进行深层次加工的自动化技术。数据挖掘技术应运而生。作为数据挖掘的一个重要分支,聚类分析引起了人们的广泛关注,它可以作为独立的数据挖掘工具或者作为其他数据挖掘算法的预处理步骤。聚类是一种无监督的分类,是人们认识社会和自然界的一种重要方法。在现实世界中,许多客观事物之间的界限往往是模糊的,对事物进行分类时就必然伴随  (本文共82页) 本文目录 | 阅读全文>>

浙江工商大学
浙江工商大学

基于聚类有效性指标的模糊分类评价问题研究

近些年,综合评价技术的理论及实证研究都有了很大的发展,各种评价方法不断推陈出新。事实上,在多指标综合评价中,很多被评价对象某一方面的价值水平本身就是模糊的。而模糊综合评价方法作为综合评价法中不可或缺的一部分,在多指标综合评价中日益发挥着不可替代的作用。事实上,模糊综合评价可以分为模糊排序评价和模糊分类评价,而模糊分类评价主要是指模糊聚类和模式识别两类。随着大数据时代的到来,聚类分析作为数据挖掘技术中一种有效的工具,在实际应用中受到了人们的广泛关注。由于聚类分析是一种无师分类,在对数据集进行聚类分析时事先对数据结构一无所知。所以,对聚类结果进行有效性检验和评价是必不可少的过程。通过聚类有效性分析,不仅可以判断聚类结果是否有效,还能得到最佳聚类结果。本文对模糊聚类的有效性进行了深入的研究,并且在现有的模糊分类有效性指标的基础上,重新定义了一种新的类内紧凑度与类间分离度,以紧凑度和分离度之比构建了一个新的模糊聚类有效性指标。本文从理论...  (本文共83页) 本文目录 | 阅读全文>>

郑州大学
郑州大学

全矢—模糊聚类及其在故障诊断中的应用研究

近年来,旋转机械设备日益大型化、智能化和复杂化,继而针对这些设备展开的状态监测和故障诊断技术也愈加重要。基于同源信息融合的全矢谱分析技术,对多通道的数据进行了融合,能够正确反映转子的真实运动,且与传统的谱分析具有兼容性。同时由于数值算法简单、稳健、快速,更利于进行智能故障诊断。模糊聚类算法是模式识别的一种,作为该类算法中最经典的一种—模糊C均值(FCM)算法,因其对数据集结构及初始值的敏感性,很难得到最佳聚类,鉴于此本文提出了两种改进算法。本文以全矢谱分析为基础,结合改进的FCM算法,并将其应用于旋转机械的故障识别中。主要研究工作如下:1、介绍了全矢谱体系中的平面全矢谱理论及其数值算法;用实验验证了基于全矢谱方法的故障诊断的优势;提出了基于全矢谱技术的特征提取方法,为模糊聚类的准确分类奠定了基础。2、引入密度函数法和核函数法,提出了基于密度函数的模糊核聚类方法(DKFCM),对经典的FCM算法进行了改进,并给出了DKFCM算法的...  (本文共75页) 本文目录 | 阅读全文>>

上海大学
上海大学

可信性聚类算法及其在社会经济案例中的应用研究

“物以类聚,人以群分”,聚类是一个古老的问题,作为模式识别的重要分支,它为人类提供了认识世界、区别不同事物、认识事物间相似性的方法。研究者们依据不同的理论和方法提出不同的聚类方法。模糊聚类对隶属度的定义要明显优于其他聚类算法,目前已广泛应用到股票预测、医学研究、市场营销等诸多领域。本文在对现有的模糊聚类算法进行研究与分析的基础上,将可信性理论引入到模糊聚类中,基于可信性测度的数学性质提出可信性聚类方法及优化模型,并借助交替聚类估计和迭代优化的方法,设计出一系列可信性聚类算法,用以求解所给出的优化模型,最后将其应用到社会经济案例的研究中。本文的主要研究内容和成果包括:1.可信性聚类模型及算法求解。本文将可信性理论引入到模糊聚类中,使用可信性定义数据点对各个类的隶属度,并提出可信性聚类方法。在交替聚类估计方法的启发下,本文给出一类简便易行的聚类算法,以及两个特殊的可信性聚类算法用以求解优化模型。2.可信性聚类的有效性研究。本文使用多...  (本文共94页) 本文目录 | 阅读全文>>

《统计与决策》2011年12期
统计与决策

一种社会经济系统模糊C划分聚类数的确定方法

在社会经济系统建模和分析中,对目标系统进行分解时,适合采用模糊C均值聚类算法进行划分。由于聚类数未知,采用某个聚类有效性函数来确定时,往往聚类结果并不理想。将专家知...  (本文共3页) 阅读全文>>

《清华大学学报(自然科学版)》2006年07期
清华大学学报(自然科学版)

学习非唯一的最佳聚类数

确定“最佳聚类数”一直是聚类算法面临的一个难题。为了确定一族合理的聚类数而不是单个聚类数,提出了一种基于谱分析的算法,并能处理较为复杂的数据集。该算法构建了...  (本文共4页) 阅读全文>>

浙江大学
浙江大学

地理时空大数据高效聚类方法研究

近年来,随着我国空天地立体观测技术的飞速发展,高精度、高频度、大覆盖的超海量地理时空数据呈几何级数爆炸式增长,海量地理时空数据的价值挖掘愈发迫切。聚类作为数据挖掘最主要的方法之一,已成为学术界研究的热点。而面对超大规模地理时空数据的聚类分析,特别是精度不断提高的高分辨率遥感影像及规模不断增加的时空点数据,现有GIS聚类方法欠缺一个用于统一表达地理时空大数据高效聚类过程的聚类框架模型,时空聚类理论和技术面临严峻挑战。本文针对现有聚类方法普遍存在的数据组织不统一、数据划分关联性丢失、大规模数据计算效率低、聚类效果差等缺陷,从数据组织、数据存储、数据划分及计算范式四个方面构建地理时空大数据高性能并行聚类模型体系。综合考虑高分辨率遥感影像中存在的地物对称性和光谱相似性以及时空点数据中存在的宏观连续、微观离散的时空模式,为高分辨率遥感影像及时空点数据分别选取代表性聚类方法,克服现有方法中存在的缺陷,在上述并行聚类模型下进行实现高效聚类。具...  (本文共153页) 本文目录 | 阅读全文>>