分享到:

基于数值属性的关联规则的挖掘

研究了基于数值属性(QuantitativeAtribute  (本文共4页) 阅读全文>>

安徽大学
安徽大学

基于关系数据库的关联规则挖掘算法的研究

随着数据库技术的快速发展,全球范围内的数据存储量急骤上升,激增的数据背后隐藏着许多潜在的信息,然而,缺乏了对数据进行深层次分析的技术,导致了“数据丰富但知识贫乏”的现象。面对这一挑战,数据挖掘技术应运而生。关联规则挖掘是数据挖掘中的一个重要研究内容,其应用极为广泛。最初的关联挖掘仅限于事务数据库,近年来,关系数据库已得到了广泛的应用,研究在关系数据库中挖掘关联规则的技术具有广阔的发展前景。目前在关系数据库中挖掘关联规则的常用方法是:先将关系数据库转换为事务数据库,对关系数据库中的量化属性转换为布尔属性,再利用布尔型关联挖掘算法进行挖掘,该方法以较为成熟的布尔型关联挖掘算法为基础,是较好的解决方案。但现有的方法中大多在转换后直接将经典的Apriori算法或其变形应用其中,忽略了关系数据库中的关联规则的自身特点,从而影响了挖掘效率。基于以上背景,文章深入分析了关系数据库中关联规则的特点,并在Apriori算法思想的基础上,给出了一种...  (本文共78页) 本文目录 | 阅读全文>>

河北工业大学
河北工业大学

面向客户流失预测的关联规则挖掘算法应用研究

随着我国电信企业运营机制的全面调整,电信业竞争更激烈。电信企业之间的争夺加剧了客户离网行为,客户离网成为影响电信公司经营状况的一个重要因素。利用数据挖掘技术科学地分析那些已经流失的客户的特征,从而预测在网客户的流失倾向,已成为电信业的一个重要研究内容。而关联规则挖掘算法基于自身的诸多优势,成为目前电信客户流失预测应用中最具有前景的数据挖掘技术之一,也得到了越来越多研究者的关注。本文通过对电信业客户流失预测和关联规则挖掘算法的文献综述,分析了现有研究中仍然存在的问题,并重点对现有关联规则挖掘算法无法高效率地对数量少、但客户价值大的电信客户进行流失预测进行了剖析,提出了一种基于数据属性约减和概率的加权多维关联规则挖掘改进算法,并进行了实验仿真,验证了算法的有效性。本文的具体贡献有如下几个方面:第一,通过对电信业客户流失预测及关联规则挖掘算法的研究综述,分析了现有关联规则挖掘算法的分类和关联规则价值的衡量,并主要针对现有多维关联规则挖...  (本文共55页) 本文目录 | 阅读全文>>

重庆交通大学
重庆交通大学

Hadoop下基于数量关联规则的数据挖掘研究

伴随着大数据时代的到来,不仅数据规模变得庞大,数据种类变得多样化,数据维度也在不断增长。从海量、多类型、多维度的混合数据中挖掘出有价值的信息是信息化社会发展的趋势。但是在海量、多类型、多维度数据基础之上采用传统的机器学习算法已经不能满足在有限的时间内完成要解决任务的要求。因此,必须寻求新的方法来解决此问题。目前,基于云计算的海量数据挖掘技术,已得到工业界和学术界的普遍认可。基于Apache软件开源组织Hadoop云计算平台的数据挖掘技术也成为了工业界和学术界共同关心的热点技术之一。本文在研究数据挖掘理论和Hadoop分布式技术基础之上,利用Hadoop提供的MapReduce分布式计算模型,以分类型和数值型混合多维数据为基础,以关联规则和聚类分析为研究对象,实现了基于Hadoop云计算平台的数据挖掘算法研究,主要完成了以下几方面的工作:1)针对分类型和数值型混合多维数据,提出了一种基于Hadoop的数据预处理架构,实现了数据预处...  (本文共82页) 本文目录 | 阅读全文>>

哈尔滨工程大学
哈尔滨工程大学

面向审计领域的关联规则技术研究与应用

作为数据挖掘领域的重要研究分支,关联规则用于发现数据项间隐含的相关性。为了丰富传统关联规则所能表达的知识,本文将数量关联规则与负关联规则的研究重点相结合,探讨基于数值属性的一般化关联规则的挖掘方法及策略。并将提出的挖掘算法应用于审计社保数据库,发现审计数据项间的相关性,分析规则的审计意义。本文分别对关联规则的理论研究现状及领域应用现状进行介绍,并对经典的挖掘算法进行分析。重点借鉴数量关联规则与负关联规则的研究思想,在给出基于数值属性的数据集的有效处理策略后,提出一种无需扩充数据集便可同时挖掘出正、负频繁项集的Apriori_PN算法。由频繁项集生成关联规则的过程中,引入差异兴趣度来度量产生的规则的客观有用程度,基于这样的思想提出一般化关联规则挖掘算法GAR_I。在挖掘审计关联规则时,首先给出适合于审计数据特点的离散化算法DISC_S对数据进行离散化,然后,在此基础上运用Apriori_PN及GAR_I算法挖掘出审计关联规则,试图...  (本文共62页) 本文目录 | 阅读全文>>

重庆大学
重庆大学

关联规则挖掘在高炉炉况预测中的应用研究

长期稳定顺行的炉况是高炉高产低耗的先决条件,也是延长高炉寿命的基本保证条件。高炉炼铁过程在一个密闭的容器内进行,炉内物理、化学过程极其复杂,炉内状态无法直接观察。降低高炉能耗,实现炼铁生产稳定和优化,必须及时准确地预报高炉炉况,使运行人员能及时采取措施。因此,利用数据挖掘技术科学地分析和预测高炉炉况,已成为一个重要研究内容。鉴于高炉冶炼过程的复杂性,关联规则挖掘算法有其自身诸多优势,受到国内外学者的关注。因关联规则很少涉及时间性,本文提出时态关联规则的概念,用于解决高炉炉况预测问题。在此基础上,构造了一种体现数据时间价值的加权时态关联规则,以使规则的发现体现一种时间趋势,仿真试验表明了其有效性。其他成果如下:①对现有的高炉炉况预测问题进行介绍,针对其中规则制定方法缺乏相关性,提出了多维关联规则算法。②根据高炉实际运行情况,选取数据源,进行属性约减,选取炉况预测相关的属性构成数据表。降低关联规则维数,减少冗余记录数,高效产生有价值...  (本文共63页) 本文目录 | 阅读全文>>