分享到:

关联规则挖掘方法的研究及应用

本文在数据挖掘研究和关联规则挖掘研究背景下,展开了对关联规则挖掘方法的研究及应用工作,重点研究了关联规则最大频繁项目集、有序模式、用户关联和支配关联规则的挖掘方法及应用等问题,具体包括:(1)对数据挖掘技术,特别是关联规则挖掘技术研究进行了全面综述;(2)关联规则最大频繁项目集发现的问题的研究,提出了采用改进集合枚举树描述项目集、结合双向搜索策略、利用非频繁项目集对候选最大频繁项目集进行剪枝的快速发现最大频繁项目集的算法。(3)挖掘和应用有序模式问题的研究,将关联规则频繁模式的概念扩展到有序模式问题,给出了有序模式的挖掘方法,进而提出并实现了应用有序模式进行数据清洗的方法;(4)推荐系统中挖掘用户关联规则问题的研究,提出并实现了基于两阶段计数的用户关联挖掘框架和算法;(5)挖掘和应用支配关联规则问题的研究,将关联规则的一般形式扩展到支配关联规则,给出了挖掘支配关联规则的方法,提出了应用支配关联规则进行未知标准值预测的方法。本文的  (本文共124页) 本文目录 | 阅读全文>>

电子科技大学
电子科技大学

空间关联规则挖掘算法的研究与应用

空间数据挖掘是从空间数据库中提取隐含的预测信息,找出最有价值的知识来指导科学决策,这已经成为人们研究和应用的热点;在空间关联规则挖掘中,基于空间事务的挖掘方法虽是目前应用较为广泛的技术,然而频繁项目集的构建和修剪技术是其用于海量空间数据挖掘的难点之一。随着数字化电力系统的快速发展,空间数据挖掘在电力系统中的应用已成研究的重点;在电网可视化管理系统中,拓扑分析搜索的节点和线元素数目是影响电网分析效率的主要因素;由于现有的挖掘算法存在不足,其不能有效地提高拓扑分析的速度,故需研究有效的空间关联规则挖掘算法,用在电网可视化管理系统中提高电网分析的效率。针对空间关联横向挖掘中存在的不足,即现有的空间横向挖掘算法,虽改进了候选频繁项的构建和修剪技术,但其不能有效地提取包含空间对象个数较多的单层横向空间关联规则;论文首先提出一种基于交替搜索的空间事务挖掘算法ASTMAS (An algorithm of spatial transactio...  (本文共100页) 本文目录 | 阅读全文>>

兰州交通大学
兰州交通大学

模糊预测模型在动态关联规则挖掘中的应用

随着计算机、通信和Internet技术的迅猛发展,以及日常生活自动化技术的广泛使用,多类型的数据正在以空前的速度产生和被收集着。数据挖掘正是通过分析存储在数据库中的数据,来揭示其中暗含的未知信息和验证已知规律,进而辅助决策的制定。在数据挖掘领域中,关联规则作为最早最活跃的研究方向,已成为当前的热门研究点。早期的关联规则挖掘忽略了时间因素,是一种建立在事务数据库之上的静态挖掘方法,它认为挖掘所得的规则将永久有效。但在不断地应用、研究及总结后得出,现实生活中基于数据库挖掘出的规则都跟时间有着密切的相关性。因此,为进一步掌握规则随时间变化的特点,研究者提出了动态关联规则的概念。动态关联规则挖掘依据年、月、日等时间粒度划分事务数据集,并加入了支持度向量以及置信度向量,将其作为新的规则的评价指标。然而,尽管考虑到了时间因素,但这种传统的建立在已有数据上的挖掘并不能确保规则在将来的时效性。另外,不少研究者将动态关联规则的研究重点主要放在了挖...  (本文共64页) 本文目录 | 阅读全文>>

辽宁师范大学
辽宁师范大学

关联规则挖掘方法的研究与应用

关联规则挖掘作为数据挖掘研究方向的重要分支,是最热门的研究方法之一。由于关联规则挖掘方法可以发现不直接表观出来的数据间的联系,其在零售商业,Web挖掘和文本挖掘等领域有着广泛的研究应用。随着移动通信和互联网技术的迅猛发展,数据的规模也在不断增长,传统的关联规则挖掘方法无法适应数据规模较大的分析应用,如何改进关联规则挖掘方法以适应大数据量的需求已经成为数据挖掘领域的热点之一。本文在介绍了关联规则挖掘方法的相关概念和方法,详细对关联规则挖掘方法Apriori算法的相关知识和存在的问题进行总结,对算法效率的提高进行深入研究,本文研究工作内容如下:第一、传统的关联规则Apriori算法在生成频繁项集时需要多次扫描数据库,造成时间和资源的过度消耗。本文提出一种优化数据库编码规则的关联规则MRS-Apriori算法,该规则根据频繁项集来规范编码事务数据集,将事务数据项中不满足最小支持度的项删除,同时,增加一种判断标记(Judgemark),...  (本文共46页) 本文目录 | 阅读全文>>

西安电子科技大学
西安电子科技大学

数据挖掘中关联规则挖掘方法的研究及应用

“数据爆炸、知识贫乏”是信息时代所面临的一个严峻的问题,而数据挖掘是解决该问题的一种十分有效的手段。该技术能从大规模的数据量中获取有用的信息,发现隐含的、先前未知的、对决策有潜在价值的知识以指导实际问题的求解,因此对数据挖掘技术的研究有着重要的应用意义。本文以数据挖掘中一个重要的领域——关联规则的挖掘为研究主题,理论结合实际应用对关联规则的挖掘方法进行了研究和分析。本文的研究工作主要包括以下四个方面:1.研究设计了“基于约束的最大频繁项集挖掘算法”,以解决数据量巨大,不能有目的,有侧重地进行挖掘的不足;2.研究设计了“基于频繁闭项集的增量式维护算法”,用于解决当数据库发生变化时,如何利用已发现的关键信息来快速地实现结果更新的问题;3.针对传统的数值型关联规则在挖掘过程中属性区间划分不尽合理的问题,本文深入研究了定性定量转换模型——云模型,对基于云模型的不确定性推理机制及云发生器的相应算法进行了研究;4.将理论方法与实际应用相结合...  (本文共90页) 本文目录 | 阅读全文>>

西北大学
西北大学

多最小支持度关联规则挖掘的研究与应用

数据挖掘(Data Mining)就是从大量数据中提取或“挖掘”知识。数据挖掘被信息产业界认为是信息系统最重要的研究和应用领域之一,也是信息产业界最有前途的交叉性学科之一。关联规则(Association Rule)是数据挖掘中一个重要的研究内容,而多最小支持度关联规则挖掘(Mining Association Rules with Multiple Minimum Supports)作为关联规则挖掘的一个新的研究课题,用于发现稀有项之间的关联规则,正逐步受到人们的重视。本文在总结和分析其他关联规则挖掘算法的基础上,分析总结了多最小支持度关联规则挖掘的性质,并给出了相关的定理及证明。针对多最小支持度关联规则挖掘性质,提出了一种项集枚举二叉树(SEB-tree)结构模型,用于压缩存储待挖掘的数据集,同时提出了一种基于SEB-tree的多最小支持度关联规则挖掘算法MSTApnod。实验证明,MSTApriod算法在针对较大规模数据集...  (本文共74页) 本文目录 | 阅读全文>>