分享到:

关联规则的增量式更新算法

关联规则的开采是一个重要的数据开采问题.目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而对关联规则维护问题的研究工作却很少.在用户开采关联规则的交互过程中,为了找到真正令其感兴趣的  (本文共6页) 阅读全文>>

西南大学
西南大学

基于矩阵的关联规则挖掘算法研究

数据挖掘是致力于数据分析和理解,揭示数据内部蕴涵知识的技术,成为未来信息技术应用的重要目标之一。关联规则是数据挖掘的一个重要研究分支,主要用于描述数据库中数据项之间的潜在联系,有着极其重要的应用价值。自Rakesh Agrawal等人1993年首次提出了关联规则挖掘这个研究课题以来,研究人员已经提出了多种挖掘关联规则的算法:Apriori算法、FP-growth算法,以及基于这两种算法的多种改进方法,但这些算法都是把数据库中各个项目按平等一致的方式加以处理的。而在实际应用中,各个项目在使用者心目中的重要程度往往不同,一个自然的想法就是为每个项目赋予不同的权值,以区分它们的重要程度。鉴于此,本文对加权关联规则挖掘算法进行了研究。另外,在关联规则的实际挖掘过程中,用户往往需要对最小支持度和最小置信度这两个阈值进行不断调整来寻找真正感兴趣的规则;而且数据库中的数据是不断进行添加、修改和删除的,这是一个动态的交互过程。因此,关联规则的更...  (本文共60页) 本文目录 | 阅读全文>>

南昌大学
南昌大学

基于改进FP-树的关联规则增量式更新算法的研究与应用

数据挖掘技术是当今的研究热点,已在诸如商务、医学与工程学等众多领域拥有广泛应用。它能够探查隐藏在数据间的有用信息,帮助分析决策。关联分析作为数据挖掘技术中极其重要的一环,研究成果相对较多。关联分析的主要功能是探查数据集中数据之间的关联,并用关联规则或者频繁项集来表示它们。本文首先对关联规则挖掘算法中的经典算法Apriori算法、FP-增长算法以及FUP算法分别加以介绍。然后对于关联规则增量式更新这一问题提出了一种基于改进FP-树的关联规则增量式更新算法FPmineUA。该算法基于一种不生成条件FP-树的改进FP-树,并将其与增量式更新算法相结合,在对FP-树进行优化的基础上,改进了传统增量式更新算法产生巨大候选项集以及频繁扫描数据库的性能缺陷,提高了时间以及空间的效率。实验表明,随着支持度的降低,FPmineUA算法相比传统增量式更新算法在性能上有一定提升。  (本文共58页) 本文目录 | 阅读全文>>

哈尔滨工程大学
哈尔滨工程大学

关联规则增量式更新算法的研究

关联规则是数据挖掘研究方向的一个关键技术。自Agrawal引入关联规则的概念并提出第一个关联规则算法Apriori算法以来,由于其具有巨大的商业应用价值和理论研究价值,诸多研究人员对关联规则挖掘算法进行了广泛的研究并提出了许多新的关联规则挖掘算法。这些关联规则挖掘算法都是在Agrawal提出的Apriori算法的基础上不断优化、改进,从而使挖掘的效率不断提高。这些经过改进和优化的关联规则挖掘算法虽然各具特点,但同时也存在着许多不足。除此之外,在关联规则挖掘中还普遍存在两个问题:当挖掘的数据不断更新时,如何高效即时地获得所需要的结果?用户在挖掘规则的过程中需要预先设定一些挖掘参数来获取想要的规则,但这些参数设置往往要通过多次的调整才能达到预期的目的,那么如何在多次调整中进行高效的计算呢?关联规则增量式更新算法正是为了解决以上的问题而提出的。本文针对第一个问题,通过对一些关联规则增量式更新算法的研究,并针对FUP算法需要多次扫描原数...  (本文共60页) 本文目录 | 阅读全文>>

重庆大学
重庆大学

利用关联规则增量式更新算法挖掘Web日志

互联网与WWW以惊人的速度迅猛发展,使得设计与维护Web站点的工作日益重要。设计与维护Web站点需要深入分析站点使用情况,使得整个站点结构更加合理,便利用户浏览。尤其是对各类电子商务网站,发现客户浏览的规律从而为用户提供更加个性化的内容关系到网站的生死存亡。Web挖掘将数据挖掘技术应用于大规模Web数据,能够发现有关客户浏览行为的隐藏模式,具有广阔的应用前景。本文针对Web挖掘中的电子商务环境,采用序列关联规则挖掘的方法,提出了一套完整的个性化推荐解决方案,对其中的数据准备、挖掘算法、个性化推荐等阶段都提出了新的见解和方法。① 本文比较系统、完整的分析和论述了数据挖掘技术、关联规则挖掘技术、关联规则的增量式更新算法、Web日志挖掘的方法和Web日志挖掘的体系结构。② 本文针对电子商务环境的特点,研究了数据准备中的数据清理步骤,提出了新的可以提高挖掘效率的清理方法。同时,本文分析了数据准备中的事务识别步骤,针对网络延时的问题,提出...  (本文共52页) 本文目录 | 阅读全文>>

兰州商学院
兰州商学院

基于FP-Tree的关联规则增量式更新算法-BIT算法

随着科技的进步,人们所获得数据的手段越来越多,数据量也越来越大,可是面对这些海量数据进行分析处理的工具却越来越少。数据挖掘技术就是为满足对海量数据分析、处理的需求应运而生的。关联规则是数据挖掘技术中最重要的方法,Apriori算法是关联规则中最经典的一种算法,但Apriori算法需要多次扫描数据库,生成大量候选项集。本文通过深入分析研究关联规则算法,系统分析和总结了关联规则中一些提高算法效率的改进方法。首先,与Apriori算法相比而言,FP-Growth算法利用FP-Tree存储压缩原始事务数据,将挖掘频繁项目集的问题转化成挖掘FP-Tree的问题,减少了扫描数据库的次数,成为广泛应用的关联规则算法。但是FP-Growth算法过于依赖固定的最小支持度和固定的数据库,因此当最小支持度变化或者事务数据库发生变化时,不能直接利用先前挖掘出的频繁项目集,需要重新扫描数据库挖掘新的频繁项目集。最后基于此问题,本文提出了一种BIT(Bat...  (本文共50页) 本文目录 | 阅读全文>>