分享到:

面向数据挖掘的遗传算法的研究与应用

在商务智能系统中,传统的聚类分析虽已广泛地应用,但还存在一些问题,例如处理大数据量时收敛较慢,以及容易陷入局部极小值,即早熟问题。针对这些问题,本文提出了一种基于改进型遗传算法的聚类分析方法,并应用于一种面向中小型企业的联机分析处理系统HBIOLAP,实验表明,该算法具有较好的聚类质量和综合性能。首先,论文详细介绍了面向数据挖掘的相关技术,并对现有聚类分析技术进行了比较和说明。其次,针对现有聚类分析的收敛慢和早熟问题,提出了基于改进型的遗传算法的聚类分析,包括染色体的编码,适应度的计算,交叉及变异算子,同时对该算法的性能与其他聚类分析算法做了比较,实验结果表明,该算法具有较好的聚类质量和综合性能。最后,阐述了面向中小型企业的联机分析处理系统HBIOLAP的设计与实现,该系统包括了联机分析处理模块和聚类分析模块。并在具体的应用场景中,对超市销售数据进行挖掘,结果表明基于改进型的遗传算法的聚类分析在超市销售系统的实际应用中取得了良好  (本文共60页) 本文目录 | 阅读全文>>

中国石油大学
中国石油大学

数据挖掘在油田措施规划中的建模研究

随着油田开发的不断深入,为保证企业在稳产的前提下取得较好的生产效益,急需对油田措施进行合理规划。油田措施规划的关键是建立科学合理的规划预测模型。目前常用的均为固定数学模型,预测精度低。措施效果预测的本质是一个复杂的非线性系统建模问题,数据挖掘中的人工神经网络具有高度的非线性映射能力,能够较好的解决这类问题。本文在对BP算法进行了深入研究并作了适当改进后,建立了高精度措施规划预测模型,并以该模型为基础对油田措施效果进行预测,取得了较好的效果。在研究过程中,针对遗传算法存在早熟及稳定性差等问题,提出了基于非线性调整的自适应遗传算法(NLSAGA),对交叉算子和变异算子进行了优化,实现了交叉率和变异率的非线性自适应调整;针对传统的BP算法收敛速度慢,易陷入局部极小等缺点,提出了基于跳跃梯度的LMBP算法,给出了局部极小点的判断条件及梯度增加的速率等规则。然后提出了综合利用NLSAGA的全局寻优能力和LMBP算法的快速收敛能力改进学习算...  (本文共89页) 本文目录 | 阅读全文>>

武汉大学
武汉大学

面向数据挖掘的遗传算法的研究与应用

随着信息化时代的到来,信息资源的经济价值和社会价值越来越明显。从大量的数据资料中发现有价值的信息或知识,达到为决策服务的目的,成为非常艰巨的任务。数据挖掘方法的提出使这一工作成为可能,其任务就是从大型数据库中获取隐藏于其中的知识。当前,分类挖掘是数据挖掘领域非常活跃的一个部分。为了从数据库中获取知识,我们需要设计一种挖掘算法能够有效搜索整个数据库。一般而言,作为搜索空间,大型数据库中包含着海量的内容,采用穷举的方法显然是不可行的。因此,采用一种有效的搜索策略是非常重要的。一种基于遗传算法的搜索策略目前已经在许多方面得到了成功的应用。本文首先分别介绍了数据挖掘、遗传算法的一些基本知识以及实现他们的一些基本技术,然后讨论了遗传算法在数据挖掘中的设计与应用,提出了一种基于精英重组的遗传算法,分析了它的收敛性特点及时间复杂性,并利用SQL编程语言将其用于adult及nursery school数据集,得到了较好的结果。  (本文共61页) 本文目录 | 阅读全文>>

华东师范大学
华东师范大学

基于后关系型数据库的医疗体检数据挖掘的研究与应用

目前全世界已有成千上万个数据库系统在运行,几乎涉及人类社会生活的方方面面,无论是企事业内部的信息管理,还是各个行业的业务处理系统,以及一般的信息加工和情报检索无不以数据库技术为基础。而医疗领域由于其具有的医疗层次关系复杂、环节众多以及医疗数据结构的多维性等特点,使得采用传统的关系型数据库难以模拟出复杂的数据关系,并且存在着存取效率的问题。同时随着医疗卫生领域中计算机技术的迅速发展,大量有关于病人的病史、诊断、检验和治疗的临床信息,以及药品管理信息、医院管理信息等医疗信息可以被精确地记录下来,从而导致医疗数据资料爆炸性增长,如何从这些海量的医疗数据中,挖掘出有用的信息,了解各种疾病之间的相互关系和各种疾病的发展规律,总结各种治疗方案的治疗效果,这将对疾病的诊断、治疗和医学研究具有重大意义。·针对医疗领域数据的特点,本文利用Cache数据库所具有的面向对象以及多维数据结构的技术优势,将其作为数据挖掘的平台,并提出基于贝叶斯定理的损失...  (本文共73页) 本文目录 | 阅读全文>>

广西大学
广西大学

基于遗传神经网络的CRM市场营销数据挖掘模型的研究

客户关系管理是一种先进的管理理念,要求企业以客户为导向,整合内外流程,持续改进对客户的服务水平。CRM也是一种管理软件和技术,它将最佳的商业实践与数据挖掘、数据仓库、一对一营销,以及其他信息技术紧密结合在一起,为企业的销售、客户服务和决策支持等领域提供了一个业务自动化的解决方案,使企业有一个基于电子商务的面对客户的前沿,从而顺利实现由传统企业模式到以电子商务为基础的现代企业模式的转化。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘是一种从大型数据库或数据仓库中提取隐藏的预测性信息的新技术。它能挖掘出潜在的模式知识,找出最有价值的信息,用以指导商业行为或辅助科学研究。本论文以目前CRM中的数据挖掘研究现状为基础,结合遗传算法、人工神经网络等高性能数据挖掘技术,并在参阅大量外文文献的基础上,取得了以下研究成果:1、面向CRM的数据挖掘技术...  (本文共94页) 本文目录 | 阅读全文>>

西安电子科技大学
西安电子科技大学

KDD中的几个关键问题研究

I摘 要数据库中的知识发现(Knowledge Discovery in Database,KDD)是在应用需求的背景下产生并迅速发展起来的、开发信息资源的一套科学方法、算法及软件工具和环境,是集统计学、人工智能、模式识别、并行计算、机器学习、数据库等技术的一个交叉性的研究领域。KDD 是识别有效的、新颖的、具有潜在用处的可理解的数据模式的过程。一般地,KDD 由数据清理、数据集成、数据选择、数据变换、数据挖掘、模式(型)评估、知识表示等过程组成。KDD 有三个重要的环节,即数据预处理、数据挖掘和结果可视化。本文在详细分析国内外 KDD 研究现状的基础上,借鉴生物进化、计算智能、关系代数、petri 网等概念与理论,提出了基于自适应聚类、模糊聚类进行数据预处理的算法;基于关系代数和自适应混合算法集成的关联规则挖掘算法、泛化关联规则挖掘算法;分析了分类挖掘机理及文本分类与降维技术;针对现有的数据挖掘结果的可视化理...  (本文共154页) 本文目录 | 阅读全文>>