分享到:

数据挖掘流程

最高水平的数据挖掘可以视为由两个阶段组成:知识发现和知识发展。发展阶段包括从发展了的模型获得成果,并且将成果应用到业务中。成果包括报表(如被发现的规则)、模型(如以代码或者表格出现)、出现于运营系统(如通过监督和代理)的编码指令或者数据可视化。发现阶段则由数据处理、模型设计和数据分析组成。$$“数据预处理阶段”(Data PreprocessingPhase)中,在流程结束的前端,特定的业务问题必须得到明确的定义,否则,数据挖掘将很可能是漫无目的的。在业务问题的域知识的基础上,它将产生用来论述问题的数据;在一个具有良好构造的数据仓库环境里,这些步...  (本文共1页) 阅读全文>>

权威出处: 人民邮电2001-08-01
北京邮电大学
北京邮电大学

基于流程的数据挖掘生成工具的设计与实现

随着数据挖掘知识的普及,数据挖掘已经在社会各行各业的应用迅速扩展开来。通俗来讲,数据挖掘就是从大量的数据中,提取人们感兴趣的,即正确的、未知的、有潜在价值的并最终能被用户接收和利用的知识。数据挖掘已经广泛地应用于各个领域,越来越多的学者开始关注于数据挖掘领域。随着数据挖掘相关知识在越来越多的领域开始普及,其相关的实用工具也开始受到人们的重视。数据挖掘的研究重点也慢慢向数据挖掘系统工具方向转移,越来越注重多种多样的发现策略和技术的集成。数据挖掘工具的用户主要集中在一些传统的行业中,比如银行、制造业、销售等面临转型的行业,数据挖掘工具也在不断的产生和完善。基于上述的场景和需求,本文研究并设计了一套基于流程的数据挖掘建模工具。该工具提供了一种基于web服务的流程建模方式,旨在为流程开发者提供一个统一的建模平台,减少开发者的工作量,满足不同开发者的动态需求。基于流程的数据挖掘建模方式借助于web服务,通过将第三方服务进行组装形成新的流程...  (本文共104页) 本文目录 | 阅读全文>>

东华大学
东华大学

基于CRISP-DM的流程可视化数据挖掘工具的研究与实现

知识发现和数据挖掘已成为当今计算机领域的研究热点。如何从海量数据中获取到有用的信息和知识,挖掘出数据中隐含的未知规律,是人类迫切需要解决的问题。本文对数据挖掘工具的相关技术进行了研究,结合跨行业数据挖掘标准流程(cross industry standard process for data mining,CRISP-DM)过程模型、流程可视化等技术,设计并实现了应用于轨道交通自动售检票(automatic farecollection,AFC)系统的数据挖掘工具。本文作者的主要研究工作如下:(1)对数据挖掘、过程模型和可视化数据挖掘技术进行了理论研究,详细分析了轨道交通AFC系统的数据和业务。(2)设计和实现了轨道交通AFC系统数据挖掘工具的三层体系结构(客户端层、服务器层和数据库层)及四级层次结构(数据驱动接口层、数据处理层、数据挖掘层和可视化显示层),提高海量数据处理性能。(3)研究了CRISP-DM的方法学。根据CRIS...  (本文共73页) 本文目录 | 阅读全文>>

《兰州工业学院学报》2018年05期
兰州工业学院学报

基于大数据技术的线上线下电商用户数据挖掘流程分析

在电子商务迅速发展的现代社会,数据的价值也得到充分体现.数据的增加对企业进行用户数据管理提出了挑战,但大数据技术能有效地对大量数据进行捕捉与挖掘.线上线下电商用户信息属于联系商家与用户的商业平台,这种全新的发展模式拥有大量有价值的数据,对这些数据进行精准挖掘与利用有助于提升商家的竞争力.所以,在大数据技术背景下,对线上线下电商用户数据挖掘流程进行分析尤为重要.1数据特征分析线上线下电商数据与传统的电子商务数据具有较大的不同性,线上线下用户数据并不会局限于平台数据,也就是用户在线上线下过程中所产生的交易数据.其中社交网络、用户移动终端的所在位置等数据信息都会囊括在平台数据中.换句话说:线上线下电子商务用户数据是对线上线下日常经营进行观测的交易、互动数据.线上线下电商数据具有自身的特征,其主要表现在以下几个方面.1.1数据体量大由于每天进行线上线下购物的数量大,并且数据所囊括的范围比较广,所以线上线下电商体量比较大.截至2017年上...  (本文共4页) 阅读全文>>

福州大学
福州大学

空间数据挖掘问题的语义解析与智能化求解方法研究

人类正快速迈进“大数据”时代,随着遥感传感器、位置服务终端的日益普及,空间数据资源呈急剧增长态势,面向服务的空间数据挖掘已成为地学领域数据增值与知识发现、解决大数据科学问题的重要手段。如何合理地运用自然语言实现人-机间的信息交互,为挖掘服务用户屏蔽高深的专业知识、简化复杂的服务流程建模工作,实现复杂、众多的空间数据挖掘服务的遴选与服务流程组合的自动化、智能化,是当前云服务环境下空间数据挖掘与知识发现领域的重要研究内容。本文开展自然语言描述的空间数据挖掘问题的语义解析与智能化求解方法研究,集成空间数据挖掘本体构建、空间数据挖掘问题的语义解析、基于智能规划的空间数据挖掘服务自动组合等技术,致力于形成一套从自然语言描述的空间数据挖掘任务向可执行的挖掘服务流程转化的问题智能求解解决方案与软件原型。主要研究工作和成果总结如下(1)提出了结合核心本体构建与中文概念术语扩展的空间数据挖掘本体构建方法。在提取领域相关概念术语的基础上,着重探索了...  (本文共153页) 本文目录 | 阅读全文>>

河北师范大学
河北师范大学

基于Agent的并行群组数据挖掘模型研究与实现

20世纪末,随着信息技术的普遍应用、Internet的普及,信息系统的分布式应用及研究逐渐成为热点,分布式数据挖掘也得到了越来越高的重视。与此同时,分布式数据挖掘模型、分布式数据挖掘算法、分布式数据挖掘工具等方面的研究也相继展开,并取得了一些成果,但也存在诸多亟待解决的问题。Multi-Agent技术被认为是解决分布式数据挖掘的有效方法。在分布式数据挖掘模型方面,数据挖掘工作者提出了几种经典的基于Agent的分布式数据挖掘模型:JAM、PADMA、以及以CDM为基础改进的基于异构站点的集合式数据挖掘系统BODHI等。这些模型为研究分布式数据挖掘,起到过积极的推动作用。随着Internet的发展和普及,分布式应用出现了新的特征:数据站点数量庞大,随时扩展新数据站点,数据更新频率高,跨越距离大。如何对这样的分布式系统进行有效的数据挖掘成为一项紧迫的任务。经典模型在应对这些新型分布式系统时,显得力不从心。文章在研究Multi-Agen...  (本文共101页) 本文目录 | 阅读全文>>