分享到:

数据挖掘研究进展及其发展趋势

1数据挖掘的概念数据挖掘,也可以称为数据库中的知识发现(Knowl-edge Di scover Dat abase,KDD),就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它包含下面一些特点:数据:是指一个有关事实F的集合,它是用来描述事务有关方面的信息,是我们进一步发现知识的原材料。新颖:经过数据挖掘提取出的模式必须是新颖的,至少对系统来说应该如此。模式是否新颖可以通过两个途径来衡量:其一是得到的数据,通过比较当前得到的数据和以前得到的数据来判断该模式的新颖程度;其二是通过其内容所包含的知识,通过对比发现的模式与己有的模式的关系来判断。通常我们可以用函数N(E,F)来表示模式的新颖程度,该函数的返回值是逻辑值或是对模式E的新颖程度的一个判断数值。潜在有用:提取出的模式应该是有意义的,这可以通过某些函数的值来衡量。用u表示模式E的有作用程度...  (本文共2页) 阅读全文>>

《数字技术与应用》2015年01期
数字技术与应用

基于云计算平台的物联网数据挖掘研究

云计算与物联网技术是现在计算机领域的主要研究领域之一,云计算就是利用物联网的应用形式在计算机领域中进行计算,是一种虚拟的技术,我们在应用过程中,我们不需要购买计算机等实体,我们只需要购买一种计算能力,能完成我们的需要。本论文就是利用云计算、物联网技术搭建一个平台,利用云计算平台搭建平台,运用物联网技术进行数据挖掘,提供了一种新型的数据挖掘方式,为数据挖掘的深入研究提供了一种理论依据,这也是大数据时代应用的结果。1物联网与云计算1.1物联网物联网是下一代网络,是基于计算机技术与计算机网络技术发展产生的,是一种新的技术革命产生,需要一个过程酝酿而产生,这种新技术革命的运用是要经历一个过程,同时代表了下一代网络的发展方向,具有一定的研究价值。物联网主要特征就是技术的应用,在电子技术方面应用已经取得了一定的成果。物联网需要结合云计算、模糊识别等技术来处理多种来源的海量异构数据,同时要保证效率,有效的整合共享信息,达到真正对物体的智能控制...  (本文共1页) 阅读全文>>

《中国水运(学术版)》2007年07期
中国水运(学术版)

数据挖掘研究进展

数据挖掘最初是在1989年IJCAI会议——数据库中的知识发现(KDD)讨论专题中提出,1991年至1994年进行了数据挖掘讨论专题,Advances in Knowledge Discovery and Data Mining,从1995年开始,KDD发展为国际年会,在1997年创立了数据挖掘杂志——Journal of Data Mining and Knowledge Discovery,国内对该领域研究稍晚,1993年国家自然科学基金开始支持该领域研究,研究项目主要由国家自然科学基金等政府资助,对其研究主要集中在理论方面,集中在大学和科研院所,企业较少。一、数据挖掘的定义G.Piatetsky-Shapiro等人(1991)将数据挖掘定义为基于数据库的知识发现(KDD),KDD的定义随着人们研究的不断深入也在不断完善,SAS研究所(1997):“在大量相关数据基础之上进行数据探索和建立相关模型的先进方法”。Bhavani...  (本文共2页) 阅读全文>>

浙江工商大学
浙江工商大学

基于统计视角的数据挖掘研究

数据挖掘是一个年轻、活跃的研究领域,不同专业背景的研究者侧重于不同方面对数据挖掘展开了研究。从目前国内外的研究现状看,从事数据挖掘研究的主要是计算机领域的学者和专家,统计界的学者和专家对数据挖掘的研究相对较少。而随着数据存储技术的不断发展,可用于数据分析的数据量越来越大,对传统的统计分析技术提出了极大的挑战。笔者认为数据挖掘的出现,正是统计学适应这一变化的新的发展方向,数据挖掘并不是为了替代传统的统计分析技术,而是统计分析方法的延伸和扩展。本文从统计学视角研究数据挖掘,以期从统计学角度对数据挖掘理论的研究有所突破和创新,同时对统计学理论在数据挖掘方向的发展做出探索。全文除了绪论,共分为七章。第一章为:基于统计视角的数据挖掘理论体系研究。通过对数据挖掘与统计学理论基础、方法等方面的比较,清晰地提出了基于统计视角的数据挖掘体系,改变了目前研究中人们对统计学与数据挖掘之间理解的模糊认识。第二章为:数据挖掘统计方法综述。首先对数据挖掘数...  (本文共175页) 本文目录 | 阅读全文>>

复旦大学
复旦大学

道路交通流数据挖掘研究

研究交通流的各种形态及其运行规律,建立快速、稳定、高效的交通流模型是智能交通系统的重要研究内容。随着智能交通系统的发展,智能交通系统中积累了海量交通流数据,于是研究者开始研究利用先进的数据挖掘技术分析智能交通系统中的交通流信息,发现交通流信息中隐含的交通模式及规则。本文针对交通流信息的特点以及智能交通系统的新的数据挖掘应用需求,对交通流数据预处理、交通流量预测、交通状态识别、交通流空间聚类以及实时交通流的查询等若干问题进行了研究,设计了适合的数据挖掘模型和算法。这些问题的研究对于智能交通系统的交通信号管理与控制、交通流诱导、动态交通分配等方面有着重要的意义。本文的主要研究内容和成果包括以下几个方面:(1)智能交通系统是一个非常庞大的系统,其复杂性和稳定性使交通流数据的采集质量难以保证,对交通流数据进行异常检测及预处理对于后续的数据分析、挖掘结果的质量和预测的准确性具有重要意义。本文根据交通领域的流量—时间占有率的倒“V”字型曲线...  (本文共106页) 本文目录 | 阅读全文>>

河北工业大学
河北工业大学

基于网络痕迹的科研群体特征数据挖掘研究

近年来,我国不断加大对科研工作的管理、推进科研成果的转化,旨在提升我国的科研水平和科技竞争力。科研群体作为科研工作的主力军,对我国科研工作的进步起到至关重要的作用,对于科研群体的成长因素、激励、绩效的研究是科研群体研究的重点。科研能力是科研群体激励和绩效的重要参考因素,故本文选取科研群体的能力作为研究内容,结合互联网上丰富科研群体成果信息,通过有效的数据获取方法,建立合理的科研群体分析模型,为科研群体、科研机构的科研能力评价提供了新的思路,以便更好的运用在科研管理工作中。首先,本文通过广泛阅读国内外文献,结合相关研究对“网络痕迹”进行概念界定;从不同的角度对网络痕迹进行分类,如机构痕迹和个人痕迹、主动痕迹和被动痕迹、显性痕迹和隐形痕迹等;并对不同的网络痕迹提出不同的数据获取方式;并介绍当前网络痕迹的研究现状和应用领域。其次,本文基于PAM的聚类算法对科研群体整体科研状况进行概括性描述。结合科研群体的网络痕迹,通过网络爬虫等工具获...  (本文共72页) 本文目录 | 阅读全文>>