分享到:

发现广义序贯模式的增量式更新技术

在数据库中,发现知识KDD(knowledgediscoveryindatabases)亦称为数据发掘(DataMining),是当今国际人工智能和数据库研究的十分活跃的新兴领域.[1]序贯模式(SequentialPatern)的发现是R.Agrawal[2]首先提出来的.设有一个交易数据库D,每个顾客可在不同时间购买不同物品,每次购买活动称为交易(Transaction).这里,顾客、交易时间和所购物品分别以Customer-ID,Transaction-Time和Itemset标识.如果我们以Customer-ID为第一关键字,以Transaction-Time为第二关键字对数据库D排序,那么,对每位顾客而言,他进行的所有交易是按交易时间的升序排列的,从而构成了一个序列.我们称这种序列为顾客序列CS(customer-sequence).一般地,令某顾客的各次交易时间为T1,T2,T3,...,Tn,该顾客在交易时间Ti购...  (本文共4页) 阅读全文>>

《计算机研究与发展》1981年00期
计算机研究与发展

在大型数据库中多层序贯模式的发现

1引言在数据库中发现知识(knowledgediscoveryindatabases,简称KDD),亦称为数据挖掘(datamining),是当今国际人工智能和数据库研究的最富活力的新兴领域,其目标是在大量的数据中发现令人感兴趣的模式[1].与关联规则(associationrule)一样,序贯模式(sequentialpatern)的发现也是R.Agrawal提出的一种重要的数据挖掘工作[2].设有一个交易数据库D,每个顾客可在不同时间购买不同物品,每次购买活动称为交易(transaction).这里,顾客、交易时间和所购物品分别以Customer—ID,Transaction—Time和Itemset标识.如果以Customer—ID为第一关键字,Transaction—Time为第二关键字对数据库D排序,那么,每位顾客所作的全部交易便以交易时间的升序排列,从而构成了一个序列.我们称这种序列为顾客序列(Customer—Se...  (本文共5页) 阅读全文>>

《计算机科学》2003年05期
计算机科学

序贯模式挖掘评述

1引言 数据挖掘(data mining)就是从大量不完全的、有噪声的、模糊的或者随机的实际应用数据中提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程。数据挖掘是知识发现的核心部分,而知识发现是在积累了大量数据后,从中识别出有效的、新颖的、潜在的、有用的及最终可以理解的知识,人们利用这些知识改进工作,提高效率和效益. 序贯模式挖掘(Sequential Patterns Mininig)是在给定时间窗口内的序列集中挖掘所有最长频繁序列的过程.它是数据挖掘技术中一个非常重要的研究课题和领域.它首先是由Rakesh Agrawal、Ramakrishnan srikant针对超市中购物篮数据的分析提出来的.序贯模式挖掘的一个典型例子就是:租“星球大战”顾客,以后会租“帝国反击战”,然后会租“杰达武士归来”。序贯模式挖掘具有广阔的应用领域:像客户购买行为模式预测、Web访问模式预测、疾病诊断、自然灾害预测、DNA序列...  (本文共4页) 阅读全文>>

《软件学报》1997年11期
软件学报

在数据库中自动发现广义序贯模式

在数据库中发现知识KDD(knowledgediscoveryindatabases),亦称为数据发掘(DataMining),是当今国际人工智能和数据库研究中十分活跃的新兴领域.[‘j在信息爆炸的今天,各种数据库中的数据迅速增长,没有计算机和强大的分析工具,要想对这些数据进行分析,并从中获得有意义的模式几乎是不可能的.KDD的主要目标是为了满足用户目标,自动处理大量的原始数据,识别重要和有意义的模式,并将其作为知识加以表达.「”序贯模式(SequentialPattern)是R.Agrawal[’]首先提出的.设有一个交易数据库D,每个顾客可在不同时间购买不同物品,每次购买活动称为交易(Transaction).这里,顾客、交易时间和所购物品分别以Customer-ID,Transaction-Time和Itemset标识.如果我们以Customer-ID为第1关键字,Transaction-Time为第2关键字对数据库D排序...  (本文共7页) 阅读全文>>

《计算机工程》2007年19期
计算机工程

水平划分数据的私密保持序贯模式挖掘

数据挖掘应用的一般前提是数据的开放使用,然而在现实世界里,数据库中很可能包含某些敏感信息,不宜对外泄露,因此,需要研究如何在保证不泄露敏感信息的条件下进行有效的数据挖掘[1],私密保持数据挖掘研究应运而生。国际上对关联规则、分类和聚类等问题的私密保持挖掘研究较多,而序贯模式[2]的私密保持挖掘研究极为稀少。本文研究了水平划分数据的私密保持序贯模式挖掘,问题描述如下:设Part1,Part2,…,Partn各自拥有一个包含敏感信息的数据集DB1,…,DBn,而且DB1,…,DBn是水平数据分布的,即为同构数据库,所有的站点都有相同的模式结构,但是每个站点包含关于不同实体的记录。各方拟在DB1∪DB2∪…∪DBn上实施某种序贯模式挖掘算法,并且希望信息泄露受到限制,一个站点不能知道其余站点的内容,比如其余站点支持什么样的序贯模式以及支持度,除非信息是由站点本身以及全局最终结果泄露(比如一条规则的支持度是100%,则可知每个站点对这条...  (本文共3页) 阅读全文>>

北京邮电大学
北京邮电大学

基于序贯模式的频谱检测研究

认知无线电的主要技术就是动态利用处于空闲状态的频谱,频谱检测就是检测通信环境中的可用频谱,将频谱分配给认知用户通信。认知无线电(CR)终端对于特定区域的频段进行分析,在不影响主用户(PU)的前提下,通过检测算法快速决定次级用户(SU)是否可以接入该频段进行认知网络的数据传输。此外,次级用户的频谱接入优先级要比主用户优先级低。次级用户在占用主用户频段传输信号的过程中,必须持续的对外部环境做出检测,当发现主用户要占用该频段的时候,次级用户必须实时高效检测到主用户并退出频段占用,防止造成信号干扰。因此,快速的频谱检测在认知无线电中有着举足轻重的地位,当前业界对于频谱检测的研究越来越多,频谱检测的性能成为了研究的关键问题。本文基于序贯模式下应用全新的相位检测器做研究,相比于能量检测门限值的设定不再受到噪声功率大小的影响,同时相对匹配滤波器和循环平稳特征检测器来说也容易实现。因此我们提出一种基于序贯模式的相位差检测器。此外,在时变的无线信...  (本文共61页) 本文目录 | 阅读全文>>