分享到:

复杂系统的模式发现

计算力学是一个全新的理论框架,主要研究动力学系统中的几何状态空间如何支持符号推理计算。Santa Fe研究所的Crutchfield教授从80年代开始从事这方面的工作。ε机是计算力学体系中的主要理论工具,它的目标在于用尽可能少的人为假设,去揭示系统隐含的固有模式。因此,本文称ε机是一个模式发现的理论。揭示系统隐含的模式或结构是复杂性研究的重要途径,在ε机理论中,称之为因果态重构。目前,最重要的ε机重构算法是Shalizi在2004年给出的因果态分割重构(CSSR)算法。CSSR算法分为3步:初始化、齐次化、确定化,它以概率统计(如条件概率、KS检验)为工具,能够从平稳的符号序列中推理出系统的因果态。每个因果态都由一系列字符串组成,它们具有相同的变体——条件概率分布。ε机是复杂性研究中一个颇有价值但十分晦涩的理论,把它引入到工程研究中,是一项有意义的挑战。本文首先从ε机理论抽象出模式发现的思想,并把它同两个不同的问题——异常检测和  (本文共181页) 本文目录 | 阅读全文>>

大连理工大学
大连理工大学

综合信息集成及查询优化的研究

随着Internet技术的发展,Web上各种在线信息源不断涌现,这些信息源种类繁多,结构各异。在互联网这样一个动态的环境中,各信息源不断地发生着变化,在这样一个动态、异构、开放的环境下快速、准确地获取信息是十分困难的。因此,研究信息集成系统,为用户提供一个访问异构数据源的统一接口有着非常重要的意义。在这种背景下,本文对信息集成系统的主要技术进行了深入的研究,具体研究工作如下:信息集成系统体系结构是研究系统的组成模块以及各模块之间关系的。本文对目前几种典型的信息集成系统体系结构进行了分析,总结了这些体系结构的优点和不足。在对实际的信息集成工作中遇到的问题及其他相关需求进行分析的基础上,提出了综合信息集成系统体系结构。该体系结构既考虑对已有投资的保护,又考虑对不断生成的新数据的有效处理;既考虑对传统数据库中的数据和XML数据的处理,又考虑信息检索和辅助决策的需求。是一个面向目前大多数企业的综合信息集成系统。模式映射的建立是信息集成系...  (本文共125页) 本文目录 | 阅读全文>>

《模式识别与人工智能》2006年06期
模式识别与人工智能

复杂系统中的模式发现:ε机原理及算法综述

1引言什么是复杂系统,至今还没有确切的定义,但它的主要特征可以归纳为:1)离散与连续变量共存,时间驱动与事件驱动共存;2)具有隐含模式,而且是变化的;3)状态是转移的,它的转移可以用因果态来描6期向馗等:复杂系统中的模式发现:。机原理及算法综述述;4)单独的符号计算或动力学分析都无法很好的描述这类系统.。机是一种全新的计算理论,它深刻地体现复杂系统新的建模思想—模式发现.模式发现是模式学习和模式识别的延伸,它致力于揭示复杂系统内部的隐含模式,在复杂系统建模中显示出极大的优越性.个最好的模型,而模式发现主要强调在数据的基础之上直接“建立”系统模型.实际上,控制理论中的系统辨识技术也有类似无监督学习的局限性.表1模式识别与模式发现的区别TableD ifferenee between pattern reeognltion and Patternd iseovery2模式与模式发现核心问题模式的特点与信息的关系模式识别按相似程度对事...  (本文共7页) 阅读全文>>

西南大学
西南大学

儿童早期语言发展的个体发生个案研究

儿童语言发展一直以来是语言学、教育学、心理学、神经科学、进化生物学、认知科学、哲学、人工智能、计算机科学等学科研究的一个热题,又是一个争议不断、充满挑战的研究领域。时至今日,关于儿童语言发展的研究仍然值得众多学者进行深入探索。在儿童语言发展研究中,要认清儿童发展和成长过程中各种因素相互作用的特点和规律性,需要多学科、多方法的运用才能揭示儿童语言的个体发生实质。复杂自适应系统理论为语言(学)研究提供了一个全新视角,也为儿童语言发展研究提供了一条全新的研究路径。但迄今尚少有学者从复杂性科学视角探讨系统功能语言学框架下的语言个体发生,揭示其发展进程与阶段、运作机制及神经生物基础。本文旨在从复杂自适应系统理论视角,对系统功能语言学思想进行重新观照,着重考察汉语儿童早期语言发展过程中其人际元功能和概念元功能层面上的识解与建构,以期为拓展和深化语义发生学研究提供一些新的理论和实证依据,同时也希望在儿童语言发展研究方法上有所突破。笔者采用个案...  (本文共292页) 本文目录 | 阅读全文>>

广西大学
广西大学

数据挖掘在Web使用模式中的研究和应用

数据挖掘和World Wide Web是当前计算机科学两个重要的研究领域,将二者结合起来就形成了新的研究领域Web数据挖掘。Web数据挖掘是从WWW上发现和分析有用的信息,帮助人们从WWW中提取知识,改进站点设计,提供个性化服务。本文分主要从以下四个方面对Web使用挖掘进行了系统的分析和研究。第一是对数据挖掘和Web挖掘进行了概述,阐述了Web挖掘的意义、研究的现状、面临的问题。第二是讨论了Web使用挖掘的三个阶段:在数据准备和预处理阶段重点讨论了数据清洗及用户和会话识别算法;在模式发现阶段定义了关联规则和序列模式的数据模型;模式分析阶段则讨论了现行的几种分析方法。第三是本文提出了一个综合性的聚类算法CPPC。由于缓存和代理的存在,数据预处理阶段一般都是采用基于一定假设的启发式算法,这就造成了数据源的不可靠性。本文算法避免了这个缺陷,且不需要复杂的HASH数据结构,通过构造一个User ID-UEL关联矩阵,对列向量进行相似性分...  (本文共99页) 本文目录 | 阅读全文>>

云南师范大学
云南师范大学

针对时间序列数据的时态关联规则挖掘研究

自80年代开始,数据库技术得到了广泛的普及和应用。随着数据库容量的膨胀,特别是数据仓库以及Web等新型数据源的日益普及,人们面临的主要问题是“数据丰富,但信息贫乏”,即面对浩瀚的数据海洋,却不知该如何有效的地利用这些数据。面对这一问题的挑战,数据挖掘技术应运而生,并显示出强大的生命力。从海量的历史数据中挖掘出其背后蕴含的价值信息对揭发事物发展变化有着重要意义,同时也为科学决策和正确认识事物提供了依据。这些历史数据普遍具有时间性,因此,时间序列数据挖掘研究作为数据挖掘技术研究的重要组成部分,一直以来都受到广泛地重视,成为具有重要理论和实用价值的热点研究课题之一。本文针对时间序列数据的时态关联规则挖掘中时间序列数据表示,频繁序列挖掘,时态关联规则表示和时间序列预测等问题进行研究分析,在频繁序列挖掘和时态关联规则表示等方面取得了一些成果,主要研究工作和研究内容如下:在时序数据中,首先面对的时间区间、时态关系、和时间序列数据表示方法等问...  (本文共206页) 本文目录 | 阅读全文>>