分享到:

聚类分析优化关键技术研究

聚类分析作为数据挖掘的一个重要研究领域,可以有效地帮助我们分析数据的分布、了解数据的特征、确定所感兴趣的数据类,寻找隐藏在数据中的结构,以便作进一步分析和利用。本文针对现有某些聚类算法存在的不足,结合粒子群优化等方法对现有某些聚类算法存在的需要人工设置算法初始参数及提高聚类性能等问题进行了探讨并提出了解决方案。研究了成对约束先验信息如何扩展和指导聚类以提高聚类质量。针对文本数据高维稀疏的特性,对如何提高文本聚类效果进行了研究。本文研究具有一定的理论研究价值与现实的应用意义。具体研究内容包括以下几个方面:1)提出了一种简单有效的粒子编码方法,采用新的粒子编码方法的粒子群优化K均值算法有效地解决了已有粒子群优化聚类算法当样本维数较大及样本各维的取值范围变化较大时,造成粒子群搜索空间过大,在有限次迭代搜索时影响算法的收敛速度和聚类效果,且在搜索过程中样本各维的值在一定范围内变化时可能会取到不符合样本实际情况的数值而出现空簇的情况等问题  (本文共164页) 本文目录 | 阅读全文>>

《基层医学论坛》2017年12期
基层医学论坛

数据集采器在临床护理工作中的应用价值探讨

目的探讨数据集采器(PDA)在临床护理工作中的应用价值。方法选取我院收取的患者60例,采用数据集采器实施临床护理工作,观察...  (本文共2页) 阅读全文>>

《中华医院感染学杂志》2016年11期
中华医院感染学杂志

医院感染监测基本数据集的建立及作用

目的建立医院感染监测基本数据集,实现医疗机构医院感染监测信息标准化,为数据在不同用户间进行交换提供规范和指南。方法依据《医院感染监测规范》《卫生信息基本数据集编制规范》等标准,在分析国内外基本数据集研究与应用现状的基础上,提出建立我国医院感染监测基本数据集...  (本文共4页) 阅读全文>>

《Frontiers of Information Technology & Electronic Engineering》2016年10期
Frontiers of Information Technology & Electronic Engineering

TextGen:用于新型存储系统基准测试的真实文本数据集生成方法(英文)

新型存储系统通过内置数据压缩功能提高性能,并节省存储空间。因此,数据内容会显著影响存储系统基准测试结果。由于真实数据集规模庞大,难以复制到目标测试系统,并且大多数数据集由于隐私性无法进行共享。因此,基准测试程序需要人工生成测试数据集。为了保证测试结果的准确性,需要根据影响存储系统性能的真实数据集特征信息生成数据。现有方法 SDGen在字节级别上分析真实数据集内容分布特征,并以此生成数据集,因此能够保证内置字节级压缩算法的存储系统测试结果准确。但是SDGen并未...  (本文共13页) 阅读全文>>

《地球信息科学学报》2015年11期
地球信息科学学报

卫星气候数据集的应用研究与发展分析

卫星气候数据集是卫星气候研究的基础。在规范卫星气候数据集基本概念的基础上,针对现有基本气候数据集(FCDR)和专题气候数据集(TCDR)的分类方式,无法反映卫星气候数据特点的问题,认为应将专题气候数据集进一步划分为单一遥感仪器专题气候数据集、多种遥感仪器融合专题气...  (本文共8页) 阅读全文>>

《模式识别与人工智能》2014年01期
模式识别与人工智能

基于交互信息的数据集特征结构研究

机器学习分类领域提出大量的分类算法,如何为数据集找到合适的分类算法成为研究的重要内容之一.文献[8]提出一种新的数据集离散化方法用来刻画数据集的特征,且在推荐方法方面取得较好的结果.本文在此基础上利用交...  (本文共7页) 阅读全文>>