分享到:

特征选择的优化算法研究

目标识别成为战争胜败的关键,而对目标识别的关键之一是对目标特征的提取与选择。因此,特征的选择尤为重要。为了提高效率,通过一种算法选择较少(优化)的特征是所希望的。鉴于此该文简单介绍基于  (本文共4页) 阅读全文>>

长春工业大学
长春工业大学

随机森林自适应特征选择和参数优化算法研究

随机森林算法(Random Forest)是机器学习领域中一种普适性良好的数据挖掘方法。它在决策树算法的理论之上结合bootstrap重采样方法,集合多个单树型分类器,最后结果通过投票的策略进行分类和预测。随机森林算法具有理论易理解、调整的参数较少、抗噪声能力强,最重要的是在实际的应用中分类性能非常高和不容易过拟合等特性。随机性能良好以及不需要样本背景知识的性能让其在很多领域得到了广泛的实际应用,为此许多研究学者对随机森林进行了广泛的研究和改进。本文在分析国内外相关研究发现,随机森林算法的特征选择具有随意性,会导致忽略特征对类别的重要性以及特征与特征之间的相关性,同时随机森林的参数选择很难学习出最优参数组合并且参数选择过程效率很低。本文针对以上问题,从不同的视角在随机森林的特征选择和参数选择上做了一系列的探索和研究工作。本文首先对随机森林算法的综述进行阐述,分析了随机森林算法的随机性机制、性能指标以及存在的问题。然后针对随机森林...  (本文共54页) 本文目录 | 阅读全文>>

西南交通大学
西南交通大学

基于改进的果蝇优化算法的并行特征选择方法研究

随着互联网、数据存储、计算机技术的飞速发展,各领域产生的待处理高维大规模数据急剧增加。特征选择作为一种有效的数据处理方式,成为机器学习、模式识别和数据挖掘等领域的一个热门研究课题,受到了广泛的关注和重视。特征选择通过去除不相关、冗余或噪声的特征属性,从数据的原始特征集合中选择一些使评价准则最优的特征以达到对特征空间降维的目的,进而降低数据存储和处理的成本。基于粗糙集的特征选择,即属性约简,是粗糙集理论的核心内容之一。其主要思想是在保留基本知识、同时保持决策系统分类能力不变的前提下,通过消除重复、冗余、不相关的属性,实现知识约简,导出所研究问题的决策或分类规则。研究表明,粗糙集属性约简在处理维度较低、数据量较小的数据集上性能优异,但对于海量大规模的、高维复杂的数据处理能力还不足。面对这些复杂度越来越高、计算量越来越大的数据,单一的利用数据挖掘算法的寻优能力或者高性能计算工具的计算能力已经无法满足数据处理的需求。研究学者们更多地考虑...  (本文共72页) 本文目录 | 阅读全文>>

哈尔滨工业大学
哈尔滨工业大学

随机森林的特征选择和模型优化算法研究

集成学习的兴起,为分类方法的设计提供了一个新的研究方向。随机森林是在众多集成方法中逐渐发展起来的一种分类器集成学习的方法,在实际中得到广泛应用,成为数据挖掘、人工智能、机器学习、模式识别等领域的研究人员以及工程应用领域中的技术人员共同关心的一个研究热点。随机森林在降低分类系统泛化误差、简化分类器设计等方面表现优良,但是随机森林方法并不完美,从实际应用中看,还有着大量进一步提升精度,降低泛化误差的需求。本文在介绍集成学习和随机森林的研究现状、算法思想的基础上,重点分析了随机森林的优缺点,并提出了一些改进的方案,进行了大量的实验分析,完成了以下研究工作:(1)在分析了随机森林集成的强度和相关度之间的关系的基础上,提出了一种新的特征选择算法。为了降低随机森林的泛化误差上界,提高森林整体性能,在综合考虑强度和相关度之间相互影响的关系后,利用卡方检验进行特征的相关性评估,依据评估的结果在特征空间进行有区分的随机选择特征。经实验验证,这种方...  (本文共71页) 本文目录 | 阅读全文>>

安徽大学
安徽大学

改进的粒子群优化算法在特征选择中的应用研究

随着各行业的急速发展,海量数据呈爆发式增长,给数据处理工作带来了极大压力,这也就对数据处理方法提出了更严格的要求,从而需要更高效地降低数据维度,减小数据使用过程中的压力。近些年来,特征选择问题的解决也随之受到更广泛的关注。由于数据维度和数据量的增加,传统穷举法已经无法妥善解决特征选择(Feature Selection,FS)问题。因此,诸多学者针对特征选择方法作出不断的改进与提高,并取得了可观的成果。其中,群智能优化算法(Swarm intelligence optimization algorithm,SIOA)作为一种启发式方法,同时具备智能选择和随机搜索的优势,能够在计算资源和时间成本有限的前提下搜索到理想的解集。粒子群优化算法(Particle Swarm Optimization,PSO),作为SIOA的一种典型代表,由于其收敛速度快、参数影响较小等优点,也极适用于解决当前数据爆炸背景下的FS问题。故而,对PSO的原...  (本文共68页) 本文目录 | 阅读全文>>

吉林大学
吉林大学

改进的森林优化特征选择算法研究

随着计算机科学领域中数据挖掘和机器学习方向上探索和研究的不断推进,面对日益增长的数据集规模,如何在降低计算成本的基础之上仍旧保持优异的算法性能成为至关重要的问题。特征选择,其目标在于合理降低数据集维度,并且使选择的子集拥有不亚于甚至更优于原数据集的算法性能。在分类算法中,为获取更优质的类别区分性能,特征选择采用最本质的方法就是在原特征集合中将无关的及冗余的特征剔除,从庞大的初始特征集中选择出对类别最具表征性的特征,将其加入特征子集。用于特征选择的方式数不胜数,近些年,通过进化计算的方式进行特征选择获得了学术界广泛关注,并且成绩斐然。森林优化算法(Forest Optimization Algorithm,FOA)是模拟自然界的树木播种的方法的进化计算理论。初始用来解决连续型最优问题,而后在机器学习相关领域学者的优化和改良后,森林优化算法演化成为了解决离散化的特征选择问题的FSFOA算法(Feature Select using ...  (本文共63页) 本文目录 | 阅读全文>>