分享到:

基于半监督的支持向量机网页分类方法

随着网络的发展,为了能够有效地组织和分析海量的网页信息,人们希望能够对网页实现自动分类。因此,网页分类技术便成了快速且有效地组织网络上海量信息的一项重要技术。在众多的网页分类算法中,支持向量机凭借其出色的学习能力,已成为机器学习界的研究热点。而现实生活中大量数据却是无标记的,为数据作标记的工作耗时费力。这推动了机器学习的研究进入到一个新的阶段,结合有标记数据和无标记数据的半监督式学习正成为新热点。讲述了网页分类的过程,分类方法种类划分和评价标准。然后介绍了支持向量机的原理、发展和相关技术,阐述了支持向量机技术在网页分类中的重要作用。之后研究了目前支持向量机常用的训练算法和半监督支持向量机的训练算法;还研究了主动学习的样本选择策略。针对目前半监督支持向量机训练算法存在训练速度慢并且准确率不高等缺点,提出了一种基于主动学习的半监督支持向量机学习算法,它以少量的有标记数据来训练初始学习器,通过主动学习策略来选择最佳训练样本,并通过删除  (本文共59页) 本文目录 | 阅读全文>>

河北大学
河北大学

基于取样的潜在支持向量机

在2006年Hochreiter提出的潜在支持向量机是描述二元数据的新技术。二元数据有两个数据集,通过矩阵中每一个元素项的数值来描述两个数据集中样本点的相互关系。潜在支持向量机一定程度上克服了支持向量机对样例的规模敏感性,能够处理既不是正定也不是方阵的核矩阵。潜在支持向量机在实际应用中数据往往是大规模的,训练过程需要占用大量的内存,训练速度缓慢。所以加速潜在支持向量机训练大规模数据速度,是十分有意义的。本文主要工作是:针对潜在支持向量机在训练大规模样本集时,学习过程需要占用大量的内存,导致寻优速度缓慢。为了加速潜在支持向量机求解大规模问题的速度,本文提出了基于取样的潜在支持向量机。改进的优化算法分为两个策略,基于取样的追踪支持向量策略与基于取样的删减样本策略。追踪支持向量策略去掉了大部分非支持向量,保留对分类器起决定性作用的支持向量,逐渐把支持向量压缩到取样样本集中。支持向量个数相对整个样本集较多时,所有的支持向量不能全部压缩到...  (本文共43页) 本文目录 | 阅读全文>>

南京农业大学
南京农业大学

支持向量机及金融应用

支持向量机(Support Vector Machines,简称SVM)是建立在统计学习理论的VC (Vapnik-Chervonenkis)维理论和结构风险最小原理基础上的一种机器学习方法。SVM算法的本质是取有代表意义的支持向量来构造最优超平面,实现样本的支持向量机分类和支持向量机回归。本文对统计学习理论和SVM以及经验风险最小化原理进行了阐述。对支持向量机算法的主要内容进行了详细的介绍和分析。对传统的统计预测技术做了一个简单的回顾,包括一元线性回归,多元线性回归,非线性回归,灰色系统等。传统的统计预测只适用于比较简单的模型,而现代金融数据的特点有数据类型多,关系复杂,动态性,数据量大。提出了加权最小二乘支持向量机算法并确定了权值系数的插值方法。并利用加权最小二乘支持向量机回归对上证地产业类指数进行预测,并与BP神经网络的预测结果进行了比较。金融工程研究中时常碰到小样本问题,这主要是由于已有样本的数量与样本的维数相比不够大,...  (本文共48页) 本文目录 | 阅读全文>>

华东理工大学
华东理工大学

基于灰色支持向量机的建模方法研究及应用

针对小样本数据的信息处理,已有不少学者对灰色系统模型和支持向量机模型进行研究并取得了一定成果。目前,将这两种方法融合建立灰色支持向量机模型,能弥补单一使用这两种模型的不足,达到良好的数据处理和预测效果,已成为一个很重要的课题。本文首先对小样本数据的特点进行了研究,详细分析了小样本数据建模和预测的复杂性、特殊性,然后提出将灰色系统理论和支持向量机相结合的思想来进行建模。在对灰色系统理论和支持向量机,尤其是灰色系统理论深入研究的基础上,建立了灰色GM(1,1)与支持向量机相结合的GMSVM预测模型。在对灰色GM(1,1)模型建模机理及误差分析的基础上,利用PSO算法对齐次指数序列条件下构造的背景值形式进行参数优化,然后结合支持向量机的优势,使其在对非严格等比数列或近似指数序列条件下建模具有更高的预测精度,仿真实例表明,此模型可以进行中长期预测。由于过程工业的复杂性(多变量、非线性、时变等),大量研究集中在根据过程的历史数据,采用各种...  (本文共68页) 本文目录 | 阅读全文>>

《科学技术创新》2019年02期
科学技术创新

支持向量机理论及应用

支持向量机(Support Vector Machine,SVM)是一种新型机器学习方法,是一种建立在统计学基础上的分类器。首...  (本文共2页) 阅读全文>>

《中国图象图形学报》2017年09期
中国图象图形学报

加权间隔结构化支持向量机目标跟踪算法

目的目标在跟踪过程中,各种因素的干扰使得跟踪结果存在不确定性。因此,将跟踪过程中所提取样本的可靠性融入跟踪模型中,有助于克服低可靠性样本对跟踪算法的影响。为此,基于最近的结构化支持向量机(SSVM)跟踪算法,提出一种包含样本置信度的加权间隔结构化支持向量机跟踪模型(WMSSVM),以增强SSVM跟踪算法性能。方法首先,基于打分和位置重合率估计样本可靠性;其次,建立WMSSVM模型处理具有不同置信度...  (本文共9页) 阅读全文>>