分享到:

基于输出信号过采样的系统盲反向辨识

讨论了时域中非最小相位系统传递函数模型中一种新的盲反向辨识算法。通过对系统噪声破坏输出的过采样 ,在获取未知输入信号与系统结构更多  (本文共5页) 阅读全文>>

哈尔滨工业大学
哈尔滨工业大学

基于生成式模型的不平衡分类算法研究

不平衡问题是指在数据集中不同类别的数据分布不均匀,而传统的分类算法是基于数据大致平衡的假设,因而对少数类数据关注度不够,忽略了它们蕴含的珍贵信息,影响分类效果。研究者分别从数据层面和算法层面提出了相应的解决方案并取得了一定的效果。其中,数据层面解决方案是作为数据预处理的一部分,其通过采样算法对数据分布进行调整使其平衡,应用范围更加广泛。但是在数据层面解决方案中,针对多数类数据进行欠采样可能会导致信息损失;针对少数类数据进行随机过采样无法保证过采样前后数据分布一致性;基于概率分布函数的过采样需要假设数据分布形式,算法受限。除此之外,单独过采样算法产生的数据仅仅保证了样本平衡性,不能确保提高分类器性能。针对以上问题,本文进行了以下3个方面的研究:针对不平衡率无法体现数据分布的问题,本文提出了一种改进广义不平衡度衡量指标,本文对广义不平衡度中计算近邻均值的过程进行距离加权,并计算正负子集均值的乘积而非广义不平衡率中的差值,提高了不平衡...  (本文共60页) 本文目录 | 阅读全文>>

哈尔滨工业大学
哈尔滨工业大学

面向不平衡样本分类的过采样集成学习算法研究

不平衡样本分类是指对某一类样本数远多于其他类的数据集进行模式分类的问题,重点关注的是对少数类样本的识别。然而传统分类器为了追求全局准确率而倾向于将少数类误分类为多数类,针对该问题我们从数据层面和算法层面提出了相应的解决方法,以提高对少数类的识别准确率。不平衡样本分类方法主要从数据层面和算法层面考虑。在数据层面,过采样算法能够增加样本信息,有助于少数类的识别。其中,BorderLine过采样算法以及Adaptive Smote过采样算法存在边界少数类样本识别不准确的问题,导致对于种子少数类样本选择不准确,难以合成符合样本分布的数据集;算法层面的方法主要通过修改现有分类器的损失函数实现,该类方法可使分类器更加注重少数类样本从而提高对少数类样本的识别准确率。其中,代价敏感ADC2算法样本的权重更新只考虑了基分类器准确率对下一轮样本权重的更新的影响,而没有考虑样本分布对样本权重更新的影响。AdaBoost算法存在少数类样本误分类总权重小...  (本文共60页) 本文目录 | 阅读全文>>

华中科技大学
华中科技大学

不平衡数据的研究及应用

随着信息技术的发展,各行各业的数据呈爆炸式产生.在这种形势下,如何快速有效地从数据的海洋中挖掘出有价值的信息和知识,就成为了各行各业所要解决的重要问题之一.而不平衡数据因其在实际生活中十分常见,成为了专家和学者们的研究热点和方向之一.本文以UCI上的信用卡客户违约数据集为例,该数据集正常客户(0类)样本数量为23364,违约客户(1类)样本数量为6636,类别比约为3.5:1.如果直接用分类方法RF对原始数据建模的话,AUC值为0.7195,违约客户的召回率仅0.34,所以本文通过不平衡数据的方法处理数据,在保证综合评价指标AUC高的基础上提高违约客户的召回率.研究内容如下:(1)数据预处理,包括缺失值和异常值检验,特征衍生,标准化,连续数据离散化,根据每个特征不同类别的样本分布和随机森林特征排序选取特征等;(2)数据层面选择最优方法,采样法包括欠采样、过采样、混合采样,欠采样又可分为基本的欠采样、基于聚类的欠采样(本文借鉴了C...  (本文共55页) 本文目录 | 阅读全文>>

《强激光与粒子束》2013年03期
强激光与粒子束

时空过采样探测系统性能仿真

基于星载扫描辐射计的工作原理,对传统的线列扫描成像系统和过采样系统的采样过程进行了数学建模和仿真成像,在两种采样模式下对点目标探测进行了仿真。在Matlab环境下对过采样探测系统进行了仿真图...  (本文共4页) 阅读全文>>

《半导体学报》1961年10期
半导体学报

18位过采样∑△A/D变换器设计

本文介绍18位精度音频(带宽20kHz)过采样∑△A/D变换器.文中根据精度、阶数和过采样比关系,设计了4阶2-2结...  (本文共9页) 阅读全文>>