分享到:

C4.5算法在就业信息中的应用

一、前言数据挖掘(DataMining),又称数据库中的知识发现(KnowledgediscoveryinDatabase,KDD),是指从大型数据库或数据仓库中提取隐含的、未知的、非平凡的及有潜在应用价值的信息或模式,它是数据库研究中的一个很有应用价值的新领域,融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。数据挖掘工具能够对将来的趋势和行为进行预测,从而能很好的支持人们的决策。当前国家对高校的就业率十分关注,如何使我们的毕业生能更快找到满意的工作就摆在我们面前。目前我院对毕业生就业状况分析比较简单,不够全面,也不够科学。根据这一情况,应用决策树,借助计算机对毕业生的就业信息进行挖掘,对目前的教学质量和学生工作质量进行科学的综合分析,寻找影响毕业生就业的因素,以便对我们今后的教学和学生工作提出指导性建议。二、决策树的概念及相关算法1.决策树的概念及生成树的操作过程用来表示决策规则的树结构。其中,内部结点表示某种...  (本文共3页) 阅读全文>>

《西安航空学院学报》2014年05期
西安航空学院学报

基于C4.5算法的民航客户价值细分研究

1概述近年来,我国民航业发展迅速,面临的市场竞争也越发激烈,尤其是随着高铁的开通和运营,民航运输受到了巨大冲击。为了应对行业内外的竞争,航空公司除了采取降低票价、完善管理等手段外,加强市场细分,对不同航线市场进行针对性的营销,也逐渐成为了航空公司的关注重点。在众多的市场细分标准中,以客户盈利能力为主要依据的客户价值细分,体现了以客户价值为中心的差异化营销思想,有助于企业营销资源的优化、价值客户的保持和利润的最大化,因此,客户价值细分在金融、电信等行业得到了大量应用。目前,关于旅客价值的市场细分在民航领域已有研究,但仍处于起步阶段:周虹等人[1]利用自组织神经网络,对旅客进行盈利能力细分,但其把累计票价花费作为价值旅客标准的正确性有待考量,如一个经常购买打折机票的旅客,虽然票价花费较多,但其对公司的价值却低于购买高价票的商务旅客[2];演克武等人[3]利用决策树ID3算法对民航旅客进行价值细分,但ID3算法无法处理连续性的数值,当...  (本文共5页) 阅读全文>>

《中国市场》2017年28期
中国市场

C4.5算法在大学生就业满意度分析中的应用研究

近年来,高等院校招生规模不断扩大,高校毕业生人数不断增多,预计2017年高校毕业生高达795万人。面对就业难的形势,高校毕业生的就业满意度得到了广泛的关注。就业满意度是反映就业机会的可获得性、工作稳定性、工作场所的尊严和安全、机会平等、收入、个人发展有关方面满意度的综合概念,也是反映高校人才培养水平的重要标志。[1]文章对某大学2017届毕业生进行问卷调查,并对所取得数据进行挖掘。基于大学生自身的角度,利用C4.5数据挖掘算法建立决策分类树,找出大学生自身因素对就业满意度的影响,为低届学生提供学习方向,为高校决策者提供教学和学生工作建议。[2]1 C4.5算法C4.5算法是决策树算法中最重要的算法之一,是对决策树核心算法ID3的改进算法,该算法的基本流程与ID3算法基本相同;但是,值得注意的是,C4.5算法用信息增益率来选择属性,克服了ID3算法中用信息增益来选择属性时偏向选择多值属性的问题。在C4.5算法中决策树结点属性的选择...  (本文共3页) 阅读全文>>

《佳木斯职业学院学报》2015年12期
佳木斯职业学院学报

C4.5算法在高职学校成绩分析中的应用

一、引言我们平时所以提到的成绩分析一般都是从试卷的难易程度、及格率、优秀率等方面进行的,这种方法只限于对该课程教学效果的评价,却无法得知学生成绩优劣是由哪些因素造成的。而且对于学校教学管理来讲,学生成绩数据还非常庞大。如何快速且准确地对学生成绩进行分析,研究影响学生成绩的主要因素,如何指导学生合理规划,提高成绩就显得尤为重要了。本文对江苏省徐州医药高等职业学校14级部分学生学习《全国计算机等级考试一级教程》情况进行了详细的调查研究,并通过数据挖掘中的决策树技术对学生成绩的进行分析,从中找到影响学生学习成绩的因素以及这些因素反映的相关问题,从而提高教学质量。二、C4.5决策树算法C4.5算法是由J.Ross Quinlan在ID3的基础上提出的,是ID3的改进算法。C4.5算法的核心思想是利用信息熵原理,选择信息增益率最大的属性作为分类属性,递归地构造决策树的分枝,完成决策树的构造[2]。C4.5算法分类速度快,精度高,是目前比较...  (本文共2页) 阅读全文>>

《忻州师范学院学报》2012年05期
忻州师范学院学报

决策树C4.5算法在学生成绩评估中的应用研究

目前各所高校都在学籍管理、成绩管理、师资管理等方面积累了大量的数据资源,采用数据挖掘技术可以充分地利用这些数据资源解决高校教育领域中存在的诸多决策性问题。本文主要利用收集到的和成绩相关的数据,使用数据挖掘技术中的C4.5决策树算法,以评估学生的成绩,并最终将其转换成规则,以引导教师在今后的工作中,采取适当、合理的方法,指导学生的学习,从而提高教学质量。1 C4.5算法决策树(Decision Tree)[1]是用于分类和预测的主要技术,它是通过一组无次序、无规则的实例,推理出决策树表现形式的分类规则的一种归纳学习的重要方法。决策树算法有很多种,其中C4.5算法[1,2]是基于ID3算法的决策树生成算法,该算法修改了分类评价函数,用信息增益率而不是信息增益作为分类评价函数。C4.5算法的主要思想是:设有一个训练数据集S,其中有m个类别,把这些类别设置为{C1,C2,…,Cm},选择一个属性V,假设V有n个互不重合的取值(V1,V2...  (本文共3页) 阅读全文>>

《微处理机》2010年06期
微处理机

基于决策树C4.5改进算法的交通数据挖掘

1引言数据挖掘是指从数据库中抽取隐含的、具有潜在使用价值信息的过程[1-2],是一种新型的数据分析技术。数据分类是数据挖掘中一个重要的内容。分类存在很多方法,常见的分类模型有决策树、神经网络、遗传算法、粗糙集、统计模型等。决策树算法有ID3、C4.5算法[3]。决策树学习采用自顶向下的递归方式,在决策树的内部结点进行属性值的比较,并根据不同的属性值判断从该结点向下的分支,在决策树的叶结点得到结论。所以从根到叶结点的一条路径就对应着一条合取规则,整个决策树就对应着一组析取表达式规则[4]。决策树算法是以实例为基础的归纳学习算法,以其易于提取显示规则、计算量相对较小、可以显示重要决策属性和较高的分类准确率等优点而得到广泛的应用。2决策树C4.5算法及其改进算法2.1决策树c4.5算法C4.5算法是Quinlan在1993年提出的,是以ID3算法为核心的完整的决策树生成系统,该算法的基本工作流与ID3算法相同。C4.5算法的核心思想是...  (本文共3页) 阅读全文>>