分享到:

二手车保值率影响因素分析

随着经济的迅速发展,我国迎来了“互联网+”和“万众创新”的发展浪潮,这也给二手车行业带来了诸多发展机遇。本文针对瓜子二手车直卖网爬取6425条数据进行描述性统计分析,通过建立统计模型和算法模型研究了二手车保值率的影响因素,旨在为用户提供一种评估二手车保值率的方法,帮助用户做出更好的决策。本文的主要思路是建立logistic回归、决策树、随机森林和XGBoost四个模型,根据混淆矩阵得出的分类预测准确率,对以上四个模型进行评估,选出准确率最高的模型为最优模型,进而从此最优模型出发得到影响二手车保值率的重要影响变量。具体工作概括如下:1.收集并整理数据。利用八爪鱼采集器爬取二手车信息共6425条,包括二手车的原价与报价、使用状况、基本属性、动力情况、内外部配置和故障排查等方面。对这些数据进行清洗和特征构造,使之适应本文所选模型的建立。2.数据的描述性统计分析。从保值率、使用状况、基本属性、动力情况、内外部配置和故障排查六个方面对二手  (本文共52页) 本文目录 | 阅读全文>>

天津财经大学
天津财经大学

北京二手车保值率的影响因素分析

近年来,随着我国居民收入水平的快速提高,居民消费能力明显增强,汽车保有量逐年增加,而且汽车更新换代的频率也越来越快,二手车交易市场日益活跃。对于许多买车或者卖车的人来说,二手车的保值率都是他们十分看重的因素。对新车购买者而言,选择高保值率的新车,可以保证自己的车在开了几年之后可以卖个好价钱,因此了解某款车的保值率可作为新车购买的一个重要的参考依据;对二手车买卖者而言,获得保值率可了解对应车型的基准价格,保证在二手车交易中立于不败之地;对于汽车制造厂家而言,了解车型的保值率有助于二手车回购等新业务的顺利开展。在大数据之前,个人二手车交易、银行抵押贷款等都有自己的二手车估值算法,如年限比率法、综合分析法等。这些算法一方面考察的因素较为单一,另一方面人的经验在其中作用相对较大,因此这些算法估值的误差相对来说比较大。基于此,本文从大数据的角度出发,利用大量的二手车交易数据,来确定二手车保值率的影响因素。首先,本文以北京瓜子二手车直卖网上...  (本文共54页) 本文目录 | 阅读全文>>

华北电力大学(北京)
华北电力大学(北京)

基于组合模型的销售量预测及优化

本文在大数据辅助经营决策的背景下,建立了基于时间序列的复合销售预测模型,即利用随机森林算法提纯传统时间序列模型残差,得到精度更高的时间序列预测值,为商家市场规划、销售决策和运营战略提供数据支持。本文利用多维度、多样本的口碑商家数据进行实例验证,分别建立了基于ARMA模型和基于随机森林模型的预测模型,通过数据预处理、特征提取、降维等一系列特征工程,获得了较高质量的训练数据集,并通过对参数的不断调优得到了一个有较强学习能力的模型。最后针对ARMA模型无法更好地提炼非线性信息,而随机森林模型对非线性信息有较强的学习能力的特性,综合两者优势,利用随机森林优化ARIMA预测残差,得到了一个预测能力更强的预测模型。同时,通过对口碑商品销售数据的分析,得到各因素对客流量的影响力,为店铺经营者提供运营参考。  (本文共43页) 本文目录 | 阅读全文>>

上海交通大学
上海交通大学

基于随机森林算法的我国期权市场交易策略研究

2015年2月9日,中国资本市场迎来了第一只场内期权产品——上证50ETF期权,该期权以上证50交易型开放式指数证券投资基金作为标的资产,在上海证券交易所上市交易。本文以上证50ETF期权作为研究对象,研究了目前较为流行的机器学习算法中的随机森林算法在期权定价和期权交易中的应用。随机森林林是一个由一组决策树分类器组成的集成分类器,具有运算速度快、缺失值容忍度高、不容易过拟合等优点,且其能够处理多达上千个自变量,算法自然包括变量交互作用,是一种理想的期权定价工具。首先,本文以上证50ETF期权2015年2月9日至2018年4月4日历史数据构建了随机森林期权定价模型并对模型的最佳参数选择进行讨论分析,结果表明随机森林期权定价模型对样本内的期权价格具有较好的拟合优度,模型拟合优度达到95%以上。其次,按年度划分训练样本,本文进一步讨论了随机森林期权定价模型在不同时间区间上的预测效果,2015年至2017年各年的拟合优度均在95%以上。...  (本文共60页) 本文目录 | 阅读全文>>

重庆邮电大学
重庆邮电大学

基于随机森林和时间序列分析的财务危机预警算法研究

在中国经济发展进入新常态、政府鼓励“大众创新,万众创业”的情况下,国内的经济环境正在飞速发展。政府监管机构、专业金融机构、企业决策者以及投资者等都需要能够及时的掌握最新的企业数据信息,并期望从企业当前的财务数据中预知企业的进一步发展方向,提前做出下一步的筹划。这就需要建立一种可根据历史数据信息进行动态分析的财务危机预警体系。针对该研究目标,本文提出了一种K折随机森林算法与时间序列分析模型相结合的企业财务危机预警算法。该算法利用时间序列分析模型能够对历史数据进行短期预测的能力,使用时间序列分析模型对新构建的财务指标数据进行预测。利用K折随机森林对预测所得的财务数据进行财务状况分析,实现了动态财务危机预警的目的。在本研究过程中,利用随机森林具有的不需要过多的先验知识以及良好的抗噪能力和较高的分类精确度的优点,来实现企业财务状况分类。在进行财务危机预警过程中对传统随机森林算法的分类回归决策树的样本集抽样方式进行了改进,提出了一种K折随...  (本文共67页) 本文目录 | 阅读全文>>

青海师范大学
青海师范大学

基于随机森林的湟水流域土地利用/土地覆被变化检测

土地利用/土地覆被变化已成为当前全球环境变化研究的热点领域之一。中等分辨率的美国陆地资源卫星数据由于其具有连续的档案的数据提供因而成为全球及区域尺度上土地利用/土地覆被重要的遥感数据源。在土地利用类型多样、垂直差异性明显、空间异质性高的复杂地形区,很难获取较高的土地利用分类精度。研究随机森林方法对复杂地形区的适应性,对复杂地形下遥感分类准确性的提高以及探索复杂地形区湟水流域土地利用/土地覆被时空变化规律具有重要意义。本文以高海拔、地形复杂破碎的湟水流域为研究区,基于1999年Landsat7ETM+、2011年Landsat5TM以及2017年Landsat8OLI影像,结合光谱、纹理、地形信息,采用随机森林方法对湟水流域三期遥感影像分区进行土地利用/土地覆被信息提取及精度评价,最后选择分类后比较的变化检测方法对湟水流域近18年来土地利用/土地覆被变化进行动态分析。主要结论如下:(1)采用随机森林算法对1999年Landsat7...  (本文共74页) 本文目录 | 阅读全文>>

东北林业大学
东北林业大学

基于多光谱CCD影像和LiDAR数据的单木树种分类研究

森林植被是构成森林资源的主体,准确识别森林植被的类型可以为森林资源研究和利用奠定基础。随着遥感技术的发展,高空间分辨率数据的出现使得树种分类已经可行。然而,传统的光学遥感仅能描述地物的水平格局,对于单木树种识别存在很大困难。激光雷达(light detection and ranging,LiDAR)在单木树种分类中具有巨大的潜力和优势。本研究以东北林业大学帽儿山实验林场中林施业区的两块1O0m×1OOm方形样地为研究对象。首先,对LiDAR数据进行预处理,得到冠层高度模型(canopy height model,CHM),然后对原始的CHM进行优化;之后使用基于区域截面分析法(region-based hierarchical cross-section analysis,RHCSA)进行单木树冠分割,然后进行精度检验并得到1对1匹配树冠;再以多光谱遥感CCD(charge coupled device)影像和机载LiDAR为...  (本文共56页) 本文目录 | 阅读全文>>