分享到:

基于随机森林算法的我国期权市场交易策略研究

2015年2月9日,中国资本市场迎来了第一只场内期权产品——上证50ETF期权,该期权以上证50交易型开放式指数证券投资基金作为标的资产,在上海证券交易所上市交易。本文以上证50ETF期权作为研究对象,研究了目前较为流行的机器学习算法中的随机森林算法在期权定价和期权交易中的应用。随机森林林是一个由一组决策树分类器组成的集成分类器,具有运算速度快、缺失值容忍度高、不容易过拟合等优点,且其能够处理多达上千个自变量,算法自然包括变量交互作用,是一种理想的期权定价工具。首先,本文以上证50ETF期权2015年2月9日至2018年4月4日历史数据构建了随机森林期权定价模型并对模型的最佳参数选择进行讨论分析,结果表明随机森林期权定价模型对样本内的期权价格具有较好的拟合优度,模型拟合优度达到95%以上。其次,按年度划分训练样本,本文进一步讨论了随机森林期权定价模型在不同时间区间上的预测效果,2015年至2017年各年的拟合优度均在95%以上。  (本文共60页) 本文目录 | 阅读全文>>

华北电力大学(北京)
华北电力大学(北京)

基于组合模型的销售量预测及优化

本文在大数据辅助经营决策的背景下,建立了基于时间序列的复合销售预测模型,即利用随机森林算法提纯传统时间序列模型残差,得到精度更高的时间序列预测值,为商家市场规划、销售决策和运营战略提供数据支持。本文利用多维度、多样本的口碑商家数据进行实例验证,分别建立了基于ARMA模型和基于随机森林模型的预测模型,通过数据预处理、特征提取、降维等一系列特征工程,获得了较高质量的训练数据集,并通过对参数的不断调优得到了一个有较强学习能力的模型。最后针对ARMA模型无法更好地提炼非线性信息,而随机森林模型对非线性信息有较强的学习能力的特性,综合两者优势,利用随机森林优化ARIMA预测残差,得到了一个预测能力更强的预测模型。同时,通过对口碑商品销售数据的分析,得到各因素对客流量的影响力,为店铺经营者提供运营参考。  (本文共43页) 本文目录 | 阅读全文>>

重庆邮电大学
重庆邮电大学

基于随机森林和时间序列分析的财务危机预警算法研究

在中国经济发展进入新常态、政府鼓励“大众创新,万众创业”的情况下,国内的经济环境正在飞速发展。政府监管机构、专业金融机构、企业决策者以及投资者等都需要能够及时的掌握最新的企业数据信息,并期望从企业当前的财务数据中预知企业的进一步发展方向,提前做出下一步的筹划。这就需要建立一种可根据历史数据信息进行动态分析的财务危机预警体系。针对该研究目标,本文提出了一种K折随机森林算法与时间序列分析模型相结合的企业财务危机预警算法。该算法利用时间序列分析模型能够对历史数据进行短期预测的能力,使用时间序列分析模型对新构建的财务指标数据进行预测。利用K折随机森林对预测所得的财务数据进行财务状况分析,实现了动态财务危机预警的目的。在本研究过程中,利用随机森林具有的不需要过多的先验知识以及良好的抗噪能力和较高的分类精确度的优点,来实现企业财务状况分类。在进行财务危机预警过程中对传统随机森林算法的分类回归决策树的样本集抽样方式进行了改进,提出了一种K折随...  (本文共67页) 本文目录 | 阅读全文>>

青海师范大学
青海师范大学

基于随机森林的湟水流域土地利用/土地覆被变化检测

土地利用/土地覆被变化已成为当前全球环境变化研究的热点领域之一。中等分辨率的美国陆地资源卫星数据由于其具有连续的档案的数据提供因而成为全球及区域尺度上土地利用/土地覆被重要的遥感数据源。在土地利用类型多样、垂直差异性明显、空间异质性高的复杂地形区,很难获取较高的土地利用分类精度。研究随机森林方法对复杂地形区的适应性,对复杂地形下遥感分类准确性的提高以及探索复杂地形区湟水流域土地利用/土地覆被时空变化规律具有重要意义。本文以高海拔、地形复杂破碎的湟水流域为研究区,基于1999年Landsat7ETM+、2011年Landsat5TM以及2017年Landsat8OLI影像,结合光谱、纹理、地形信息,采用随机森林方法对湟水流域三期遥感影像分区进行土地利用/土地覆被信息提取及精度评价,最后选择分类后比较的变化检测方法对湟水流域近18年来土地利用/土地覆被变化进行动态分析。主要结论如下:(1)采用随机森林算法对1999年Landsat7...  (本文共74页) 本文目录 | 阅读全文>>

东北林业大学
东北林业大学

基于多光谱CCD影像和LiDAR数据的单木树种分类研究

森林植被是构成森林资源的主体,准确识别森林植被的类型可以为森林资源研究和利用奠定基础。随着遥感技术的发展,高空间分辨率数据的出现使得树种分类已经可行。然而,传统的光学遥感仅能描述地物的水平格局,对于单木树种识别存在很大困难。激光雷达(light detection and ranging,LiDAR)在单木树种分类中具有巨大的潜力和优势。本研究以东北林业大学帽儿山实验林场中林施业区的两块1O0m×1OOm方形样地为研究对象。首先,对LiDAR数据进行预处理,得到冠层高度模型(canopy height model,CHM),然后对原始的CHM进行优化;之后使用基于区域截面分析法(region-based hierarchical cross-section analysis,RHCSA)进行单木树冠分割,然后进行精度检验并得到1对1匹配树冠;再以多光谱遥感CCD(charge coupled device)影像和机载LiDAR为...  (本文共56页) 本文目录 | 阅读全文>>

长安大学
长安大学

基于网页数据挖掘的高铁出游影响因素研究

随着国家法定节假日的增多和人们生活水平消费能力的提升,人们的消费观念逐渐改变,短期旅游出行逐渐增多。节假日出行增多也产生一系列交通需求问题,高速公路拥堵,停车场拥挤都与人们所追求的高品质出行相矛盾。高铁的出现降低了区域之间时间成本,缩短了城际之间的距离,其价格稳定,速度快,安全舒适等优点使小汽车出行和飞机出行旅游者逐渐转移交通出行方式,交通出行结构逐渐改变。随着高铁线路的大量开通,周边游市场快速增加,使在周末跨省旅行,多个景点旅行得以实现,沿线高铁旅游市场火爆,甚至在旅游网站中衍生出了高铁旅游项目。随着高铁出行中探亲和商务需求的饱和,高铁旅游潜在经济将大幅增长。但研究旅游者与高铁乘坐选择的影响因素比较薄弱,本文综合分析了个人特征、高铁站点特征和高铁线路特征与旅游者乘坐高铁出行特征的关系,旨在高铁为旅游出行者提供更好服务。网络的快速发展出现了各式各样的旅游网站,涌现出各种旅游信息,也吸引了网民分享旅游经历,网络中积累了大量的旅游者...  (本文共109页) 本文目录 | 阅读全文>>