分享到:

决策树生成系统

分类是数据挖掘领域中的一个重要研究课题。在分类的过程中,首先给定一个包含多条记录的训练集,每条记录都包含多个属性,其中一个属性标明每条记录属于哪一类,我们称之为类标号。分类的目的就是建立一个以类标号属性除外的其它属性为判定条件的模型,通过这个模型可以对以后未知类标号的记录进行正确分类。决策树方法是分类中最常用的工具之一。它是一个类似于流程图的树状模型,其中每个内部节点表示一个属性测试,每个分枝代表一个测试输出,而每个树叶节点代表“类”或“类分布”。通过决策树模型对一条记录进行分类就是通过按照模型中属性测试结果从根到叶找到一条路径,最后叶节点的类标号就是该记录的分类结果。本课题研究的内容是建立一个完整的决策树生成系统。它包括数据预处理、决策树的生成、决策树剪枝、分析和评估、生成分类规则五个部分。数据预处理中主要包括数据清洗(减少噪声或处理丢失的值)、相关分析(删除不相关或冗余属性)太原理工大学硕士学位论文决策树生成系统和数据变换(  (本文共73页) 本文目录 | 阅读全文>>

东北师范大学
东北师范大学

基于粗糙集理论的决策树生成系统

数据挖掘是利用分析工具从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取出隐含在其中事先未知、潜在有用的信息和知识的过程,建立数据间关系模型,用其做出预测,从而为决策者提供辅助决策。分类是数据挖掘中的一种重要方法。决策树是一种常用的分类模型,并以其能直接体现数据特点,分类效率高、速度快、理解性好等特点在数据挖掘及其它领域中被广泛使用;粗糙集理论将分类和知识联系在一起,认为知识是将对象分类的能力,是一种处理模糊和不精确数据的数学工具,具有很强的知识获取能力,本论文将基于粗糙集理论实现决策树生成系统。决策树生成系统,包括数据预处理,连续属性离散化,决策树生成,剪枝,评估,及预测,决策森林,生成规则几个部分。数据预处理主要针对数据缺失进行处理,主要方法为忽略元组,使用常量填充,或属性平均值填充,或元组同一类的样本平均值填充。连续属性离散化使用基于变精度粗糙集理论的频率宽度方法,决策树生成使用基于变精度粗糙集理论的分类方法。针对目...  (本文共67页) 本文目录 | 阅读全文>>

天津大学
天津大学

基于数据挖掘和数据融合的游戏关卡自动生成系统

在游戏开发过程中,关卡设计作为游戏开发的重点,如果都由设计师逐一设计将花费大量的时间和资本,而且玩家黏着度低。同时,游戏玩法数据中蕴含着对游戏设计有重要意义的数据。数据挖掘和数据融合是两种分析处理数据、提取有用知识的技术,它们在功能上具有一定的互补性。因此,本文提出了一种基于数据挖掘和数据融合技术的游戏关卡自动生成方法,该方法首先利用布尔逻辑和粗糙集理论相结合的离散化方法对游戏玩法数据进行预处理,并提出了一种基于信息增益的属性约减算法消除冗余属性;接着利用决策树ID3算法建立一个游戏难易程度的评估模型,构造决策树;然后利用数据融合D-S算法得到体现玩家行为的数据,并结合决策树得到对于玩家的难易程度,同时把新的体现玩家行为的数据存入训练数据集中;最后根据难易程度获得游戏关卡参数,并根据关卡数据自动生成游戏关卡。本文对数据挖掘和数据融合两种技术进行深入的研究和实验,研究的成果如下:⑴针对传统的均匀离散化等算法需要人为的设定一些参数处...  (本文共52页) 本文目录 | 阅读全文>>

北京工业大学
北京工业大学

基于随机森林的动画主动学习系统

随着计算机软硬件技术的发展,3D动画技术因其简便、高效、更具表现力的特点得到越来越广泛的应用。在二十世纪九十年代,中国科学院陆汝钤院士提出全过程计算机辅助动画自动生成技术,这是一种全新的基于人工智能的三维动画生成技术,它从受限的自然语言书写的故事开始,直至最终生成动画,每一步都是在计算机辅助下完成。2008年,中国科学院张松懋研究员提出将全过程计算机辅助动画自动生成技术应用在手机短信上,并从技术上实现了该设想--手机3D动画自动生成系统(动画生成系统)。机器学习已经成为当下人工智能的核心方法,各种智能学习算法被广泛地应用于预测评估等实际问题中。手机3D动画自动生成系统的整体实现采用基于知识的方法,目前面临两个问题:(1)缺乏学习能力,动画生成系统从2008年开始运行至今所积累的大量短信动画数据被浪费;(2)生成动画的质量依赖于系统设计者的水平,而系统的使用者——用户无法参与动画的生成。为了解决这两个问题,本文首次为动画生成系统设...  (本文共60页) 本文目录 | 阅读全文>>

西安电子科技大学
西安电子科技大学

基于决策树生成软件测试方案的研究与实现

随着软件测试的规模越来越大,在软件测试中引入自动化测试技术变得非常必要,将软件的测试工作尽可能的实现自动化已经是绝大多数软件企业的共识了,因为自动化测试有很多的优点,与传统的手工测试方法相比较它效率更高,测试结果可复现性好。然而,在整个软件测试过程中,根据测试范围制作与之对应的测试方案的工作一直以来都是依据个人经验手工完成的,这样的方式不仅效率不高,而且极大地依赖于工作人员对软件产品和测试用例的熟悉程度,在一定程度上影响了测试工作的效率。本文针对生成软件测试方案过程中存在的问题,深入研究了制作软件测试方案的各个环节,对比分析了国内外生成软件测试方案方法的特点和不足,并且结合企业软件测试的实际业务情况,提出了一种能够自动化的生成软件测试方案的方法,该方法首先可以提高生成软件测试方案的效率,其次生成的软件测试方案覆盖的测试范围更加全面,并且可以减小工作人员在制作软件测试方案方面严苛的经验要求。论文首先介绍了自动生成测试方案技术应用的...  (本文共79页) 本文目录 | 阅读全文>>

广东工业大学
广东工业大学

提高客户价值的可拓策略生成系统研究

随着社会经济全球化发展,企业竞争由产品竞争转向市场竞争,市场竞争的关键在于争夺客户资源,如今,客户已经成为企业生存发展的重要资源。为了维持企业的长期发展,增加企业的核心竞争力和提高企业的利润,很多企业管理者都越来越重视客户关系的管理和客户的价值的提高。此外,客户关系理论也越来越受到研究者的重视,许多国内外学者对客户关系和客户价值进行了长期的研究,并将研究的成果成功应用到商业领域。本文通过对客户价值理论的了解、利用决策树技术和可拓学方法理论分析设计了提高客户价值的可拓策略生成系统,从理论上和实践上探索了决策树技术在策略生成系统的应用问题,为以后的研究提供了基础和方向。在目前的可拓策略生成系统的方法中,一般都是先建立矛盾问题的可拓模型,然后通过关联函数分析,建立问题库和策略库,在策略生成阶段,采用菱形思维方法生成策略,即先用发散思维对矛盾问题的相关树进行可拓变换,然后采用收敛的思维方法对生成的策略进行评价,推荐优度高的策略供决策者选...  (本文共51页) 本文目录 | 阅读全文>>