分享到:

迅速发展中的机器学习

三十年来,人工智能学科获得」’一飞快的进步和一定的成就。日本率先提出研制“第五代计算机,一具有人工智能的计算机,随后美国、英国等制订相应的研究计划,投资数亿美元对人工智能进行研究。研究人工智能和智能机的热潮几乎席卷全球。人L智能已成为举世瞩目的高技术。 甲、机器学习是人工智能研究的核心 机器学习在人工智能中占有特殊地位,因为学习是一切智能行为的核心。什么是人一1一智能呢?Bruce G .Buchanan在飞985年的心英国大百科全一}孙中指出:“人工智能是计算机科学中的一个分支,它研究用符号而不是川数值表达知识的方法,用规则集成或启发式方法来处理信熨、。”人l几智能的本质就是研‘光怎样]1l计算机模仿人脑从事推理、规划、设计、思考、学习等思维活动。近十年来,人工智能的理论和技术在专家系统、自然语言理解、模式识别与机器人方面的应用得到一定的成功,出现了各种智能系统。但是,这些智能系统普遍存在一个共同的弱点,就是缺乏学习能力,有错...  (本文共5页) 阅读全文>>

沈阳农业大学
沈阳农业大学

基于机器学习的农业文本分类方法研究

随着网络技术、数据库技术、计算机技术的迅速发展和Internet的日渐普及,特别是大数据时代的到来,在我们的实际生活中,每一个领域都在以史无前例的速度生产着海量的信息和数据,尤其的海量的杂乱无规则的文本信息,农业领域也不例外,我国在农业信息化发展进程中建设了大量的涉农网站、数据库、信息系统、专家系统等,积累了丰富的农业新闻、技术、市场等信息。随着移动互联网、智能手机等新技术在偏远农村的迅猛普及,制约农业信息化发展的“最后一公里”问题已经得到有效地解决,农业信息化服务的模式也将必然从传统的网站式服务逐步转为以信息推送为主。而农业文本的分类及相关预处理是实现农业信息有效推送的关键,因此,如何实现农业文本的自动分类,迅速挖掘有效信息,为人们所深度利用成为一个迫在眉睫的问题。为了有效地组织和管理杂乱无序的海量农业信息,针对目前农业文本分类系统不完善、农业语料库稀缺的问题,本文的主要研究内容及研究成果如下:(1)详细的阐述了农业文本语料库...  (本文共64页) 本文目录 | 阅读全文>>

安徽理工大学
安徽理工大学

基于机器学习的网络流量分类技术研究与应用

随着信息技术的蓬勃发展,种类繁多的互联网应用产生的大量流量占用了很多网络资源,在给服务质量带来巨大挑战的同时也给互联网安全产生负面影响。为了高效地利用网络资源并为网络管理者提供有效的管控手段,以辨别应用层协议为目的的网络流量分类技术成为近年来的研究热点问题。文章以此为研究背景,以具有相同五元组的传输层双向报文序列为研究对象,对基于机器学习的网络流量分类技术进行研究并加以应用。文章首先介绍了基于知名端口号、基于特征字匹配等传统的网络流量分类技术,但因其固有的缺陷导致分类精度已难以满足现阶段的需求,故引出基于机器学习的网络流量分类技术。随后文章对机器学习中的朴素贝叶斯、C4.5决策树、支持向量机以及集成学习分类算法进行了研究。之后,根据上述机器学习算法的特点,文章提出两种改进的分类算法,分别是以样本缩减策略为基础的基于支持向量机的改进算法以及基于结果反馈的机器学习改进算法。第一种改进算法以信息增益率和样本质心为理论基础,将对分类结果...  (本文共74页) 本文目录 | 阅读全文>>

《计算机研究与发展》2019年09期
计算机研究与发展

机器学习化数据库系统研究综述

数据库系统已经在商业中成熟应用,表现为产品级数据库系统如Oracle,PostgreSQL等持续稳定地运行,说明经典的数据库算法已经趋于完善,且基于这些算法的性能优化也已经达到很好的程度.但大数据时代下,数据库系统需要处理的数据量不断增加,工作负载也面临着快速而多变的特性,对数据库系统提出了更高的要求.一方面数据量持续增大,期望数据库系统具有更快的处理速度;另一方面查询负载的快速变化及其多样性要求数据库系统能够动态调整系统参数以达到最佳运行时状态.传统的数据库系统优化技术和静态地依靠数据库管理员(database administrator, DBA)对系统进行参数配置的方式,已不能处理新应用场景下对系统性能的优化.在人工智能蓬勃发展的推动下,将机器学习与数据库系统有机结合来改进系统性能成为本领域的研究热点,亦称为机器学习化的数据库系统研究.在2015年ACM SIGMOD会议上,Ré等人[1]最早明确提出关于机器学习与数据库系...  (本文共18页) 阅读全文>>

大庆石油学院
大庆石油学院

基于支持向量机的机器学习研究

学习是一切智能系统最根本的特征。机器学习是人工智能最具智能特征、最前沿的研究领域之一。机器学习研究的是如何使机器通过识别和利用现有知识来获取新知识和新技能。机器学习就是要使计算机能模拟人的学习行为,自动地通过学习获取知识和技能,不断改善性能,实现自我完善。 与传统统计学相比,统计学习理论是一种专门研究小样本情况下机器学习规律的理论。V.Vapnik 等人从六、七十年代开始致力于此方面研究,到九十年代中期,其理论不断发展和成熟。统计学习理论是建立在一套较坚实的理论基础之上的,为解决有限样本学习问题提供了一个统一的框架,它能将很多现有方法纳入其中,同时,在这一理论基础上发展了一种新的通用学习方法——支持向量机(Support Vector Machine 或 SVM),它已初步表现出很多优于已有方法的性能。 本文对机器学习、支持向量机的研究现状及应用领域进行了综述,阐述了机器学习和支持向量机的基本概念、基本模型和支持向量机的训练算法...  (本文共64页) 本文目录 | 阅读全文>>

浙江科技学院
浙江科技学院

统计机器学习模型SVM的对抗算法研究

统计机器学习的应用广泛,如人脸识别,自然语言处理等,本文研究的对抗算法则是从安全性出发,旨在确保应用免于受到外来攻击,增强鲁棒性,而支持向量机是目前理论最完备、应用最广的一类机器学习算法,本文将其作为研究对象。本文工作如下:(1)针对具体应用——入侵检测系统,本文提出一种基于SVM入侵检测系统的新颖攻击方法——毒性攻击,该方法通过篡改污染训练数据,进而误导SVM的机器学习过程,降低入侵检测系统的分类模型对攻击流量的识别率;从攻击流量的召回率和精度这两个指标对攻击效果进行评估,实验表明毒性攻击可有效的降低入侵检测系统的识别率;(2)针对图像数据,采用一种基于粒子群优化的对抗样本生成算法,本文提出了SVM攻击显著性特征的概念,在容易处理线性模型的特征空间寻找攻击显著特征,再逆映射回输入空间完成原始样本的扰动,充分利用了特征空间上线性模型上易寻优的特点,同时又利用了原始输入空间篡改数据的可解释性优点;在Yale人脸数据库在7%扰动量下...  (本文共55页) 本文目录 | 阅读全文>>