分享到:

基于SVM的中文文本分类系统的建模与实现

随着通信技术和计算机技术、尤其是Internet的飞速发展,各种各样的信息成几何级数增长,作为传统的信息载体,文本信息更是如此。为了能在海量的文本中及时准确地获得有效的知识和信息,文本表示技术以及文本自动分类技术受到了广泛的关注。基于支持向量机(SVM)的文本分类算法,更是成为当前的一个研究热点。构建一个开放的灵活的SVM研究平台,有助于进一步推动将SVM用于中文文本分类的研究。本文在Microsoft Windows 2000的Visual C++ 6.0和MS SQL Server2000平台下设计并实现了一个基于支持向量机的、便于重组重构并能实时统计分析各类中间结果的中文文本分类系统,并在此系统上对SVM用于中文文本分类的性状作了部分研究。本文在传统中文文本自动分类模型框架的基础上,采用数据库作为耦合中介,松解了模块间的紧耦合,建立了SVM研究平台的系统模型框架。基于新模型,不仅可以方便高效地实现文本特征处理阶段所涉及的类  (本文共61页) 本文目录 | 阅读全文>>

大连海事大学
大连海事大学

基于语义相似度的中文文本分类系统的研究与实现

文本分类是通过分析待分类的对象,提取待分类对象的特征,比较待分类对象和系统预先定义好的对象的特征,将待分类对象划归为最相近的一类,并赋予相应的分类号。文本分类是文本挖掘技术的基础和核心,是近年来数据挖掘领域的一个研究热点。特征提取和文本表示是文本分类当中的关键技术。在传统的文本分类系统.中,假设文本中的词条之间是线性无关了,文本的向量空间中的特征维度间是正交关系,但实际上在文本的上下文当中,词条之间存在着各种关系,如同义、近义、关联等。利用这些关系和词语之间的相似程度,我们将关键词映射到概念空间,用概念作为特征来表示文档进行分类。这样许多相似度非常高的词语被转换成一个概念,而一个多义词在不同的语境下也会被映射到不同的概念,提高了特征词的凝聚度,克服了传统分类系统中基于关键词的分类方法缺陷,解决了维度灾难,提高了分类准确率。本文在设计特征提取模块的过程中,采用数据库作为耦合中介,松解特征模块中各个部分的紧耦合度,建立特征提取模块的...  (本文共80页) 本文目录 | 阅读全文>>

《电子技术与软件工程》2016年22期
电子技术与软件工程

基于贝叶斯分类器的中文文本分类

在数据挖掘领域中,文本分类备受关注。本文研究了基于贝叶斯分类器的中文文本分类的相关问题,提出了一种以...  (本文共1页) 阅读全文>>

《信息与电脑(理论版)》2012年01期
信息与电脑(理论版)

中文文本分类系统构架设计

本文主要是分析了中文文本分类所要用到...  (本文共2页) 阅读全文>>

《湖北工业大学学报》2010年02期
湖北工业大学学报

中文文本分类中特征提取的方法

讨论了文本分类系统中的特征提取方法.探讨了文档频率(DF)、信息增益(IG)、互信息算法(MI)三种...  (本文共4页) 阅读全文>>

《情报理论与实践》2009年06期
情报理论与实践

中文文本分类反馈学习研究

本文依据反馈学习的思想和支持向量机分类算法,在分析中文文本分类过程的基础上,给出了基于反馈学习的中...  (本文共4页) 阅读全文>>

《微电子学与计算机》2006年S1期
微电子学与计算机

中文文本分类系统的设计与实现

文章介绍了中文文本分类系统的基本过程及其关键技术,比较和分析Rocchio、朴素贝叶斯(NB...  (本文共4页) 阅读全文>>