分享到:

基于PLS的文本分类技术研究

近年来,随着网上电子文档的数量以指数级的速度增长,文本分类技术在信息检索、信息过滤以及内容管理等各项应用中变得越来越重要,已经成为信息检索和机器学习中的前沿研究领域。自动文本分类是指在给定的分类体系下,对未知类别的文档进行自动处理,并根据文档特征来判断其所属类别的过程;基于机器学习的文本分类技术已经成为主流技术。本文旨在运用偏最小二乘回归和核偏最小二乘回归的统计理论,研究一些基于学习的文本分类技术。在文本分类中,有效的维数约简可以提高学习任务的效率和分类性能。特征选择和特征抽取是维数约简常用的两种方法。特征选择的优点是所选择的特征都有很好的语义解释,但在文本分类中效果不够理想。特征抽取能够较好地处理多义词、同义词问题,但是不能给出降维后所得到特征的语义解释。为了有效地提取特征所在类别的语义信息,本文提出了基于潜在语义文本分类模型(Latent Semantic Classification Model:LSC)的特征选择两步法:  (本文共89页) 本文目录 | 阅读全文>>

《情报理论与实践》2010年11期
情报理论与实践

跨语言文本分类技术研究进展

本文以综述的形式对跨语言文本分类技术目前的发展态势进行了介绍,从应用背景出发,了解跨语言文本分类技术的社会需求...  (本文共4页) 阅读全文>>

《情报科学》2009年07期
情报科学

文本分类技术应用于学科导航分类的可行性探讨

在介绍文本分类技术的基础上,结合学科导航特点,探讨了将文本分类技术应用于学科导...  (本文共4页) 阅读全文>>

《武警学院学报》2007年12期
武警学院学报

现代文本分类技术研究

分析了当前的文本分类技术,总结了文本分类需要解决的问题;在详细比较了...  (本文共4页) 阅读全文>>

《中国无线电》2020年01期
中国无线电

一种基于语音识别与文本分类技术的非法广播判别方法

将人工智能技术运用到广播监管系统中可以显著提高监管的效率、降低监管成本。综合人工智能技术在无线电监管中的应用,提...  (本文共5页) 阅读全文>>

天津医科大学
天津医科大学

文本分类技术在文献筛检及质性研究中的应用研究

目的:随着机器学习技术的发展,人类的各种需求(图像识别、音频转录、个性化产品生产等)日益增强,深度学习技术的一系列方法也慢慢走入人类的视野。深度学习可以克服机器学习无法处理原始形态的真实世界数据的缺陷,通过结合多层神经网络,深度学习能够从原始形态的数据中提取有用的信息。在可重复的检索策略的指导下,客观、全面的文献检索的过程是影响系统综述所提供证据质量高低的关键,但是文献筛检过程也是系统综述中最费时费力的工作。质性研究的研究方法均为对研究对象进行观察、访谈、录音或笔录等,即使是访谈录音,事后整理及分析资料时仍然要整理为文字的形态,会产生大量的文本文件,数据分析过程中,学者们的分析资料形式均为人工手动编码、归纳,会造成大量的人力资源消耗。综上所述,为了达到节省文献筛检以及质性研究资料分析方面的人力资源的目的,本研究旨在探讨文本分类技术在系统综述和Meta分析文献筛检以及质性研究数据分析方面的应用价值。材料与方法:本研究的数据来自两部...  (本文共102页) 本文目录 | 阅读全文>>