分享到:

网络舆情热点话题发现研究

舆情是指公众对社会中某些热点事件所持的社会政治态度,是较多群众关于社会各种现象、问题所表达的信念、态度、意见和情绪的总和。随着社会科技进步和互联网的广泛应用,网络成为人们获取信息、表达观点的重要平台,网络舆情也成为社会舆情的重要表现形式。如果对网络舆情处理不当,可能造成舆情事件爆发,对社会影响巨大,因此越来越多的学者投入到网络舆情分析研究中。舆情热点话题研究是舆情分析中的一个重要研究方向,具体包括舆情话题的发现、热点话题的识别以及舆情热点话题的分析等。话题发现是舆情热点话题研究的基础,已有研究主要集中在话题聚类方法的改进上,忽略了聚类之后的话题表示。本文提出将single-pass增量聚类和加权关联方法结合,对网络舆情文本信息流进行实时话题检测并对话题进行提取和表示,通过理论分析和在小数据集上进行模拟实验,证明了方法在话题发现实际应用中的可行性。从检测出来的舆情话题中识别热点并加以分析是舆情热点话题研究的重点。基于热点话题的演变  (本文共73页) 本文目录 | 阅读全文>>

福州大学
福州大学

网络舆情热点话题发现技术研究

随着网络的迅猛发展,网络已成为广大网民获取与发布信息不可或缺的渠道,因此网络舆情信息的舆论导向作用愈来愈大。如何及时并有效的发现舆情热点,并对关注热点跟踪分析,保障信息安全,监控舆论,已成为舆情研究领域中的一个重点和难点,也是一个挑战。本文综合分析了国内外话题识别与跟踪的研究现状,针对新闻报道形式的网络舆情语料,利用网络舆情分析处理技术,自动识别舆情热点话题。本文的核心工作包括舆情信息采集、舆情信息预处理、话题发现、热点话题识别。首先,网络舆情信息获取,针对传统的网络爬虫的两大缺陷,采取一定的网页分析策略,过滤无关网页,提高了舆情信息采集的效率及质量。另外,分析网页模板,设计一种基于模板与正则表达式结合的web信息抽取方法,进行网页清洗,将抽取到的有用信息保存到数据库服务器中。其次,舆情信息预处理,对采集的新闻报道正文进行新闻特征提取,利用向量空间模型表示新闻报道标题及正文内容,引入了命名实体识别对新闻特征权重计算的改进,设计了...  (本文共59页) 本文目录 | 阅读全文>>

《现代情报》2017年03期
现代情报

我国网络舆情热点话题发现研究综述

随着互联网的快速发展,网络舆情对社会的影响不容忽视。若能够及时从海量数据中发现热点话题,追踪热点话题演变以及预测话题的倾向,对于帮助相关...  (本文共7页) 阅读全文>>

天津科技大学
天津科技大学

基于语义的网络舆情热点话题发现研究

随着社会的进步,互联网逐渐成为人们表达舆论的又一个重要平台。网络具有传播迅速、用户匿名等诸多特性,由于这些特点,一方面,网络对社会舆论起到了很好的监督作用,但另一方面也容易包含反动、迷信和黄色的内容,给社会安定甚至国家安全带来困扰。因此,如何在丰富的网络信息中及时发现网民共同关心的热点问题,帮助政府及时了解当前社会重要事件及舆论方向就显得十分重要。本文主要研究如何在海量信息中找出被大众关注的热点话题。现有的网络舆情热点话题发现方法大多是运用传统的文本聚类技术,但传统技术没有考虑文本信息间的语义联系,往往得到不准确的话题分类结果,也就影响了话题的热点分析效果。本文针对在文本聚类过程中容易缺失语义信息的缺点,对传统方法进行改进,具体工作主要有:一是信息采集和预处理技术,研究如何从松散的非结构化信息中采集并抽取语料。利用网络爬虫技术和网页净化技术、中文分词技术,实现网络信息的自动采集与结构化存储;二是话题发现技术,通过文本聚类算法,将...  (本文共68页) 本文目录 | 阅读全文>>

辽宁科技大学
辽宁科技大学

网络舆情热点话题自动化发现技术研究

随着互联网的飞速发展,网络信息爆炸式增长,网络已经成为人们发布和获取信息的重要渠道。面对浩瀚的网络信息,如何从中获取有用的信息,已成为当今社会亟待解决的问题。在这样的背景下,网络热点话题的识别与热度分析,凸现出了其自身的重要性,将成当前研究者的一个研究热点。本文采用话题自动发现技术和话题热度分析技术对互联网新闻报道热点话题进行挖掘和分析。本文的主要研究内容如下:(1)提出了基于词频的特征提取算法。该算法利用正则表达式提取已标注的新闻文本中的名词和动词作为特征词。实验表明提高了特征提取的精度和速度,降低了特征向量的维数,从而解决了向量爆炸的问题。(2)通过分析网络新闻报道的结构特点,在特征权重计算时,分别统计特征词出现在标题和正文中的词频,并将标题中出现的特征词乘以一个加权因子,从而提高可能成为热点的特征词的权重。实验表明该方法提高了热点话题的发现能力。(3)通过传统的聚类算法的对比和分析,针对其缺点和不足,提出了基于二层策略的聚...  (本文共61页) 本文目录 | 阅读全文>>

昆明理工大学
昆明理工大学

网络舆情热点话题自动发现技术的研究与实现

随着网上信息量的迅猛增长,用户想快速地从海量的网络信息中获取自己感兴趣的信息资源变得十分困难。由于互联网上各个新闻站点的参差不齐,并且各个站点对同一事件报道的角度和立场不同,如果用户仅仅通过某一站点的报道,很难对这一事件做出全面的了解和把握。因此用户迫切需要一种工具,利用它来自动发现社会热点新闻,并将与特定事件相关的信息自动汇总,及时呈现给用户。本文从网络热点话题自动发现的功能设计入手,分析了系统开发的环境、数据处理流程和数据库的基本设计等方面的问题;接着深入研究了网络热点话题自动发现系统中的信息采集、信息预处理、热点话题发现等模块中的相关技术;然后介绍了这三个系统模块的设计实现。本文最后通过几组实验来验证本文提出的OICKM算法、OICKMSP算法的效率和精度。本文的主要工作如下:(1)通过对国内外相关系统的研究,设计了网络热点话题自动发现系统的总体功能架构;(2)通过研究信息采集技术、信息处理技术的现状,进而设计了信息采集和...  (本文共69页) 本文目录 | 阅读全文>>