分享到:

基于数据流挖掘的网页热门主题获取技术研究

随着网络的迅速发展,舆情研究面临着新的问题和挑战。网络舆论提供了一个更为全面更为集中的民意反映,且由于其匿名性等特点,能更真实地反映大多数民众对事件的看法。对网络舆论进行研究,需要收集网络上发布的信息并对其进行挖掘,属于Web挖掘的研究范围。Web挖掘是以从Web上挖掘有用知识为目标,以数据挖掘、文本挖掘、多媒体挖掘为基础,综合运用计算机网络、数据库与数据仓库、人工智能、信息检索、可视化、自然语言处理等技术,将传统的数据挖掘技术与Web结合起来的一门新兴学科。传统的分类方法根据挖掘对象的不同将Web挖掘分为三类:Web内容挖掘、Web结构挖掘和Web使用记录挖掘。为了能够更容易地对应用进行分类,本文介绍并完善了一种从应用的角度出发的分类方法。该方法将Web挖掘分为基于生产者的挖掘,基于消费者的挖掘和基于增值服务提供者的挖掘,文中进行了详细的介绍。通过对用户所频繁访问的网页主题进行研究,可以了解一段时间内用户关心的事件,掌握舆情的  (本文共76页) 本文目录 | 阅读全文>>

吉林大学
吉林大学

网页设计中的认知心理学与艺术设计理念

现今社会,Internet 网已将全球联通,信息的共享和交流已经成为人类的共同需求,网络作为高科技与信息交互式媒介的产物,成为人类生活中不可或缺的重要连接纽带。信息的传播和获取已是国家、企业甚至个人发展充实的必要手段。统计显示,人们通过Internet 获取信息,超过95%的比例是通过浏览各种类型的网页来实现的。如何有效提高网页设计的艺术性和美学内涵是当前网页设计中的热点研究问题。本文从认知心理学入手,结合一些色彩、构图等艺术设计理论知识,详细分析了人们在浏览网页时的心理行为。针对构成网页的基本技术和艺术要素,详细讨论了网页的版面布局,简短标题和宣传标语的设计,文字的编排,网页中图形图像的使用,网页菜单的设计以及色彩的选择和文字的编排等诸多内容。结合具体的实例,阐述了运用认知心理学和色彩等艺术设计理念的具体方法和在网页设计中的注意事项。综合表明,运用认知心理学和色彩等艺术设计理念是有效提高网页设计水平和网站知名度的新方法。它是在...  (本文共65页) 本文目录 | 阅读全文>>

浙江大学
浙江大学

基于网页设计的视觉信息传达有效性的研究

网页作为一种信息载体,为设计者提供了新的设计领域和设计课题。随着越来越多的网民的出现,人们使用网络的目的也越来越多元化,而网页设计在这种环境下也向着更成熟的方向发展。尤其是在设计理念上,网页设计已经由最初的“叫卖式”的商业简介,逐渐发展为更注重个性化的表现形式,在体现商业的文化内涵方面也有了更进一步的提高。在技术方面,也更注重人性化的操作方式。越来越多的网页设计作品出现在人们的视野。但是我们生活在一个信息社会,如何使信息更加快速有效的传递出去,并被正确的理解和接受,是人们关心的重要问题。而网页作为新的信息载体,更承载着这样的任务,这也是本文重点讨论的主要内容。本文首先介绍了网页设计中涉及到的基本概念和相关技术。然后阐述了视觉信息传达的相关理论,及其在网页设计中的特点和重要作用。并分析了视觉信息传达过程中人的生理机制和心理反应。接下来通过分析现有网页设计作品,运用相关原理重点分析了网页中影响视觉信息传达的问题所在,并给出了相应的解...  (本文共65页) 本文目录 | 阅读全文>>

哈尔滨工业大学
哈尔滨工业大学

基于网页挖掘的搜索引擎若干技术的研究

随着互联网的快速发展,搜索引擎越来越受人青睐。它能够将杂乱无章的信息整合起来,方便快捷地为用户提供信息。而搜索引擎搜索的最基本元素就是网页,所以本文从网页入手,对网页进行了时间信息挖掘,结构信息挖掘和指纹信息挖掘。与之对应的从增量采集、网页净化、网页分析三个方面阐述了提高搜索引擎返回结果质量的方法。本文在对增量采集技术说明中,针对诸如大型新闻门户网站更新频率快的特点,采用了网页的时间挖掘方法,通过对更新时间的考察,减少了下载网页的次数以及在数据库中查找的次数,比较有效的解决了对更新频率快的网站增量下载的问题,并使新出现的网页能够及时的被用户查找到。在网页净化技术说明中,我们将网页表示成一颗DOM树,并首次将中文标点符号数引入到衡量网页正文的权重中,通过对DOM树不断的剪枝,极大的减少了网页的噪音。在网页去重技术说明中,我们提出了一种基于网页净化的网页去重的方法,将网页净化方法与指纹特征提取方法相结合,有效的提高网页去重的准确率。...  (本文共61页) 本文目录 | 阅读全文>>

江西师范大学
江西师范大学

专题型网页搜集器关键算法的研究及实现

随着互联网技术的迅速发展,万维网上的可用信息越来越多。但是互联网也为有效进行其中的相关信息发现提出了以下的问题:1.网页的复杂性要远远大于任何传统的文本文档。2.互联网是一个高度动态的信息源。3.互联网所服务用户群体的多样性。4.对于不同的用户互联网上的信息只有一小部分是真正有用的或相关的。这些问题促使了有效发现和利用互联网信息资源的相关研究工作开展。面向主题搜集技术就是针对这些问题而提出的,它为不同的用户提供不同的服务,以满足他们不同的需求。这篇论文主要研究了面向主题的搜索中的两个关键算法——网页过滤和链接排序,同时研究了搜索器的实现技术。在网页过滤方面:针对“互联网上的信息只有一小部分是真正有用的或相关”的这一特点提出一种快速过滤网页的系统过滤算法。这种算法将分类体系组织成一个多层的树状结构,对网页逐层过滤,可以将大量不相关的网页快速的过滤。在链接排序方面:已有的研究表明网页的分布满足两种局部性,即链接分布的局部性和兄弟分布...  (本文共62页) 本文目录 | 阅读全文>>

东北师范大学
东北师范大学

基于聚类的网页相关性挖掘技术研究

随着互联网的普及和计算机技术的发展,从互联网上获取满足用户需求的信息越来越困难。为了帮助用户有效地发现、选择、搜寻感兴趣的信息,提高用户检索信息的响应速度,从海量的网页信息中发现它们之间的关联,从而得到有用的知识,人们将传统的数据挖掘技术和网页结合起来,提出了网页挖掘技术。网页挖掘中的一个主要问题是对网页进行相关性挖掘。网页的相关性挖掘首先从各种网页文本对象中抽取出能反映其本质的重要特征,将这些网页文本对象映射成高维特征空间中的点,然后通过高维空间中的距离计算来完成。通过网页文本的相关性挖掘,可以将网页文本集合中相似的文本联系起来,便于从中发现有用的知识。本文首先从基本概念入手,阐明了数据挖掘和网页挖掘的主要内容。然后,对数据挖掘的重要工具聚类分析算法的相关部分(如聚类分析中的数据表示、距离度量和常用算法)进行了深入的分析和讨论。接下来逐一解决了网页文本内容特征抽取过程中的三个关键性问题:如何为网页文本内容的特征选择合适的模型、...  (本文共46页) 本文目录 | 阅读全文>>