分享到:

从“找信息的门”到“信息找上门”

十年前,人们上网阅读浏览,门户网站就像是窗户;五年前,大多数人已经习惯通过各类搜索寻找信息……归根结底,它们都是网民基于单一途径在“找信息的门”;试想如果一个人每天要寻找10条相关信息,十年前必须记住至少数个门户;五年前,至少要往返于搜索框10次,即便如此,作为终端用户的网民还是很难获知这些网站何时更新信息。$$从“找信息的门”到“信息找上门” $$如今,互联网从Web1.0时代来到了2.0时代,信息的指数级增长使网民的信息获取和阅读方式发生了很大的变化。除了门户网站和搜索引擎,从互联网上获得信息还可以有第三种方式,那就是通过RSS阅读器订阅信息。RSS阅读器如同一份自己订制的报纸,每个人都可以把感兴趣的网站或栏目地址集中在一个页面,这个页面就是RSS阅读器的界面。 $$只要网页上有“XML”字样,就可以成为种子地址被加入到RSS阅读器中。每天要固定浏览10个网站的人,可以通过这一个页面了解到这些网站的更新信息,...  (本文共2页) 阅读全文>>

权威出处: 科技日报2008-01-02
《图书馆学研究》2009年06期
图书馆学研究

专业搜索引擎之博客搜索

1博客搜索引擎简介1.1博客及博客搜索引擎博客,译自于英语单词blog(weblog的缩写),是一种在线网络出版形式,版面通常由单栏文本贴子按倒时间顺序不断更新排列构成,并能提供一些个人化的链接。Blog这个术语在1997年被首次应用,随后,博客作为一种网上活动得到了快速发展,与其他网络应用(比如电子邮件、万维网等)相比,博客更具有社会沟通和民主化的潜质,能为主流媒体提供新闻和公众观点来源,为教育业和商业创造知识共享的环境,同时能为个人提供一个自我表达和自我价值实现的平台。由于博客的文章系统化较好、内容具有较高的知识水平和创造能力,涵盖了各类有价值的网络资源,目前已成为人们日常生活中一个重要的信息交流平台。随着博客用户和博客数量的迅猛增长,必然要求有一种专门的检索工具帮助我们快速获取来自于博客中的信息。另一方面,搜索引擎作为人们日常使用的一种工具,能够方便获取网络上的信息。但搜索引擎的结果各式各样,数量巨大,不利于获取某些方面的...  (本文共4页) 阅读全文>>

江南大学
江南大学

博客搜索引擎与排名技术研究

目前,博客作为Web 2.0中的代表,引起了大众传播方式的一种变革。自其出现以后,持续影响和改变着互联网的交流模式。互联网中博客的数量成指数级的增加,从九十年代的数千个增长到2005年的过亿,这样庞大的信息量,就需要一个有效的搜索方法对博客进行搜索。现在已经有很多博客的搜索工具了:Blogdigger,Blogpulse,还有Technorati,而像Google,Yahoo!和AskJeeves这样的搜索引擎也已经提供了专门的博客搜索。博客搜索正处于一个发展的初级阶段,其蕴含着极大的研究潜力。论文的主要工作包括以下方面。基础理论研究:首先介绍了Web挖掘基础理论(包括Web挖掘的定义和Web挖掘的分类)、网络爬虫的系统结构和相关爬虫算法、中文分词的几种方法。博客搜索引擎技术:首先介绍了传统搜索引擎的定义及基本构成、搜索引擎的分类,然后介绍了几种特色的搜索引擎,接着针对博客的特点,分析了几种博客搜索技术。然后给出了博客搜索与排名...  (本文共54页) 本文目录 | 阅读全文>>

《广告大观(综合版)》2007年10期
广告大观(综合版)

网易有道博客搜索踏上征途

Web2.0时代,新型个人传播平台——博客的兴起使传统意义上的上千个媒体变成了上亿个,由此带来的海量信息也必然给用户的查看和筛选带来难题,其潜藏的商机也不容低估。目前,由内容创作、博客发布、博客搜索、RSS阅读构成的博客产业链已经初步形成。而随着博客信息的增多,博客搜索不可避免地成为博客价值链中关键环节。2.0的创业者们从去年开始就探索性的相继推出了博客搜索服务。之后,几大互联网门户以及通用搜索厂商不约而同发力博客搜索,使得市场格局彻底改写;中国博客搜索市场山雨欲来,充满无限变数和可能。博客搜索“仗势”搅局搜索市场从群雄割据到三分天下用了五年左右的时间,当技术和资本不再成为壁垒时,目前的市场格局就随时可能被改变。而博客搜索的出现让搜索行业的竞争再次激起了火花。它的机遇在于博客本身的高速发展,这种高速发展带来的最直接反映就是越来越多的用户通过博客获取信息,博客订阅也成为流行。无论是草根还是明星,无论是个人天地还是信息平台,博客信息...  (本文共2页) 阅读全文>>

西安电子科技大学
西安电子科技大学

基于语义网的博客搜索引擎的研究

2005、2006年博客在中国迅猛发展,博客已经成为继电子邮件、BBS和ICQ之后的第四种互联网沟通工具。随着博客页面的数量呈指数级的上升,国外已经出现了如Technorati等顶级的博客搜索引擎。而国内的博客搜索引擎只是将传统的搜索引擎技术应用于博客页面之上,查询效率低下。如何设计一个合理的博客搜索引擎系统,使其能在语义层次上收集、组织和检索博客资源,提高信息的利用率,成为了一个很有挑战性的研究内容。本文首先对传统搜索引擎技术和语义网技术分别做了深入的研究。通过比较传统搜索引擎和博客搜索引擎的区别,融合传统搜索引擎的体系结构和语义网中的本体知识,提出了一种基于语义网的博客搜索引擎模型,并对其体系结构和功能模块做了详尽的阐述。该模型根据博客网页的特点规范了博客信息资源的抓取,并将语义网研究中的本体知识应用到博客搜索引擎中,利用本体对概念间的各种语义关系指导博客搜索引擎的检索过程,使用户能够快速、准确的找到所需的博客资源,提升博客...  (本文共59页) 本文目录 | 阅读全文>>

《计算机工程与设计》2010年08期
计算机工程与设计

中文博客搜索引擎研究

0引言人们利用博客交流思想、共享资源和相互学习已经变得越来越流行。由于博客日志的有用性和共享性,以专门搜索博客日志的博客搜索引擎应运而生[1]。目前,国内外已经涌现出了大量的博客搜索引擎[1-2],在中文博客搜索引擎方面起步比较早的是Google博客搜索,它能搜索的博客信息覆盖面比较广,且具有较强的实效性。近年来,许多博客服务商提供的博客搜索引擎服务也渐渐地完善起来[3]。由于博客采用JavaScript脚本以及AJAX(asynchronousJava-Script and XML)技术,使得传统的网络爬虫搜集博客信息变得比较困难,有些博客搜索引擎通过提供RSS(really simple syn-dication,真正简易聚合,也称为内容聚合)地址以及对博客网站进行实时跟踪[1],这在一定程度上提高了博客信息的实时更新性,但博客信息难以被搜集的问题仍然是博客搜索引擎需要解决的主要问题。本文对博客搜索引擎原理和特点进行分析,提...  (本文共4页) 阅读全文>>