分享到:

中文智能搜索引擎

传统搜索引擎$$1.搜索引擎的分类$$互联网的迅速发展和广泛普及导致网上信息爆炸性增长。目前存在数量众多的搜索引擎,根据它们所基于的技术原理,可以把它们分成三大主要类型:基于机器人Robot的搜索引擎、目录式Directory(也叫做Catalog)搜索引擎和Meta元搜索引擎。$$基于机器人Robot的搜索引擎:这种搜索引擎的特点是利用一个称为Robot(也叫做Spider、 Web Crawler或Web Wanderer)的程序以某种策略自动地在互联网中收集和发现信息,由索引器为收集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。$$基于Robot的搜索引擎一般要定期访问大多数以前收集的网页,刷新索引,以反映出网页的更新情况,去除一些死链接,网页的部分内容和变化情况将会反映到用户查询的结果中,这是基于Robot的搜索引擎的一个重要特征。$$该类搜索引擎的优点...  (本文共4页) 阅读全文>>

广西师范大学
广西师范大学

Internet中文智能搜索引擎汉语自动分词系统设计

本文详细描述了中文智能搜索引擎中汉语自动分词模块的设计方案与实现方法。本文从目前发展迅速的搜索引擎技术的综述出发,结合中文智能搜索引擎技术的发展现状以及具体应用情况出发,根据项目要达到的目标逐步引出课题中心——汉语自动分词模块的设计与实现。然后从理论上分析和比较了目前的各种汉语自动分词方法,对各种分词方法的技术特点进行了阐述,对自动分词发展现状和趋势作了概括性的总结。根据课题应用具体现状,阐述了适合于本课题的分词方法和分词模块预期达到的性能指标。最后详细描述了汉语自动分词模块的具体设计,包括总体设计以及各模块设计等,同时给出了一些关键性的例程说明和程序设计的关键点总结。本文所包含的内容完全是面向应用的,具体的技术选择与整体的设计思想完全根据实际的应用需求而定,采用的都是比较成熟的技术,实现了理论联系实际。另外,本文所描述的汉语自动分词模块已可以在基于命令行的情况下,进行分词处理。  (本文共62页) 本文目录 | 阅读全文>>

《情报探索》2004年04期
情报探索

第三代中文智能搜索引擎浅析

随着 Internet的飞速发展 ,网上的信息资源浩如烟海 ,获取有用的信息难于大海捞针。如何在网上获取信息成为一个迫切需要解决的问题。 1990年 Montreal的 Mc Gill University 的学生 Alan Emtage、PeterDeutsch、Bill Wheelan开发了一个自动索引因特网上的匿名 FTP网站文件的程序 ,它就是 Archie(ArchieFAQ) ,搜索引擎的鼻祖。虽然它并不能算真正的搜索引擎 ,但是 ,它却使人们认识了搜索技术 ,认识到搜索工具的重要性和必要性 ,在因特网史上具有划时代的意义。从那以后 ,搜索引擎技术获得了飞速的发展。1 搜索引擎及其发展1.1 搜索引擎的构成及其工作原理搜索引擎 (Search Engine)是一种浏览和检索网络信息的工具。它以一定的策略在互联网中搜集、发现信息 ,对信息进行理解、提取、组织和处理 ,并为用户提供检索服务 ,从而起到信息导航的目的。搜索...  (本文共3页) 阅读全文>>

《情报科学》2002年12期
情报科学

中文智能搜索引擎现状探析

席卷而来的 Internet(因特网 )正将全世界的丰富信息资源带到每一个人的面前 ,从爆炸性增长的数字信息中迅速地获得用户需要的信息变得越来越困难 ,这给搜索技术提供了一个广阔的舞台。为了帮助用户顺利检索和查找所需的网络信息 ,一大批搜索引擎应运而生。网络搜索引擎的研究与开发已成为当今网络信息检索的热点 ,搜索引擎技术越来越引起人们的关注。搜索引擎已日益成为人们日常生活中必不可少的一部分 ,成为人们在信息海洋中进行“大海捞针”的工具。然而目前搜索引擎又面临一系列的挑战 ,如网络信息量迅猛增加 ,人工已经无法对它们进行有效的分类、索引和利用 ;简单的关键词搜索 ,返回的信息量过大 ,已经让用户无法承担 ;网络信息组织的无序性 ;信息有用性评价困难 ;网络信息日新月异的更变 ;信息媒体的多样化 ;带宽等其它因素的制约 ,这些都给因特网信息的获取造成了极大的阻碍。这就给了智能搜索引擎出现的机遇 ,也给了它发展的空间。现在已经出现了能...  (本文共3页) 阅读全文>>

《图书馆建设》2007年03期
图书馆建设

中文智能搜索引擎技术及其对数字图书馆的影响

随着因特网的飞速发展,网上信息正在成指数级增长。如何有效地获得人们需要的信息,成为一个很重要的问题。由于传统的引擎不能适应信息技术的高速发展,新一代自动搜索引擎的关键技术应运而生,人们提出了一种新的合作计算模型和人机交互方式,将计算机变成一个智能、主动和个性化的合作者——将人工智能技术引入信息检索中。它带有明显的智能特征,因此被称为智能搜索引擎。1智能搜索引擎简介智能搜索引擎是结合了人工智能技术的新一代搜索引擎。由于它将信息检索从目前基于关键词层面提高到基于知识(或概念)层面,对知识有一定的理解与处理能力,能够实现分词技术、同义词技术、概念搜索、短语识别以及机器翻译技术等。智能搜索引擎具有信息服务的智能化、人性化特征,允许用户用自然语言进行信息检索,为他们提供更方便、更确切的搜索服务。2中文智能搜索引擎的特性2.1人机接口的智能化智能搜索引擎属于第三代搜索引擎,它除了能提供传统的快速检索、相关度排序等功能外,还能提供用户角色登记...  (本文共3页) 阅读全文>>

《税务》2001年03期
税务

新型中文智能搜索引擎在大连问世

输入一句“今天北京冷不冷”或是“现在去黄山旅游怎么样”,会马上得到北京的天气情况或是关于黄山旅游的相关信息。在大连“尤里卡”网站(www.ulika.com),你能以最口语化的方式随便问你关心的问题,而不必担心“它”听不懂给你一些你不需要的答案。 “它”是大连尤利卡电子商务公司最近推出的中文智能搜索引擎。与以往的以关键字为基础的搜索方法相比,这一搜索引擎可以充分理解搜索者的意图,搜...  (本文共1页) 阅读全文>>

权威出处: 《税务》2001年03期