分享到:

智能搜索引擎系统的研究

搜索引擎作为互联网上最主要的信息搜索工具,在各个领域都已得到广泛应用。然而。由于网络信息量迅猛增加和网络信息组织的无序性,传统搜索引擎已经无法满足人们对信息服务个性化、智能化的需求。本文提出了智能搜索引擎的解决方案——通过机器学习获得用户的兴趣爱好,根据用户个性对信息进行过滤。并就方案中涉及到的一系列理论和技术问题进行了研究,主要包括:提出了智能搜索引擎框架,在主动搜索和元搜索的基础上增加了中文信息处理模块,实现了搜索引擎的智能化和个性化服务;对汉语分词技术进行了研究,综合各种分词方法实现了一套适合于智能搜索引擎系统的分词系统。针对歧义字段的划分问题,提出了歧义字段划分的三个原则,在三原则的基础上给出了“二字续分法”分词的方案,该方案能够快速有效的分解大部分的歧义字段,具有很高的实用价值。神经网络分词是今后分词技术发展的一个趋势,本文对分词神经网络进行了研究,建立了分词神经网络的实验系统,利用分词神经网络进行了歧义字段划分的实验  (本文共73页) 本文目录 | 阅读全文>>

武汉理工大学
武汉理工大学

基于多Agent协作的智能搜索引擎的研究

在互联网获得巨大发展的今天,搜索引擎提供的互联网信息导航服务已经成为非常重要的网络服务,搜索引擎也已成为互联网用户在较短的时间内从在信息量浩如烟海的互联网上搜索、获取信息资源必不可少的网络工具,有许多商业搜索引擎已成为“网络门户”。但随着用户对信息检索的要求不断提高和网络信息资源的不断丰富,当前广泛使用的按照传统的设计模式设计的搜索引擎虽然在一定程度上解决了对互联网中的信息资源的定位问题,但也表现出不能照顾用户的兴趣、资源迷向、信息丢失等缺陷,已不能完全满足用户日益增长的对信息检索服务智能化、个性化的使用需求。对传统搜索引擎的缺陷进行分析后认为:传统搜索引擎缺乏智能化,缺少知识处理和理解知识的能力,对要检索的信息只是采用某类检索模型到预先建好的索引文件中去检索,而不能学习用户的兴趣需求、区分不同领域的词义差别、对同一概念的词语进行关联扩展,将已在许多领域得到广泛应用的人工智能技术与搜索引擎技术结合起来使搜索引擎具有智能化将是解决...  (本文共67页) 本文目录 | 阅读全文>>

大连理工大学
大连理工大学

智能搜索引擎系统的分析设计与开发

搜索引擎是指在万维网中主动搜索信息并能自动索引且提供查询服务的一类软件系统。随着IT的迅速发展,各种各样的网站也层出不穷。各大网站都面临着网站内部信息检索的问题,如何设计一个通用的、有效的检索模式是一个重要的问题。目前搜索引擎的研究和应用已经取得了巨大的进步和发展,但是从当前搜索引擎实际的现状来看,仍然存在下述几个问题有待去进一步研究:搜索引擎对自然语言的理解处理程度不够高;搜索引擎在通用模式的设计上需要规范;搜索引擎的搜索结果评价方法需要改进。针对以上存在的问题本论文的主要工作如下:1本文设计了智能搜索引擎的框架并且实现了大部分功能,给出了适合中小型网站站内检索的通用的搜索引擎模式。2在检索接口处采用了自然语言理解处理的方法,提高了搜索引擎的智能性。3针对不同用户的不同要求提出针对个性化的用户服务,给出新的排序算法,并对用户信息进行挖掘处理。4在文章摘要中提出了快速提取文章摘要算法,并且取得良好的结果。本智能搜索引擎具有广泛的...  (本文共74页) 本文目录 | 阅读全文>>

吉林大学
吉林大学

面向中文自然语言Web文档的自动知识抽取和知识融合

从Web文档中自动抽取出与领域本体匹配的事实知识不仅可以构建基于知识的服务,而且可以为语义Web的实现提供必要的语义数据。中文语言的特点使得从中文自然语言Web文档中自动抽取知识非常困难。本文研究了面向中文自然语言Web文档的自动知识抽取和知识融合方法。主要研究内容包括:(1)分析和总结了自动知识抽取和知识融合的研究现状及存在的问题;(2)提出了系统化的领域本体定义方法,用聚集体知识概念刻画N元关系并且强调了要为本体概念指定必要的属性约束;(3)研究了面向中文自然语言Web文档的自动知识抽取方法。针对自动知识抽取的三个步骤:知识三元组元素的识别、知识三元组的构造和知识三元组的清洗,分别提出了基于本体主题的属性识别方法、基于本体属性约束的三元组元素识别方法、基于启发式规则的三元组构造方法、基于句法分析的三元组构造方法和基于本体属性约束的知识清洗方法。与已有方法相比,该知识抽取方法能够在不借助大规模的语言知识库或同义词表的情况下对中...  (本文共137页) 本文目录 | 阅读全文>>

浙江理工大学
浙江理工大学

智能搜索引擎关键技术研究及应用

人类社会的信息化建设已经深入到各个领域,包括建设带宽和速率更高的网络基础设施、研发基于内存数据库群集的新型数据仓库、大规模分布式云计算的逐步应用、设计和开发更注重用户体验的各类应用界面等,以上都在不同层面分别革新了信息的传输、存储、计算、VIEW等领域,以应对大数据时代的来临。但针对互联网应用产生的异构并呈爆炸式增长的海量数据,人们面临着如何更准确高效地获取更有价值信息的问题,而这也逐渐成为了信息高速公路最后一公里的瓶颈。因此,越来越多的互联网公司和科研机构开始以新高度采用新技术来研发或优化其所在领域的搜索引擎,学术界也从更核心的理论及算法角度投入更多精力进行研究,以期望能在搜索引擎革新领域有更大的突破。因此,本文针对智能搜索引擎,在分析核心原理和经典算法的基础上,主要有以下几个方面的成果:(1)分析了搜索引擎国内外的研究现状及发展趋势、搜索引擎的相关理论、系统结构和性能评价标准。(2)针对中文搜索引擎,本文重点分析了中文分词算...  (本文共60页) 本文目录 | 阅读全文>>

浙江理工大学
浙江理工大学

智能搜索引擎在集团企业的研究与应用

利用传统互联网搜索引擎,用户可以检索到许多有用信息。然而,互联网搜索引擎面向一般用户,对企业用户来说,常规的互联网搜索引擎无法满足他们的检索需求。传统搜索引擎对企业用户的局限性体现在两个方面:对网页查全率与查准率过低;无法实现对企业内部关系数据库的检索。伴随着企业信息化快速发展,为企业量身定制企业级搜索引擎成为一种需求,企业搜索引擎也将成为信息化时代的一大研究热点。因此本文选择课题“智能搜索引擎在集团企业的研究与应用”,提出了面向企业的搜索引擎体系架构,并将其应用到浙江中烟工业企业搜索引擎系统中,提出了浙江中烟工业企业搜索引擎系统框架。文章主要研究内容如下:1)总结企业用户对搜索引擎系统的需求,确定企业搜索引擎应实现的功能:一是实现对行业内网页的高效主题搜索;二是实现对企业内部关系数据库的关键词搜索,由报表形式转化为关键词检索形式。为此,本文深入研究了互联网搜索引擎原理以及关系数据库关键词检索技术。针对目前关键词检索方式存在的弊...  (本文共73页) 本文目录 | 阅读全文>>