分享到:

用MSSQL Serve 建立Internet上的全文检索系统

本文提供了一种在MSSQL Server7上实现的基于模式匹配的全文检索算法,并使用此算法,通过ASP建立了一个完整、实用的Internet上的全文检索系统。$$利用MSSQL Server7开发Internet上的全文检索系统,有两种方法:$$1.利用数据库本身提供的专门全文检索机制;$$2.以模式匹配为基础,自行开发相应检索算法。$$比较而言, MSSQL Server7中的专门全文检索功能管理复杂,限制较多,如使用前必须预先建立全文索引,而且仅限于VARCHAR和TEXT类型的字段,而基于模式匹配的全文检索功能使用简单,适用数据类型广,在数据记录不是很大的情况下,查询效率也较快,非常适合中小规模的数据库。$$下面的Internet检索系统由使用ASP构造的基于模式匹配的全文检索算法实现。该检索系统使用Windows NT下的IIS3. 0为Web服务器,以MSSQLServer为后台数据库。在几十万条记录的数据库中,通过...  (本文共5页) 阅读全文>>

《标准科学》2017年01期
标准科学

标准全文检索系统及关键技术研究

随着我国经济社会的进一步发展,标准的重要性越来越深入人心,人们对标准信息检索的要求也更加高,然而当前标准信息的检索技术却仍然比较落后,绝大多数仍然需要依赖题名关键字进行检索。2标准与标准检索2.1标准及标准要素标准是指通过标准化活动,按照规定的程序经协商一致制定,为各种活动或其结果提供规则、指南或特性,供共同使用和重复使用的文件[1]。标准文献是指由技术标准、管理标准、工作标准及其他具有标准性质的类似文件所组成的一种特种文献。它既具有一般科技文献的作用,又具有法律效力,是人们从事科研、生产、设计和检验所使用的技术依据,也可以直接应用于生产、管理、贸易,是科技信息检索中不可缺少的内容[2]。标准的内容按照要素的性质以及它们在标准中的具体位置可以分为:资料性概述要素、规范性一般要素、规范性技术要素、资料性补充要素,它们对应的典型编排和表述形式见表1[3]。表1标准的要素类型及编排要素类型要素的典型编排要素所允许的表述形式资料性概述要...  (本文共5页) 阅读全文>>

《无线互联科技》2015年20期
无线互联科技

基于公安业务的全文检索系统的设计与实现

全文检索是现代信息检索技术的一个非常重要的分支,它是处理非结构化数据的强大工具,也是搜索引擎的核心技术之一[1]。全文检索是以文本数据为主要处理对象,根据数据资料的内容而不是外在特征实现的信息检索手段。全文检索就是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立索引,当用户查询时,检索程序就根据事先建立好的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程[2]。1关键技术建立一个全文检索系统,首先要将源文档转化为能够进行文本查找的全文数据库,包括全文的分割处理以及检索标识的提取,这称为全文本的前处理工作[3]。众所周知,英文是以词为单位的,单词之间以空格作为自然分界符,而中文是字的序列,词之间没有间隔标记,使得词的界定缺乏自然标准。而“词”又是自然语言处理的一个基本单位,是最小的能够独立活动的有意义的语言成分。显而易见,自动识别词的边界,将书面汉字序列切分成正确的词串的中文分...  (本文共2页) 阅读全文>>

《阜阳职业技术学院学报》2013年03期
阜阳职业技术学院学报

特色数据库全文检索系统的设计

1引言 生活中的数据总体分为三种:结构化数据、非结构化数据和半结构化数据,结构化数据指具有固近年来,随着各高校图书馆特色数据库系统的 定格式或者有限长度的数据,如数据库,元数据等;建设,特色资源馆藏数量也在逐年增加,面对海量 非结构化数据指不定长或无固定格式的数据,如邮的信息,如何快速地在大篇幅的资料中找到读者最 件,word文档等;半结构化数据也叫全文数据。需要的信息,是计算机信息工作者所要面临的一个 对非结构化数据顺序扫描很慢,对结构化数据最主要的问题,基于这种需求,就需要一种可以支 的搜索相对较快,如果把非结构化数据组织成一定持快速检索的软件,专门用于存储和査询这些电子 结构就可以提高搜索速度,这构成了全文检索的基信息,并能快速定位到读者所需要的特色数据库信 本思路,也即将非结构数据中的一部分信息提取出息的章节,指引读者有选择性地阅读自己最喜欢的 来,重新组织,使其变得有一定结构,然后对此有一部分内容。这些功能加快了人们检...  (本文共2页) 阅读全文>>

《科技传播》2011年21期
科技传播

Sphinx+Python+Oracle构建全文检索系统

1Sphinx简介Sphinx是一个在GPLv2下分发的全文检索软件包,是SQL Phrase Index的缩写。它最初开发的目的是为了在数据库驱动的网站中寻找解决索引质量、搜索性能等各方面的问题而开发的一个高性能独立的全文搜索软件包,所以它可以非常容易的与SQL数据库集成,为数据库驱动的网站提供高质量、高性能的站内搜索。当前,Sphinx系统内置了MySQL和PostgreSQL数据库数据源的支持,也支持从管道标准输入读取特定格式的XML数据。但是,目前Sphinx还不支持直接将Oeacle数据库作为数据源,但在最新的版本中,添加了Python数据源支持,这极大的扩展了数据源的来源,我们可以操作Python脚本作为数据源来获取Oracle中的数据。2Python数据源操作Oracle数据库的设计与实现考虑到安全、性能等因素,目前,很多大型的网站,尤其是大型企业的CRM系统,在数据库构建方面都采用了Oracle数据库。基于此,我...  (本文共2页) 阅读全文>>

《济南职业学院学报》2009年01期
济南职业学院学报

学生优秀论文全文检索系统的开发与利用

一、高校图书馆应加强对学生优秀论文的收集整理并建立完善的数据库(一)优秀毕业论文的性质高等院校学生优秀毕业论文具有较高的学术性和使用性,是不可忽视的情报资源,它也是教书计划中一个极为重要的教学环节,这个教学环节体现了专业培养目标和要求,着重培养学生综合运用所学知识与解决问题的能力,撰写毕业论文是对高等学校学生最后一次知识的综合性考核,是大学生科学研究能力的基本训练,是发现人才和推荐人才的重要途径。学生优秀论文的论题具有一定的现实意义及学术价值,并且论文中对所分析的问题占有丰富的材料,论点鲜明,论证充分,它能综合运用所学到的知识和技能,比较全面、深入地进行分析,有一定的独到见解,观点正确,中心突出,层次明晰,结构严谨,文字流畅,答辩中能准确的回答问题且思路清晰。这样的论文可评选为“优秀论文”。(二)建立学生优秀论文全文检索系统的必要性优秀论文的作者在经过大学几年学习深造后,对自己所学专业有独特的见解,通过论文的形式反映出来,这些论...  (本文共3页) 阅读全文>>