分享到:

Web信息服务中受控语言研究

Web信息服务采用知识组织体系和规范操作流程构建基于主题的有序信息空间。受控语言是链接因特网信息空间、人类精神世界和现实物质世界的符号化概念标识系统。受控语言针对Web信息内容的主题特征来建立信息链接,通过“用、代、属、分、参”等规范形式标识信息实体间关系特征,成为用户使用因特网信息的浏览工具和检索净化装置。用户在发现、定位、检索、获取信息的各个环节中使用分类法和主题词表改变知识视野。检索语言的选择和概念关系的导引使用户知识视野依次深入。Web信息服务中受控语言的应用可以分为功能层和技术层,每个层次的应用需要遵循各自的标准。受控语言的功能是浏览和检索。其中分类法用于构建浏览结构,根据信息服务范围和类型使用通用分类法和专题分类法。分类法的层次和类目需简化。主题词表可改善检索的效率,在信息发现中过滤信息。在集成多个Web信息服务系统过程中,受控语言扩展数据结构和通信协议以实现交叉浏览和交叉检索。后控词表可改善用户检索的查全率。在合理  (本文共172页) 本文目录 | 阅读全文>>

中国科学院研究生院(计算技术研究所)
中国科学院研究生院(计算技术研究所)

基于服务质量的Web服务模型及应用研究

随着电子商务的兴起,使得Internet的服务模式从传统的数据通讯和信息浏览模式向电子交易与服务转换,这种转换使得Web服务的应用范围越来越广泛。电子商务应用要求对其用户或者服务进行区分优先级别的处理,提供基于收益的区分服务。而Web服务是根据Internet中尽力而为(Best-Effort)服务模型平等地处理所有到来的请求,其采用的FIFO(First In First Out)调度策略,使得通过IntServ和DiffServ等网络QoS机制实现的性能改进受到严重影响,无法满足各种用户对服务质量的不同要求。同时由于Web服务基础设施的复杂性,影响Web服务QoS的因素很多。通信模式的变化、拒绝服务攻击、基础构造失效的影响、Web协议的低性能以及Web上的安全性问题等因素产生了对Web服务QoS的需求。这些未解决的问题会导致重要的应用程序遭受无法接受的性能下降,也使得Web服务在关键业务上的应用受到怀疑。因此Web服务上的Q...  (本文共140页) 本文目录 | 阅读全文>>

中国科学院研究生院(计算技术研究所)
中国科学院研究生院(计算技术研究所)

大规模信息过滤技术研究及其在Web问答系统中的应用

本文讨论了知识挖掘中的大规模信息过滤技术及其在Web问答系统中的应用,对信息过滤特别是自适应过滤的若干关键问题进行了深入细致的研究,提出了一体化的高性能信息过滤方法,取得了比目前的信息过滤系统更好的结果。用户需求和用户兴趣是信息过滤的依据和基础,本文介绍了传统的用户需求扩展和用户兴趣构造技术,提出了一种基于二重伪相关文档选择技术的初始用户兴趣构造方法。针对小样本主题(用户需求)难以过滤的问题,本文提出了小样本主题自动判定和优化加强的方法,有效改善了小样本主题的过滤性能。在总结分析了传统的特征选择方法的基础上,本文提出了用户需求粒度驱动的柔性化特征选择方法,将原始用户需求自动划分为粗粒度主题和细粒度主题,根据用户需求的不同粒度自主选择相应的最适合的特征选择方法。本文还对特征权重的平滑计算方法进行了研究。本文分析了自适应信息过滤中较为典型的不确定信息的学习问题,提出了不充分反馈条件下的自适应学习方法,深入分析和比较了用户兴趣更新中不...  (本文共144页) 本文目录 | 阅读全文>>

复旦大学
复旦大学

Web服务合成与可用性的若干关键技术研究

Web服务可用来实现应用程序在Internet上的互操作,它已成为一种极具发展潜力的分布式网络应用集成技术。Web服务的一个重要特点和基本需求是进行服务合成,即组合已有服务以实现新的功能。这引起了广泛的研究兴趣:一些合成规范如BPEL4WS、WSCI等已被提出。参与合成的Web服务的替换和恢复,是服务可用性需求中的两个重要问题。现有的替换方法和恢复机制较少考虑Web服务本身的自治、异构和松耦合特性,需要针对Web服务的特点进行改进。本文研究基于异步通信的Web服务可正确合成的条件,给出分析Web服务合成流程的相容性的验证算法。并在此基础之上,考虑Web服务的替换问题,提出服务可替换的相关约束。进而设计Web服务失败后的恢复机制。主要成果如下:1.一种Web服务合成的交互模型。形式化的描述Web服务的操作流程,并建立异步通信的Web服务合成的交互模型。在此基础之上,通过自底向上的合成分析,研究Web服务合成的相容性问题,提供相容性...  (本文共94页) 本文目录 | 阅读全文>>

《河南科技大学学报(自然科学版)》2009年04期
河南科技大学学报(自然科学版)

基于本体的Web智能信息检索系统

0前言信息检索主要是研究信息的表示、存储、组织和访问方法等问题[1]。国内对智能信息检索的研究相对来说比较分散,主要应用到文学、计算机、交通等领域[2]。传统的Web信息检索方法主要是基于关键词的全文检索[3],目的是根据用户的查询关键词从大量的文本中找到满足用户要求的相关文本,其中心问题是判别相关文本和无关文本。传统的信息检索模型已经得到了广泛地应用,但是这些模型还存在着很多缺点和不足[4-5]。这些传统的检索方法不能对本体中丰富的语义关系进行推理,无法有效地利用本体资源,如果仅基于表述逻辑对本体进行检索和推理,虽然能有效地显示并利用本体中的语义关系,但由于语义推理过程过于复杂,不适于对本体进行快速、有效地检索和排序[6]。本文吸收当前信息检索、人工智能技术等方面的最新思想和技术[7-8],应用本体论,提出了一个基于本体的Web智能检索原型系统,它包括描述信息收集、分析、过滤、选择和推荐等几个主要部分,并研究了该系统的体系结构...  (本文共5页) 阅读全文>>

《北京工业大学学报》2008年04期
北京工业大学学报

结构化向量空间模型及其在Web信息检索中的应用

在信息检索中,文档内容通常被表达为向量空间模型(vect。:space model,记为vsM).Salton等人提出将文档和查询表示为由一组特征项构成的向量,通过比较2个向量,计算它们之间的相似度,根据求得的相似度大小对文档检索结果进行排列[l一幻.该模型计算简单,处理速度快,传统的向量空间模型认为同一特征项所表达的文档能力完全相同,而不考虑该特征项出现在文档中的位置信息,从而忽略了文档的段落,句子和词语之间的关系.而对于Web信息检索,文档呈现半结构化特点,不同位置上的特征项对整个web文档内容的表达能力差异很大.本文在分析传统向量空间模型的基础上对其进行了改进,将Web文档按照一定的逻辑结构划分为若干独立的文本段,分别对应标题、子标题、正文和锚文本等内容.同时使用TF一IDF将各个文本段分别转化为向量形式,从而将整个Web文档表达为一个结构化向量组,并由此定义新的相似度计算公式用于检索结果排序. 1传统向t空间模型1.1传...  (本文共4页) 阅读全文>>