分享到:

地理空间实体类型语义相似度计算模型的研究

地理空间实体类型语义相似性是类型数据库综合领域的重要理论问题,目前国内外对它研究得比较少,主要原因是语义相似性的可量度性差,其次,研究语义相似关系需要揭示地理空间实体类型深层次的语义信息,难度比较大。鉴于地理空间实体类型语义相似性对类型数据库综合的重要意义,本文就语义相似性理论和模型进行研究,引入本体的思想,提出了符合认知特性的地理空间实体类型语义相似度计算模型,并通过实践对模型进行了验证。本文的具体研究工作和主要创新点包括以下几个部分:1.分析了地理空间实体类型之间的语义关系和语义相似度的特点;2.分析了现有的语义相似度计算模型并进行了评价;3.提出了本体表达地理空间实体类型语义的方法;4.建立了基于本体的地理空间实体类型语义相似度计算模型;5.表达了土地利用类型的语义,计算出了土地利用类型语义相似度;6.进行了把土地利用类型语义相似度应用于数据库综合的实验。  (本文共56页) 本文目录 | 阅读全文>>

《测绘科学》2009年02期
测绘科学

基于本体的地理空间实体类型语义相似度计算模型的研究

地理空间实体类型语义相似度对于类型数据库综合具有重要理论意义。本文以本体作为揭示实体...  (本文共4页) 阅读全文>>

东南大学
东南大学

链接数据实体类型预测模型的构建

许多链接数据在实体的类型信息上并不完整,类型缺失问题为许多语义挖掘任务带来了挑战。传统的类型推断方法可以通过逻辑公理来推理未知类型实体的类型,但是这种方法对于存在噪声的数据可能会失效。而近些年来基于数据驱动型的类型预测方法所取得的预测结果表明,此类方法在一定程度上屏蔽了不同领域的链接数据可能包含的数据质量问题,并且实现了实体类型的自动化补全工作。然而,现有的基于数据驱动型的实体类型预测方法的预测效果仍有待进一步提高。因此有效的基于数据驱动型的实体类型预测问题依然有待研究。本文基于广泛使用的协同分类算法ICA(Iterative Classification Algorithmn),利用通过抽取多类对实体类型预测具有不同指示性的链接信息构建的实体类型向量进行实体类型预测。在这个过程中,针对原ICA应用于大型链接数据集时存在的时间效率问题以及进行实体类型预测时存在的实体类型预测结果正确率方面的问题,本文分别提出了通过设置实体类型向量...  (本文共55页) 本文目录 | 阅读全文>>

华中科技大学
华中科技大学

基于实体类型嵌入与循环分段残差网络的关系抽取研究

作为信息抽取的核心任务,有效的关系抽取是信息爆炸时代的一大挑战。本文在进行关系抽取这一基础性研究时发现,现有的模型在应对长而复杂或无直接实体关系触发词的句子时,往往很难有效地抽取其中蕴含的实体对关系。而这种句子在自然语言文本中是普遍存在的,这使得关系抽取的效果遇到了瓶颈。本文深入调研并分析了国内外在关系抽取方面的研究。在融合更多更深层次信息的思路启发下,本文提出实体类型嵌入(Entity Type Embedding,ETE),并将ETE和词嵌入、位置嵌入一起作为模型的联合嵌入层,从而丰富了关系抽取模型的嵌入层表示。此外,还设计了循环分段残差网络(Recurrent Piecewise Residual Networks,RPRN)结构,该结构对深层语境下句子的潜在表示进行了不同级别的抽象,因而在面临各种复杂的大规模语料时,能够更好地学出句子的结构化表示。本文提出的基于ETE与RPRN的关系抽取模型(ETE-RPRN),能有效地...  (本文共57页) 本文目录 | 阅读全文>>

《中文信息学报》2018年01期
中文信息学报

面向专业文献知识实体类型的抽取和标注

知识实体的类型标注是专业文献的结构化管理和知识脉络挖掘中的一个重要问题。然而,由于知识实体具有专业性强、类型多样等特点,传统的实体抽取方法并不能很好地实现知识实体的类型标注。为了解决这一问题,该文从数据中发现并总结出知识实体类型...  (本文共14页) 阅读全文>>

《计算机学报》2017年10期
计算机学报

基于随机游走的实体类型补全方法

伴随着大数据的大量涌现以及开放链接数据(LOD)等项目的开展,语义网知识库的数量激增,语义网知识库正在引起学术界和工业界越来越多的关注,在信息检索系统中起着重要的作用,如实体搜索和问答系统等.实体类型信息在信息检索中扮演着重要的角色,例如,查询"汤姆·汉克斯所出演的电影",该查询限定了返回的实体类型是"电影",这对提高查询结果的精度具有重要作用.然而,知识库中实体类型信息的缺失是十分严重的,影响了知识库在信息检索等领域中使用的正确性和广泛性.据统计,在DBpedia2014中,8%的实体没有任何类型信息,28%的实体只有高度抽象的类型信息(比如类型为"Thing"),因此对于实体类型补全的研究尤其是实体细粒度类型的补全是十分重要的.目前已有的方法包括基于概率模型和表示学习两类.以基于概率模型的SDType算法为例.首先,SDType为每个谓词计...  (本文共15页) 阅读全文>>