分享到:

利用模糊神经网络实现数值信息与语言信息的融合

1 引  言  近年来 ,神经网络与模糊逻辑的融合系统——模糊神经网络 ,在众多领域得到了广泛的应用。模糊神经网络能集成神经网络和模糊逻辑各自的优点 ,并克服各自的缺点。神经网络擅长处理数值信息 ,但不能处理语言信息 ;对于样本数据较少 ,或只提供了一些类似于专家经验的语言信息的系统 ,则不能得出较满意的结果。模糊逻辑能够处理如专家经验的语言信息 ,模糊推理通过模糊规则来实现。通常 ,模糊规则的获取主要依赖于专家的经验知识。专家的经验有时可获取 ,有时不可获取 ,这就需要从样本数据中获取模糊规则利用模糊神经网络可从样本数据中获取模糊规则 ,利用这些规则可以建立系统的模型。我们曾提出一种利用模糊神经网络直接从数字样本中获取模糊规则的算法 ,用以建立一个两输入单输出系统的函数关系模型 [1] ,以及多输入系统的函数关系模型 [2 ,3 ] 。这些系统中的变量均为数值型变量。本文在上述工作的基础上 ,研究将算法推广到既有数值型变量又有...  (本文共4页) 阅读全文>>

《情报科学》2019年02期
情报科学

数值信息抽取研究概述及应用分析

3.河北水利电力学院,河北沧州061001)随着大数据时代的来临,海量的信息、数据、知识隐藏于结构化、半结构化或无结构的文本集合中。对于信息用户而言,需要海量数据的发现、抽取、统计和分析以满足数据驱动的科学研究,而基于关键词检索的信息获取方式无法提供细粒度、深层次和有序化的数据信息,特别针对科技文献,关键词检索只能提供摘要、全文信息,无法获取文本内容层的重要概念、实体和数据;对于信息组织者而言,作为信息的加工者,面对海量的原始资料信息,获取、过滤、组织、建库是十分艰巨的任务,基于此,自动化处理海量信息的信息抽取技术得到越来越广泛的应用,对于信息抽取技术的研究也在不断发展。信息抽取常指抽取特定的事实信息,MUC测评会议将信息抽取定义为“从单个或多个文本中选择性地组织和结合所抽取隐式及显式数据的数据的技术【1】。”数值信息抽取是中文信息处理研究中的基础研究方向,是信息抽取、信息检索、机器翻译、自动问答系统、知识库或事实库等多种自然语...  (本文共7页) 阅读全文>>

《计算机应用与软件》2019年05期
计算机应用与软件

采用BI-LSTM-CRF模型的数值信息抽取

0 引 言数值信息是文本中的一种重要信息,也是数据中直观的表达方式之一。而且数值信息的抽取对信息检索、数值类问答,知识库或事实库构建、文本可视化分析等应用具有重要的现实意义。数值在非结构化文本中非常普遍,常见的数值包括时间、货币、数量词、电话号码等,但仅仅单纯对数值的抽取意义不大,因为数值只有存在于相应的语言环境中,和相关的主体,单位等元素一起存在,才能更全面地表达出其本身所携带的信息。一个数值信息应该包括主体、属性、属性值等基本元素,考虑到数值信息表述中的相对性特征,数值信息还应该包括比较词、趋势词、比较对象、时间、地点等元素。当前的数值信息的抽取以模板的方式为主,且抽取的格式无法完全表达数值信息的含义。为了更加全面地描述数值信息且克服模板抽取的局限性,本文提出了一种数值信息的存储格式和抽取方法。输入例子和输出结果分别如表1和表2所示,数值信息的抽取流程图如图1所示。1 相关研究关于信息抽取方面目前主要有4种方法:基于规则、基...  (本文共7页) 阅读全文>>

《郑州大学学报(理学版)》2018年04期
郑州大学学报(理学版)

面向问答的数值信息抽取

0 引言数值信息是数据中直观的表达方式之一.对于企业和其他组织来说,数值信息是生产、经营和战略等几乎所有活动所依赖的、不可或缺的信息.在这种背景下,从文本中准确地获取数值信息已变得越来越重要.问答系统允许用户以自然语言方式进行提问,系统返回准确、简洁的答案[1].我们把关于数值的问答分成两个步骤:第1步通过数值信息抽取来构建候选答案库;第2步针对具体数值问题从候选答案库中获取答案.本文所做的工作为第1步,为搭建问答系统做准备.本文的数值信息抽取结构如图1所示,将数值信息抽取分为4个模块:制定模板模块、模式匹配模块、条件随机场补全模块、时间地点抽取模块.(1) 制定模板模块.分析数值信息的表达模式并且获取数值相关的知识来制定抽取模式,最终形成模板库.(2) 模式匹配模块.利用模板库提供的模板来对文本进行模式匹配.(3) 条件随机场补全模块.在模式匹配模块中没有成功匹配的文本,条件随机场进行“主体”识别,识别之后再用模板进行匹配.(...  (本文共6页) 阅读全文>>

沈阳航空航天大学
沈阳航空航天大学

面向数值问题的答案抽取与生成

数值作为信息最直观的表达类型之一,能够有效地反映信息的含义。随着大数据和人工智能时代的到来,人们迫切希望用更加智能的方式从互联网中获取数值信息。问答系统能够为用户提供自然的交互体验和精准的信息内容,已受到学术界和产业界广泛关注。本文面向数值问答系统的构建,重点研究数值类问题的答案抽取和生成。可以把研究工作分成两大部分:1、通过数值信息抽取来构建候选答案库,2、根据具体的数值问题从答案中抽取或生成答案。通过数值信息抽取来构建候选答案库部分是指从web中抽取数值信息,并存放在答案库中,为后续的问答提供答案。完整的数值信息要素包含有数字,数字的量化对象,如:主体及其属性,以及时空约束条件。本文提出一种基于数值模板结合条件随机场的数值信息抽取方法,该方法利用数值相关知识来制定数值信息抽取模板,对文本模式匹配,并使用条件随机场修补模板的局限性。实验结果的准确率、召回率和F值分别为0.847、0.665和0.745。根据具体的数值问题从答案...  (本文共49页) 本文目录 | 阅读全文>>

《办公自动化》2011年10期
办公自动化

基于邻域粒化的数值信息系统的知识约简

一、引言20世纪80年代初,波兰科学家Z.Pawlak教授提出的粗糙集理论,用等价关系将论域粒化为等价类,作为一种描述客观世界的基本信息粒子,给出上下近似的概念,是一种有效的处理模糊和不确定性知识的数据分析工具,已广泛应用在数据的决策与分析、模式识别、机器学习与知识发现等多个方面。T.Y.Lin在文献[1]中提出的将邻域作为粒计算的表达,是对粗糙集理论的进一步扩展,Y.Y.Yao在文献[2]中主要讨论了粒计算的基本问题以及如何建构粒的运算。目前粒计算作为一种广义的模型,主要应用在数据挖掘、知识发现、词计算、商空间理论等方面。作为一种数值信息粒度的计算,本文将邻域粒化的思想用于构造空间中点的邻域,对数值信息系统进行了论域的划分,并提出了分布约简和规则约简的方法,给出了决策规则的形式化表示,最后通过简单的实例分析验证了该方法的可行性。二、邻域粒化基本概念1、邻域粒化定义1设是数值信息系统,其中U是对象的非空有限集合,A是属性的有限集...  (本文共3页) 阅读全文>>