分享到:

基于条件随机场的语义角色标注(英文)

由于语义角色标注对深层次的自然语言处理非常必要,提出了一种基于条件随机场的语义角色标注方法.该方法以浅层句法分析为基础,把短语或命名实体作为标注的基本单元,将条件随机场模型用于句子中谓词的语义角色标注.该方法的关键在于模  (本文共4页) 阅读全文>>

北京邮电大学
北京邮电大学

基于条件场的语义角色标注

近年来,语义角色标注在信息检索、问答系统等自然语言处理领域应用越来越广泛,但是大部分的研究主要针对于英文,其它语言由于缺少良好的标注语料,其研究相对较少。不久前,宾夕法尼亚大学发布了人工标注的汉语语料Chinese Propbanko本文中,我们尝试使用条件随机场的机器学习算法对Chinese Propbank1.0进行有监督的学习。在研究中,除了使用已有的一些基础特征之外,我们还提出了四个新特征,并通过大量的实验验证了特征的有效性,从最终的结果来看,每一个新特征都对实验结果起到正向作用。为了缩短训练时间,提高实验结果,我们采用两阶段分类的方法。在第一阶段先进行二元分类,判别一个句法成分是否为语义角色,然后对第一阶段中的语义角色再进行多元分类,给其分配具体的语义角色。由于考虑到第一阶段二元分类的准确率,召回率问题,我们选取相应的值作为门限概率以进行非语义角色的过滤,这在一定程度上召回了部分被错误判断的句法成分,提高了最终的实验结...  (本文共56页) 本文目录 | 阅读全文>>

山西大学
山西大学

汉语框架语义角色的自动标注技术研究

为了给大规模的汉语框架语义资源的构建提供一个自动标注工具,本文基于山西大学自主开发的汉语框架语义知识库(CFN),在给定句子中的一个目标词及目标词所属框架情形下,将其语义角色(框架元素)的自动标注问题通过IOB策略转化为整个句子上的词序列标注问题,使用条件随机场模型(CRF),采用统计学中的正交表实验方案,研究了汉语框架语义角色的自动标注模型。本文的全部实验语料使用的是现有的CFN中选出25个框架的6692个例句。将语料均匀分为4份,分3组作2-fold交叉验证,以3组交叉验证的平均F1-值作为系统性能评价指标。本文给出了系统性能评价指标的方差估计,以及两个标注系统性能差异的显著性检验方法。本文以词为基本标注单元,将标注步骤分为1)边界识别、2)角色分类、3)后处理三个步骤。分别采用了边界识别与角色分类一起进行,以及先边界识别,再角色分类两种标注策略。在后处理步骤上,对输出的标注序列要求在整个句子上满足IOB序列合法性约束,并以...  (本文共87页) 本文目录 | 阅读全文>>

《文教资料》2012年27期
文教资料

中文语义角色标注研究概述

语义角色标注是实现浅层语义分析的一种方式,在问答系统、机器翻译和信息抽取等方面得到了成功地应用,是...  (本文共2页) 阅读全文>>

《高原科学研究》2018年03期
高原科学研究

论元角色的藏语语义角色标注研究

针对面向信息处理用藏语语义角色标注尚不成熟的问题,文章借鉴PropBank标注规范和语义角色分析理论,探讨了藏语语义角色标注问题。一是按照PropB...  (本文共12页) 阅读全文>>

《中文信息学报》2017年01期
中文信息学报

基于规则的“把”字句语义角色标注

"把"字句是现代汉语中一种重要的特殊句式,该文尝试用基于知识库的规则方法对把字句进行语义角色自动标注。首先,我们从《人民日报》语义角色标注语料库中收集把字句例句,形成一个覆盖范围较广的把字句例句库;之后,对例句库中把...  (本文共10页) 阅读全文>>

《内蒙古师范大学学报(哲学社会科学版)》2014年06期
内蒙古师范大学学报(哲学社会科学版)

蒙古文语义角色研究概述

面对逐渐被热议的语义角色标注,包括其实现方式以及其应用价值,都是自然语言处理工作中的难点和热点。本文通过...  (本文共4页) 阅读全文>>