分享到:

机器翻译评测技术研究

机器翻译评测是机器翻译领域研究的重点和难点,对研究人员、系统开发者和用户均具有重要的指导意义。但是随着机器翻译的实用化,传统的基于参考译文的自动评测方法已很难满足技术发展和广大用户的需求,因此本文提出一种无需参考译文的自动评测方法。取得的主要成果包括以下三个方面:一是着眼于译文流利度,使用n-gram语言模型计算译文困惑度的倒数,作为其流利度评分。并将该评分与人工评测结果进行比较,获得二者的相关系数为0.27。二是考察译文的忠实度,将翻译视为源语言单词转化为目标语言单词的过程,首先使用双语词典在原文与译文间构造单词对齐,得到准确率与召回率,然后计算F测度值作为译文的忠实度评分。实验结果显示该评分与人工评测结果的相关系数为0.24。三是重点比较了融合流利度、准确率、召回率三种评分的两种方式:基于网格搜索算法的融合与基于机器学习的融合。实验结果表明基于机器学习的融合效果更显著,融合后评分与人工评测结果的相关系数已超过BLEU的水平,  (本文共59页) 本文目录 | 阅读全文>>

《术语标准化与信息技术》2010年01期
术语标准化与信息技术

机器翻译及其评测技术简介

本文简要地介绍了机器翻译的概念和三种比较常见的机器翻译技术,与此同时,...  (本文共7页) 阅读全文>>

陕西科技大学
陕西科技大学

基于联合学习的中英神经机器翻译方法研究

基于深度学习的神经机器翻译技术显著提高了机器翻译的质量,但是仍然存在很多问题。其一,模型训练存在着数据稀疏问题,实际任务中通常难以获得充足的平行语料库进行模型训练,这使得模型在面对低资源领域的翻译任务中,翻译效果难以达到预期;其二,多层级联的网络结构将表示信息传递到末层,但在一定程度上会损失中间层捕获到的有效信息,而且,利用最大似然估计原理的训练方法所构建的损失函数是以词为单元的,在句子或者篇章级别翻译任务中,效果较差,而且会存在训练阶段与测试阶段的不一致性问题;其三,在机器译文的评测方面,传统方法多采用BLEU、NIST等评测指标,这些指标仅衡量了译文评测的单方面信息,考虑不够全面。本文针对上述问题,进行了相关的研究,主要工作如下:第一,针对双语平行语料获取困难的难题,对语料的扩充技术进行了研究,提出了基于EM算法的语料生成联合学习方法,将EM算法应用于神经机器翻译模型Transformer的训练中,语料生成任务作为主任务,T...  (本文共81页) 本文目录 | 阅读全文>>

《中文信息学报》2012年01期
中文信息学报

第七届全国机器翻译研讨会机器翻译评测总结

该文介绍了第七届全国机器翻译研讨会(CWMT2011)机器翻译评测的具体情况。本次评测重点关注各种语言到汉语的翻译,除了汉英、英汉、日汉三个语言对以外,评测还新增了五种民族语言(藏语、蒙古语、维吾尔语、哈萨克语、柯尔克孜语)到汉语...  (本文共9页) 阅读全文>>

沈阳航空工业学院
沈阳航空工业学院

基于NP树的英文专利文献术语自动翻译技术研究

随着对外交流,引进先进技术的增加,人们接触专利文献的机会越来越多。从事科技翻译的人员经常要遇到专利文献的翻译问题。而术语翻译尤其是专利文献翻译的一个重要部分。近年来机器翻译技术取得了很大的突破,使得翻译质量有了很大的提高,为专利文献翻译提供了有力的手段。本文针对专利文献中的术语NP(noun phrase)的特点,使用统计和规则相结合的方法实现了术语NP的自动翻译。从建立NP树库,译文选择模型的建立,NP翻译模式的归纳,到基于知网的最相似NP树的查找以及翻译结果的自动评测,实现了一个完整的术语翻译流程。主要工作包括以下几个方面:第一,提出了一种改进互信息的译文选择方法。本文认为词语的译文的选择不是孤立进行的,上下文对译文的选择有着重要的意义,通过对已有的互信息公式加入翻译模型特征进行改进,结合翻译模型与互信息来选择最佳译文。第二,采用了NP翻译模式进行译文的调序处理。根据术语NP的特点,对句法分析后的NP进行翻译模式的总结,概括...  (本文共70页) 本文目录 | 阅读全文>>

内蒙古大学
内蒙古大学

基于Internet的人机互助机器翻译技术的研究

随着国际交流日益增多,在计算机、互联网等相关技术日新月异的基础上,机器翻译的技术与应用也取得了蓬勃发展。机器翻译是用计算机来实现不同语言之间的翻译,分为基于规则的机器翻译方法和基于语料库的机器翻译方法。另有,基于混合式的机器翻译方法非常胜行,即:两种方法的结合。如,在基于规则的技术中引入了语料库方法,其中有基于实例的方法、统计方法,通过对语料库的预处理使其转化为自然语言知识库的方法。近年来,基于语料库的机器翻译技术发展较快,得到了广泛的应用,根据不同领域和市场的需求,出现了各色各样有一定实用价值的机器翻译产品,使机器翻译技术真正走向了科技发展的征途。本文提出的基于Internet的人机互助机器翻译方法是一种新的辅助翻译的方法,该方法异于以往的机器翻译方法,它不完全依赖于机器的自动学习,而是通过网络爬虫技术从Internet上获取双语平行语料,然后在人工的干预下完成整个翻译过程,相比于独立的机器自动翻译,翻译质量更佳,相比于独立的...  (本文共56页) 本文目录 | 阅读全文>>