分享到:

基于对抗学习的蒙汉神经机器翻译

在机器翻译模型的构建和训练阶段,为了缓解因端到端机器翻译框架在训练时采用最大似然估计原理导致的翻译模型的质量不高的问题,本文使用对抗学习策略训练生成对抗网络,通过鉴别器协助生成器的方式来提高生成器的翻译质量,通过实验选择出了更适合生成器的机器翻译框架Transformer,更适合鉴  (本文共10页) 阅读全文>>

内蒙古工业大学
内蒙古工业大学

融合并行句子提取的无监督蒙汉神经机器翻译的研究

从传统统计机器翻译到当前基于神经网络的机器翻译,无论是翻译模型训练的速度还是翻译模型生成译文的准确度都取得了巨大的进步,这些进步的背后离不开大量高质量平行语料作为翻译模型的训练支撑。然而高质量蒙汉平行语料目前处于严重匮乏阶段,如何利用现有的大量单语语料数据进行无监督训练,以缓解由于平行语料资源不足导致的蒙汉机器翻译译文不佳的问题,已经成为一个重要的蒙汉机器翻译研究方向。本文通过提出融合并行句子提取的无监督蒙汉神经机器翻译方法,重点对优化传统无监督翻译框架中词典归纳方法,语言模型训练方法及回译训练方法进行了研究。具体工作内容如下:(1)为缓解基于对抗学习的无监督蒙汉词典归纳方法准确度不高的问题,本文提出了一种基于翻译模型的无监督蒙汉词典归纳方法。首先搭建了一个融合不同粒度的无监督蒙汉统计机器翻译模型,并基于该翻译模型通过统计词对齐技术归纳出了蒙汉双语词典。之后通过将基于翻译模型归纳的双语词典,结合基于去噪自编码器训练的语言模型,对...  (本文共90页) 本文目录 | 阅读全文>>

《山西能源学院学报》2021年06期
山西能源学院学报

日汉机器翻译的局限性及策略探析

随着经济全球化及互联网的飞速发展,机器翻译广泛应用于翻译领域,甚至有人认为机器翻译有望替代人工...  (本文共3页) 阅读全文>>

《计算机技术与发展》2021年12期
计算机技术与发展

短语后验证的无监督领域适应电商机器翻译

目前机器翻译训练普遍依赖于大规模平行语料,但在电子商务领域中,公开的大规模平行语料几乎不存在且很难构建。为了解决平行资源稀缺的问题,将大量外领域平行数据迁移应用于内领域非平行数据上的方法称为无监督领域适应。但神经网络机器翻译的领域适应内领域中存...  (本文共6页) 阅读全文>>

《计算机科学》2022年01期
计算机科学

面向小语种机器翻译的平行语料库构建方法

神经机器翻译模型的训练效果在很大程度上取决于平行语料库的规模和质量。除了一些常见语言外,汉语与小语种间高质量平行语料库的建设一直处于滞后状态。现有小语种平行语料库多采用自动句子对齐技术利用网络资源构建而成,在文本质量和领域等方面有诸多局限性。采用人工翻译的方式可以构建高质量平行语...  (本文共6页) 阅读全文>>

《中文信息学报》2021年12期
中文信息学报

《机器翻译:基础与模型》

《机器翻译:基础与模型》全面回顾了近30年来机器翻译的技术发展历程,遵循机器翻译技术的发展脉络,对基于统计和基于端到端深度学习的机器...  (本文共1页) 阅读全文>>

《电子与信息学报》2022年01期
电子与信息学报

基于复述增广的医疗领域机器翻译

医疗机器翻译对于跨境医疗、医疗文献翻译等应用具有重要价值。汉英神经机器翻译依靠深度学习强大的建模能力和大规模双语平行数据取得了长足的进步。神经机器翻译通常依赖于大规模的平行句对训练翻译模型。目前,汉英翻译数据主要以新闻、政策等领域数据为主,缺少医疗领域的数据,导致医疗领域的汉英机器翻译效果不...  (本文共9页) 阅读全文>>