面向小语种机器翻译的平行语料库构建方法
神经机器翻译模型的训练效果在很大程度上取决于平行语料库的规模和质量。除了一些常见语言外,汉语与小语种间高质量平行语料库的建设一直处于滞后状态。现有小语种平行语料库多采用自动句子对齐技术利用网络资源构建而成,在文本质量和领域等方面有诸多局限性。采用人工翻译的方式可以构建高质量平行语
(本文共6页)
阅读全文>>
-

- 计算机系统应用
在机器翻译模型的构建和训练阶段,为了缓解因端到端机器翻译框架在训练时采用最大似然估计原理导致的翻译模型的质量不高的问题,本文使用对抗学习策略训练生成对抗网络,通过鉴别器协助生成器的方式来提高生成器的翻译质量,通过实验选择出了更适合生成器的机器翻译框架Transformer,更适合鉴...
(本文共10页)
阅读全文>>
-

- 山西能源学院学报
随着经济全球化及互联网的飞速发展,机器翻译广泛应用于翻译领域,甚至有人认为机器翻译有望替代人工...
(本文共3页)
阅读全文>>
-

- 计算机技术与发展
目前机器翻译训练普遍依赖于大规模平行语料,但在电子商务领域中,公开的大规模平行语料几乎不存在且很难构建。为了解决平行资源稀缺的问题,将大量外领域平行数据迁移应用于内领域非平行数据上的方法称为无监督领域适应。但神经网络机器翻译的领域适应内领域中存...
(本文共6页)
阅读全文>>
-

- 中文信息学报
《机器翻译:基础与模型》全面回顾了近30年来机器翻译的技术发展历程,遵循机器翻译技术的发展脉络,对基于统计和基于端到端深度学习的机器...
(本文共1页)
阅读全文>>
-

- 电子与信息学报
医疗机器翻译对于跨境医疗、医疗文献翻译等应用具有重要价值。汉英神经机器翻译依靠深度学习强大的建模能力和大规模双语平行数据取得了长足的进步。神经机器翻译通常依赖于大规模的平行句对训练翻译模型。目前,汉英翻译数据主要以新闻、政策等领域数据为主,缺少医疗领域的数据,导致医疗领域的汉英机器翻译效果不...
(本文共9页)
阅读全文>>