分享到:

统计机器翻译中文分词优化技术研究

研究分词在统计机器翻译中的影响因素,分析不同分词对机器翻译词  (本文共6页) 阅读全文>>

《中文信息学报》2011年04期
中文信息学报

汉蒙统计机器翻译中的调序方法研究

在基于短语的汉蒙统计机器翻译系统的研究中,我们发现存在着严重的语序错误。该文在对汉语和蒙古语句子语序进行研...  (本文共5页) 阅读全文>>

《计算机工程与应用》2010年14期
计算机工程与应用

基于短语的汉蒙统计机器翻译研究

基于短语的统计机器翻译是当前统计机器翻译的主流方法。研究了利用现有技术和资源搭建一个基于...  (本文共5页) 阅读全文>>

上海交通大学
上海交通大学

连续空间模型下的统计机器翻译

自然语言(人类语言),是指一个基于文化特点的,用于正式场合正式场合的交流系统[1]。自然语言处理(计算语言学)是指应用于学习、理解和产生自然语言的计算技术[2]。统计机器翻译是指利用机器学习为主要手段,用统计的方法来将一种语言翻译成另一种语言。作为目前自然语言处理中最流行的方向之一,区别于基于规则的机器翻译,其翻译范式是基于统计模型对平行双语语料的分析。其中,基于短语的机器翻译长时间被认为是最为有效的机器翻译方法。近年来,随着计算机性能的提升,以神经网络为代表的基于连续空间的机器翻译开始流行,在不同方面提升了机器翻译的表现:比如语言模型,翻译模型和一体化端对端的机器翻译模型等。虽然连续空间模型在机器翻译中得到了效果的提升,但是其也有显著的缺点,其中最为代表性的是:1)由于采取了非线性的模型,虽然很多工作着力于优化相应模型,但是训练和运算时间相对于线性模型仍然较慢。2)以神经网络模型为代表的连续空间模型往往采用特征自动学习的方法,...  (本文共127页) 本文目录 | 阅读全文>>

西藏大学
西藏大学

基于短语的藏英统计机器翻译关键技术研究

机器翻译(Machine Translation,MT)是利用机器将一种自然语言转换为另一种自然语言的过程。藏英机器翻译相关技术的研究,对于继承和弘扬民族优秀文化,增进文化交流,寻求思想的沟通;服务国家一带一路战略;推动我国藏族地区社会、经济、教育和文化事业发展等有着十分重要的现实意义。机器翻译是计算语言学(Computational Linguistics)的一个分支,涉及计算机技术、数学、认知科学、语言学、信息论等多门学科的交叉和联系,是人工智能的终极目标之一。因此,基于短语的藏英统计机器翻译相关技术的研究能够促进藏语计算语言学的实质性发展,具有非常重要的科学研究价值和实际应用价值。在20世纪90年代,Waever思想的基础上,IBM公司的Peter Brown等人提出了统计机器翻译的数学模型,将机器翻译问题看成一个噪声信道问题。采用这种数学模型的机器翻译性能远远超越了传统的基于规则的机器翻译,从此基于统计的机器翻译成了机器...  (本文共153页) 本文目录 | 阅读全文>>

上海交通大学
上海交通大学

基于短语的统计机器翻译中的调序问题研究

机器翻译是利用计算机系统在自然语言之间进行自动转换的过程,是信息时代跨语言交流的一项重要工具。多年来,机器翻译领域的研究取得了长足发展,但机器翻译系统的译文在很多应用场合依旧远未达到令人满意的水平,原因之一是统计机器翻译技术中存在一系列尚待有效解决的困难问题,如何更好地解决这些问题对机器翻译的研究有着深刻的影响。本文针对机器翻译中的一项重要的困难问题,即调序问题进行深入研究。调序问题来源于自然语言之间的语序和句法间的差异,选择正确词序的能力对机器翻译系统的译文质量有着显著影响。本文从预调序的角度入手,对调序问题及相关的语言现象进行分析,并结合机器翻译系统的原理和特性,在总结国内外现有的预调序方面的研究成果的基础上,提出了两种用于基于短语的机器翻译系统的预调序方法。本文首先提出一种基于词对齐的调序方法,该方法使用词对齐信息抽取调序所需的结构化数据,并用于训练调序模型,因此不依赖于源语言句法分析器,可应用于资源匮乏的语言。之后,本文...  (本文共85页) 本文目录 | 阅读全文>>