分享到:

统计机器翻译系统中的开源软件

统计机器翻译在短时期能够得以迅速发展,除了技术进步外,很大一方面要归功于很多开放源码的统计机器翻译工具,有  (本文共3页) 阅读全文>>

《现代图书情报技术》2012年04期
现代图书情报技术

统计机器翻译中文分词优化技术研究

研究分词在统计机器翻译中的影响因素,分析不同分词对机器翻译词...  (本文共6页) 阅读全文>>

《中文信息学报》2011年04期
中文信息学报

汉蒙统计机器翻译中的调序方法研究

在基于短语的汉蒙统计机器翻译系统的研究中,我们发现存在着严重的语序错误。该文在对汉语和蒙古语句子语序进行研...  (本文共5页) 阅读全文>>

《计算机工程与应用》2010年14期
计算机工程与应用

基于短语的汉蒙统计机器翻译研究

基于短语的统计机器翻译是当前统计机器翻译的主流方法。研究了利用现有技术和资源搭建一个基于...  (本文共5页) 阅读全文>>

上海交通大学
上海交通大学

连续空间模型下的统计机器翻译

自然语言(人类语言),是指一个基于文化特点的,用于正式场合正式场合的交流系统[1]。自然语言处理(计算语言学)是指应用于学习、理解和产生自然语言的计算技术[2]。统计机器翻译是指利用机器学习为主要手段,用统计的方法来将一种语言翻译成另一种语言。作为目前自然语言处理中最流行的方向之一,区别于基于规则的机器翻译,其翻译范式是基于统计模型对平行双语语料的分析。其中,基于短语的机器翻译长时间被认为是最为有效的机器翻译方法。近年来,随着计算机性能的提升,以神经网络为代表的基于连续空间的机器翻译开始流行,在不同方面提升了机器翻译的表现:比如语言模型,翻译模型和一体化端对端的机器翻译模型等。虽然连续空间模型在机器翻译中得到了效果的提升,但是其也有显著的缺点,其中最为代表性的是:1)由于采取了非线性的模型,虽然很多工作着力于优化相应模型,但是训练和运算时间相对于线性模型仍然较慢。2)以神经网络模型为代表的连续空间模型往往采用特征自动学习的方法,...  (本文共127页) 本文目录 | 阅读全文>>

西藏大学
西藏大学

基于短语的藏英统计机器翻译关键技术研究

机器翻译(Machine Translation,MT)是利用机器将一种自然语言转换为另一种自然语言的过程。藏英机器翻译相关技术的研究,对于继承和弘扬民族优秀文化,增进文化交流,寻求思想的沟通;服务国家一带一路战略;推动我国藏族地区社会、经济、教育和文化事业发展等有着十分重要的现实意义。机器翻译是计算语言学(Computational Linguistics)的一个分支,涉及计算机技术、数学、认知科学、语言学、信息论等多门学科的交叉和联系,是人工智能的终极目标之一。因此,基于短语的藏英统计机器翻译相关技术的研究能够促进藏语计算语言学的实质性发展,具有非常重要的科学研究价值和实际应用价值。在20世纪90年代,Waever思想的基础上,IBM公司的Peter Brown等人提出了统计机器翻译的数学模型,将机器翻译问题看成一个噪声信道问题。采用这种数学模型的机器翻译性能远远超越了传统的基于规则的机器翻译,从此基于统计的机器翻译成了机器...  (本文共153页) 本文目录 | 阅读全文>>