分享到:

关于语料库的建立

本文首先指出建立语料库的重要性 ;接着谈了语料库的设计、选材的方法和标  (本文共9页) 阅读全文>>

北京语言大学
北京语言大学

“初级阶段留学生错别字语料库”的建立及基于语料库的研究

汉字学习一直是留学生学习汉语时的一个难点,尤其是对初级阶段的留学生来说。本文旨在通过搜集、整理、分析和研究初级阶段留学生的错别字真实语料,找出留学生汉字习得偏误的规律,为汉字教学提供一些参考依据。本文主要分为两个大部分。第一个部分是初步建立了“初级阶段留学生错别字语料库”。第二个部分是在语料库的基础上对初级阶段留学生错别字现象进行研究。研究主要包括四个方面:一是通过对语料库中所收录的错别字的整理、归纳,对错别字进行了类型研究。将初级阶段留学生的错别字先按汉字的构形层次分类,然后综合各类的错别字特点,从总体上将错别字再分为八个大类。以期从宏观和微观两个角度对初级阶段留学生汉字习得的偏误特点进行比较完整的描述。在对错别字的类型进行分析的过程中,发现汉字中的“钩”笔形的偏误特点有其自身的独特性。研究的第二个方面是从钩笔形的形成、演变、功能几个方面分析钩笔形的偏误特征及产生偏误的原因。结论为汉字的笔画体系具有构形、构义和审美功能。钩类笔...  (本文共57页) 本文目录 | 阅读全文>>

中国海洋大学
中国海洋大学

基于英汉双语语料库的英汉双语Ontology的建立与管理

随着Internet的迅猛发展,信息技术面临的种种挑战促成了建立Ontology的热浪。通常,一个成熟本体的建立除了需要领域专家的参与外,还需要遵循Ontology的一系列构造准则和评估标准,成本十分高昂,其效果也不尽人意。目前,国外已建立了许多比较成熟的英语Ontology,国内也已有了比较完善的英汉双语语料库,现在完全可以利用这些已经成熟的资源来建立为我们自己所用的英汉Ontology。本文基于英汉双语语料库,实现了一种将英语Ontology转化为我们自己所用的英汉双语Ontology的方法,使我们能够以较低的代价获得比较成熟的英汉双语Ontology,这必将带动我国Ontology建设乃至其相关领域的飞跃发展。第一章介绍Ontology和双语语料库以及本课题的研究背景和研究目的。第二章介绍Ontology的一些重要概念,包括Ontology的定义、分类、应用、构建方法、开发支撑工具以及描述语言。第三章介绍语料库和双语语料库...  (本文共69页) 本文目录 | 阅读全文>>

华东师范大学
华东师范大学

当代汉语翻译小说规范的语料库研究

本文用语料库语言学的工具和方法来描写、分析和解释当代汉语翻译小说中的翻译规范。本文所谓的“翻译规范”是指:特定社会文化条件下,人们对什么是翻译和应当如何翻译等问题达成的社会共识。这种共识体现为社会成员通过翻译政策对翻译文本、语种和译者的选择与对翻译总体性质的期待;带有一定的规约性和奖惩性;译者作为译语社会文化成员,在社会化过程中习得翻译规范;它的存在使翻译文本的总体呈现出特定的语言特征。翻译规范是翻译行为社会性的体现,它与翻译行为的本质具有必然的联系。本文用德国社会哲学家哈贝马斯(Habermas)的“交往行为理论”重新阐释了翻译行为的性质:翻译行为的本质是一种交往行为,即至少两个具有语言和行为能力的主体之间为达到相互理解而进行的交往。翻译行为涉及三个不同的世界:一是原文所构成和呈现的客观世界;二是译文赖以生存的译语社会世界;三是译者自身的主观(主体)世界。作为行为主体的译者必须协调与这三个世界的关系,使翻译行为满足交往合理性的...  (本文共256页) 本文目录 | 阅读全文>>

南京师范大学
南京师范大学

现代汉语法律语料库的建立及其词汇计量研究

法律语言学作为一门新兴的学科,在中国兴起和发展的时间才二十多年,基本理论和研究方法都还处于探索阶段。中国法律语言学注重书面语的研究,主要还是运用传统的语言学的方法对法律语言中的字、词、句等进行研究。与国外法律语言学相比,研究内容显得比较狭窄,研究方法也比较陈旧。近年来中国法律语言学逐渐接受国外法律语言学的影响,在基本理论和研究方法上都有所拓展。建立法律语料库并对其词汇进行计量研究,旨在对中国法律语言的使用现状进行考察,以推进法律语言学的研究,为法律实践服务。首先是建立法律语料库,主要是法律书面语的语料库,并对其进行机器自动分词和词性标注。其次是将法律语料库中所有的词进行词频统计,并根据五级频度划分法进行分级。得出高频词83个、次高频词819个、中频词1301个,共计2203个,将其作为法律语域的基本词汇。再次,将法律语域基本词汇分为三类,分别是法律术语、法律基本用语和法律语域常用普通词汇,提取出法律语域基本词汇中的法律词汇。最后...  (本文共86页) 本文目录 | 阅读全文>>

《电脑与电信》2012年03期
电脑与电信

蒙古语语音合成语料库的设计及韵律标注规范的建立

以蒙古语中的察哈尔方言为研究对象,结合了蒙古语自身的音节结构特点,对蒙语语音合成语料库的构建进行了介绍,同时设计了一套韵律标注规则。语料来源...  (本文共4页) 阅读全文>>