分享到:

汉语语音合成语料库的研究与建立

一前言当今计算机人机语音交互令人瞩目。语音识别与合成处理的对象均为自然语音,并从实验室走向实用。然而,语音的识别率还不尽满意,合成的声音与自然声音也有很大差距。其根本原因是对自然语音的研究不够深入,不能归纳描述、模拟自然语音的规律。为此,国外从80年代就开始了语音语料库的建设。如美国、日本、瑞典、芬兰都已经建立了本国语言的语音语料库。还建立了语音特征标注标准,ToBI。汉语是我国的语言,我们应建立汉语语音语料库,并与国际接轨。同时为语音处理、计算机语音输入/输出技术服务。在语料库的建设中,只有设计一个科学、完备的语音语料库,才能为不同需求的用户服务。语料库的科学设计表现在语料内容的选取及合理的选取方法。语料库应尽量涵盖音段和超音段的音联现象。汉语是声调语言,词调、语调模式对识别和合成的影响很大。语句能充分反映本语言的韵律结构,特别是语调信息、音变现象。语句的选取可分为独白体和对话体。独白体考虑主要句型。对话体考虑那些有语言学意义...  (本文共6页) 阅读全文>>

国防科学技术大学
国防科学技术大学

基于语料库的汉语语音模拟系统技术研究

本论文探讨语音模拟技术,围绕研制语音模拟系统展开研究。针对传统的汉语文语转换系统存在的主要问题,采用基于语料库的语音合成方法,在文本韵律层级标注、语料库分析与设计、合成单元挑选策略等关键技术上做了一系列研究。首先,本文回顾了汉语语音合成技术的发展历程,指出目前汉语语音合成存在的问题以及在现阶段研制语音模拟系统的重要意义,阐述了语音产生的生理机理以及语音合成的基本原理,并说明汉语文语转换系统的特点。接着对文本韵律层级标注作了详细介绍,分析了句子的韵律层级结构,指出句子内部的停顿原则以及语法词信息的描述。将机器学习中的C4.5决策树方法运用到文本的自动韵律层级标注方面。然后依次对语料库分析与设计、语音合成单元挑选等进行论述。在语料库分析与设计方面,首先统计TH-CoSS语料库中音节分布情况,给出TH-CoSS语料库韵律特征分类,并对每一种韵律特征进行统计,然后构造了一个基于韵律特征向量的误差函数,并采用该误差函数提取语料组成模拟系统...  (本文共67页) 本文目录 | 阅读全文>>

新疆大学
新疆大学

基于不定长拼接单元的维吾尔语文语转换系统的研究与实现

多语种的语音合成研究是近年来国内外语音合成研究的一个热点,实现多语种的语音合成,包括少数民族语言、地方方言的语音合成,也是国内汉语语音合成研究的一个重要研究方向。在新疆维吾尔自治区,由于其民族构成的特点及地理位置的重要性,研究维吾尔语的文语转换系统,具有重大的社会意义和广泛的应用前景。针对传统的文语转换系统所存在的主要问题,本文从自然语流韵律规则的总结、语料库的设计、合成方法的研究等几个方面入手,实现了一个基于不等长拼接单元的维吾尔语文语转换系统。首先根据维语的语音和语言特征,解决了音节划分等有关文本分析的问题,并总结了重音、停顿、语气等韵律规则;然后采用“语境矢量”的设计,用Greedy算法优化语料库;最后采用不定长单元的拼接合成方法,首先选择较大单元合成,当拼接单元为音节时,用Viterbi算法,基于语境挑选出最优的单元合成语音。该系统能够合成具有很高自然度的语音,并且保持了原始发音人的发音风格,从而为维吾尔语语音合成探索出...  (本文共57页) 本文目录 | 阅读全文>>

西北师范大学
西北师范大学

汉藏双语跨语言语音转换方法的研究

近年来,随着人机语音交互技术的迅速发展,语音转换技术已经得到众多研究学者的重视,将被应用到教育、通信等诸多领域。在国内,对汉语普通话、广东话等主流语言的语音转换方法的研究已经取得很大的进步。但目前还缺少民族语言与方言的跨语言语音转换系统。藏族是我国古老的少数民族之一,藏语的使用人数众多,分布区域广泛。本文将藏语拉萨话作为研究对象,建立了2800句藏语拉萨话的语料库,切分及标注声韵母信息并建立了藏语的声韵母库。在进行汉藏双语跨语言语音转换时,首先是把待转换的藏语文本翻译得到对应的汉语文本,将汉语文本进行文本分析获得所有的声韵母,再查找已建立好目录索引的声韵母库;以藏语的声韵母为基元,同时利用边界信息,根据语境有关的问题集与候选基元的频谱距离进行决策树的建立。对于目标汉语语句,利用决策树算法选择最符合语境信息的声韵母,选取发该音位置和音质最符合的声韵母,然后分别利用波形拼接合成法和STRAIGHT算法得到对应的汉语语音语句,从而完成...  (本文共53页) 本文目录 | 阅读全文>>

天津大学
天津大学

汉语语音生理语料库在对外汉语教学中的应用研究

语言是人类文明的象征,也是人们交流思想,表达感情必不可少的工具。如今,全世界刮起了“汉语热”的狂潮。在留学生学习汉语的过程中出现了许多发音错误和语调不准确的情况,进而形成了偏误现象严重。对于留学生学习汉语,要想达到流畅地用汉语表达和交流的效果,那么,获得纯正的发音是其首要任务。在以往的对外汉语教学中,语音发音的教学大都是通过看发音器官的发音图片和模仿老师的发音来进行的。但是,由于不能明确的看到发音器官的运动情况,学生们只能通过感觉来调整自己的发音,而发音图片也只能显示出发音器官某一个点的发音状态而不能把整个发音过程展示出来,用这样的方法的局限性可想而知。为了使发音教学更形象化、可视化并且探索发音器官在对外汉语发音教学中的运动变化规律,本课题拟建设一个来华留学预科生的汉语语音生理语料库,进而研发促进对外汉语教学的新方法。来华留学预科学生通常是汉语语音的初学者,所以,选择他们作为测试对象便于获得普通话发音演变的最真实的规律。该语料库...  (本文共69页) 本文目录 | 阅读全文>>

《辞书研究》1999年02期
辞书研究

关于建立网络化英汉语料库系统的设想

一、引言80年代初,英国科林斯出版公司和伯明翰大学合作共建了COBUILD语料库,用于词典编纂和语言研究,并在此基础上出版了CollinsCobuildEnglishLanguageDictionary,开了词典编纂自动化的先河。语料库作为语言信息的存储、积累和查询系统,也越来越受到语言学家们的重视。90年代初,英国的学术界和企业界联盟(牛津大学出版社、朗文出版公司、ChambersHarrap、牛津大学计算中心、兰开斯特大学、大不列颠图书馆研究和发展中心)共同建立英国国家语料库BNC(BritishNationalCorpus),该语料库现已收词1亿,用于词典编纂、语言教学和研究、教科书出版、人工智能研究、自然语言处理等。随着计算机技术和通讯技术的发展,BNC加入了光盘出版和网络出版的行列,人们可以通过购买光盘和访问其在Internet上的Web站点http://info.ox.ac.uk/bnc有偿获得有关的语言信息。大型网...  (本文共6页) 阅读全文>>

《解放军外国语学院学报》1999年S1期
解放军外国语学院学报

谈谈英国国家语料库的设计与内容

英国90年代建成了一个大型语料库,《英国国家语料库》(TheBritishNationalCorpus,简称BNC)。该语料库是在英国专家集体领导下进行的一项巨大工程,耗资140万英镑,是旨在加强英国信息技术的一项大规模的战略计划的一部分。整个工作于1991年1月开始,1994年完成,并于同年10月25日正式启用。尽管我国的外语界对BNC已有提及,但迄今尚无专文探讨,而BNC严密的组织、设计、实施、用途及所涉及的问题,对促进我国语料库的建设和语料库语言学的研究颇有借鉴意义,因此,值得介绍。1.BNC的计划要点规模 至少收集1亿词。口语部分含1千万以上自然话语,用字符标出发音,但不标明韵律。项目完成后,计划使语料库成为真正的国家资料,供广泛使用。代表性 BNC的目标是建立迄今最大、最有代表性的当代英语信息库。为了使语料库具有代表性,其收集编制由一个详细的设计说明加以指导,使其尽量代表现代英国英语。取样来自非常广泛的文章类型,含书籍...  (本文共3页) 阅读全文>>