分享到:

情感语音合成

语音是最理想的人机交互方式之一,而语音合成技术则是实现语音人机交互的基础。从第一个电子语音合成器问世以来,随着各种新技术手段的应用,特别是近年来随着基于基音同步叠加、结合大规模自然语音库和数据挖掘等智能算法的语音合成方法的流行,语音合成技术在可懂度和自然度上达到了相当的水平,并且开始产业化,逐渐进入人们的日常生活。语音合成技术的推广应用,对语音合成的质量提出了更高的要求。如何进一步提高语音合成的表现力,特别是让合成语音能够模拟表达说话人的情感状态,是语音合成未来发展的趋势,也是语音合成研究领域所面临的一个难题。情感语音合成是一个跨学科的、具有很高理论价值和应用价值的研究课题;作为语音合成的一个新的研究方向,正受到众多研究者越来越多的关注。本文以情感语音的基频特征为主要研究对象,以合成情感语音为主要研究目标,对基于基频特征的情感语音建模以及情感语调规则指导下的情感语音合成器设计等问题进行了较深入的研究。在此基础上,构建了一个语音合  (本文共128页) 本文目录 | 阅读全文>>

西北师范大学
西北师范大学

基于深度神经网络的情感语音合成的研究

随着计算机技术和信号处理技术的发展,语音合成的质量得到了较大程度的提升。但目前语音合成研究大都以合成中性语音为主,缺少对情感语音合成的研究。人类语言中包含了丰富的情感信息,这些信息仅靠中性的文本或语音无法充分传达。随着深度学习与人工智能的普及,富有情感的人机交流正在逐渐成为需求,情感语音合成的研究具有了越来越重要的意义。本文建立了一个包含11种典型情感的多个说话人的情感语料库,引入深度神经网络(deep neural network,DNN)模型,实现了基于DNN的情感语音合成与基于DNN的说话人自适应情感语音合成,在此基础上,进一步引入了PAD三维情感模型,实现了PAD情感修正的基于DNN的情感语音合成。论文的主要工作及创新如下:1.建立了多个说话人的典型情感语料库。使用专业录音设备,采用情感诱发方法获取了9位女性说话人的11种情感(放松、惊奇、温顺、喜悦、愤怒、焦虑、厌恶、轻蔑、恐惧、悲伤等)的语音。录音文件以16KHz采样...  (本文共64页) 本文目录 | 阅读全文>>

北京邮电大学
北京邮电大学

基于迁移学习和自学习情感表征的情感语音合成

随着计算机科学和人工智能等领域的发展,作为人机交互核心技术的语音合成技术已经较为成熟,但目前语音合成技术主要针对中性语音的合成,情感语音合成技术仍然有待提高。情感作为一种重要的信息,会很大程度上改变语音所表达的内容,在缺少情感信息时会造成表达有歧义、人机沟通不顺畅等问题。本文针对情感语音合成中的情感表征问题进行分析,提出了一种自学习情感表征方法,并且基于自学习情感表征提出了一种情感语音合成方法,主要研究内容如下:1.针对现有情感表征对情感的描述力不够、不同人进行情感语音标注时存在差异以及人力标注代价过大等问题,提出了一种自学习情感表征方法,该方法通过一种自编码网络对语音中的情感信息建模,将语音中的情感信息进行量化,在训练时使用了对抗训练的方法保证在情感建模的过程中不受到说话人个体差异的影响。实验结果表示,自学习情感表征在不需要人工参与的情况下具有较好的情感描述能力,解决了标注代价大和个体标注差异性的问题。2.提出了一种基于迁移学...  (本文共72页) 本文目录 | 阅读全文>>

云南大学
云南大学

基于HMM的汉语情感语音合成系统的实现与改进

随着信息技术的发展,智能化移动设备应用越来越普及,人们对人机语音交互提出了更为多样化的需求。本文以开发应用系统为目的,研究基于隐马尔可夫模型的情感语音合成,探索提高语音合成自然度以及情感表现度的方法。论文的主要工作包括如下:1、为实现实验内容,构建了情感语音数据库。针对中文语音,甄选、采集、录入了四种不同情感的语音及相应的文本资料。分析了情感语音的特征,根据其特征,录入采集并构建了情感语音数据库。通过构建的情感语音数据库,进一步研究分析各个情感语音之间的特征及关系。2、构建了基于HMM的情感语音合成系统,描述了决策树模型的算法,使计算机能够自主进行情感语音合成方面的训练,能够根据语料库的更新来进行更深层次的训练,并详细介绍了情感语音合成基线系统的实现过程。3、针对中文情感语音表述特点,为进一步提高情感语音合成的感情色彩,在原有的情感语音合成方面,对合成参数进行了相应的改进,实现合成语音中情感程度的调节。实验结果表明,改进后的中文...  (本文共67页) 本文目录 | 阅读全文>>

西北师范大学
西北师范大学

统计参数情感语音合成的研究

随着语音合成技术的研究与发展,合成语音音质得到较大提升,但当前语音合成技术的研究仍以中性化语音为主,对情感语音合成的研究较少。人类生活对智能语音的需求不仅要涵盖基本的文字内容,还要承载丰富的情感信息,情感语音合成的研究将是智能语音研究领域的必然趋势。本文建立了一个多说话人的多种情感的情感语音语料库,针对汉语统计参数语音合成中的上下文相关标注生成,设计了一套包含6层上下文信息的标注格式,在此基础上,采用多说话人的情感语音数据和统计参数语音合成方法,利用说话人自适应训练算法训练了情感语音的声学模型,实现了情感语音的合成。论文的主要工作和创新如下:1.建立了一个多说话人的多种情感的语料库。在专业录音棚中,采用诱发方式激发录音人的情感,并进行录音。录制了7个男性说话人和7个女性说话人的11种典型情感的情感语音数据,并以Microsoft WAV格式(单通道、16bit、16kHz采样频率)进行保存。2.实现了一种面向普通话统计参数语音合...  (本文共64页) 本文目录 | 阅读全文>>

中南大学
中南大学

基于情感基音模板的情感语音合成

随着信息技术的高速发展,人类对计算机的依赖性不断增强,因此,人机的交互能力越来越受到研究者的重视。语音是众多信息载体中具有最大信息容量的信号,具有最高的智能水平。传统的语音处理系统只着眼于语音词汇传达的准确性,而忽略了包含在语音信号中的情感因素,让计算机像人一样说出含情感色彩的语音是人们长期追求的目标。因此,本文对情感语音合成技术进行了研究。本文提出了基于情感基音模板叠加的情感语音合成方法。本文用praat软件从中科院录制的情感语音库中提取了声母模板和高兴、愤怒、悲伤及中立四种情感下的韵母基音模板,建立了声母库和韵母情感基音模板库;建立了汉语中阴平、阳平、上声和去声四个声调的归一化调型函数,并研究了如何通过调型函数得到合成韵母的基音周期序列;研究了情感基音模板对合成语音音质的影响;提取情感语音的韵律参数并研究韵律特征在各种情感下的表现规律;研究了基音同步叠加算法(PSOLA),并在该算法的基础上提出用情感基音模板叠加的方法合成情...  (本文共80页) 本文目录 | 阅读全文>>