分享到:

语音转换技术研究现状及展望

语音转换通常是指将一个人的声音个性化特征通过"修改变换",使之听起来像另外一个人的声音,同时保持说话内容信息不变。近年来,随着信息处理和机器学习技术的快速发展,语音  (本文共18页) 阅读全文>>

西北民族大学
西北民族大学

基于MATLAB的声调提取及转换系统

语音是一种近似周期性的信号,准确地提取出语音信号的基频对于语音的后期处理具有重要意义。本文基于声学特征分析,使用MATLAB编程语言实现了一个交互式声调提取及转换系统,为声调感知的研究提供了借鉴意义。声调是语言的一种特性,中国很多地区的方言都是有声调的,也正因为如此,一直有许多语言学家对声调感知进行探索。论文主要从以下几个方面进行研究:首先对声调提取及转换系统的研究背景目的和意义进行论述,给出了国内外研究现状,介绍了基音检测前期的预处理技术端点检测技术,为论文接下来的研究工作奠定了理论基础。以语音合成的关键技术作为出发点,对语音合成的基本原理和关键技术进行介绍。对STRAIGHT算法进行分析,详细介绍了该算法的原理和流程。介绍了声调和基频之间的转换原理。基于MATLAB平台搭建了一个声调提取及转换系统,并实现了各子模块的功能。系统主要包括三大模块:系统的总体外观框架的设计、每个功能菜单及控件属性的设置和调用的程序文件中回调函数的...  (本文共40页) 本文目录 | 阅读全文>>

南京邮电大学
南京邮电大学

语音转换中音段特征的建模与转换的研究

语音转换就是将一个说话人(源说话人)语音中的个性特征信息进行转换,使之具有另一个说话人(目标说话人)的个性特征,从而使得转换后的语音听起来就像是目标说话人的声音的一种语音信号处理技术。该技术不仅具有重要的理论研究意义,而且具有良好的应用价值,它的研究及发展研究愈来愈受到国内外学者的关注。本文的主要工作和创新如下:(1)简要介绍了语音转换的一些应用价值和当前的主要经典算法,讨论了常用的语音个性特征参数,以及语音转换系统的基本原理。(2)研究了经典的基音频率转换方法,针对经典算法在不同程度上存在转换精度和合成语音质量不高的情况。本文提出基于STRAIGHT模型和BP神经网络的基音频率转换算法。客观测试和主观测试上都取得了较好的效果。(3)研究了基于神经网络的频谱包络转换方法,考虑到神经网络训练算法有很多,但大都有一定自身的缺陷,针对梯度下降法训练速度慢和易导致陷入局部最优的问题,引出了基于量子粒子群优化BP神经网络的算法,并将其算法...  (本文共73页) 本文目录 | 阅读全文>>

西安建筑科技大学
西安建筑科技大学

基于个性声学特征的语音转换算法研究

语音转换是在维持原本说话者语音的含义不变的情形下,将其个性特征转换为目标说话者的个性特征,然后进行合成,使其与目标说话者的声音相似。本文主要是在研究个性声学特征的基础上,对传统的语音转换方法在转换中存在的不足进行改进和优化,具体内容有:1)由于高斯混合模型在对语音个性特征进行转换时,容易出现谱包络过平滑问题,对此文中提出一种将高斯混合模型(Gaussian Mixture Model,GMM)和广义回归神经网络(Generalized Regression Neuron Network,GRNN)相融合的语音转换模型。运用GRNN的非线性逼近能力将GMM模型参数集中的均值矢量进行映射,然后与GMM模型形成的转换规则中的均值矢量进行替换,得到新的映射关系。同时对韵律特征基频参数也进行转换,然后将频谱参数和基频参数进行联立转换,然后合成目标语音。最后通过实验仿真和性能测试表明:该方法有效的改善了转换中的过平滑问题,相比传统的GMM模...  (本文共71页) 本文目录 | 阅读全文>>

《郑州轻工业学院学报》2003年02期
郑州轻工业学院学报

基于语音段管理的语音芯片体系结构设计

对ISD系列语音芯片的体系结构进行分析的基础上,设计了一种基于语音段管理的语音芯片体系结构。该...  (本文共4页) 阅读全文>>

《常德高等专科学校学报(自然科学版)》1999年01期
常德高等专科学校学报(自然科学版)

一种基于语音段管理的语音芯片体系结构设计

对当前最有代表性ISD系列语音芯片的体系结构和功能...  (本文共5页) 阅读全文>>

吉林大学
吉林大学

基于正弦语音模型的低比特率宽带语音编码算法的研究

低比特率宽带语音压缩技术在语音信号处理领域及通信和网络系统中有着越来越广泛的应用。本文在分析了低比特率宽带语音编码技术发展的现状与需求的基础上,研究了基于正弦语音模型的低比特率宽带语音编码算法在低码率语音编码的应用,给出了基本正弦语音模型编码与谐波正弦语音模型编码算法。首先在语音分析中,提出一种基于正弦语音模型的三阶累积量清浊音分类算法;并提出了改进型子谐波—谐波比率基音提取算法。采用复杂度降低的正弦均方误差计算方法,提高了语音参数的估计精度。仿真实验还验证了这两种算法对噪声干扰都具有强鲁棒性。采用能量—谱熵两步法分类清浊音和幅度参数拟合量化以降低计算复杂度,论文实现了9.03kbit/s的变速率宽带语音编码算法;以频率偏移参数保证语音质量,提出了7.95kbit/s的修正型双带混合激励预测编码(MBME-LPC)算法;并研究了一种新的相位模型,基于最小二乘算法,推导出最佳相位估计及其迭代算法。将该模型应用于宽带语音编码中,获得...  (本文共152页) 本文目录 | 阅读全文>>