分享到:

语音的参数表示和质量客观评价研究

语音信号的表示和谱失真测度一直是贯穿于语音处理各个领域中的重要而基本的问题。虽历经几十年的研究和实践,产生了许多卓有成效的理论和方法,但随着对语音信号认识的进一步加深和近年来许多语音应用领域的蓬勃发展,对这一传统课题的研究再度活跃起来。语音质量客观评价更是语音表示及其谱失真测度理论的直接应用。本文重点研究语音信号的各种参数表示方法及其相应的失真测度,以及它们在语音质量客观评价方面的应用。1.提出了一种Bark尺度倒谱系数(BSCC)失真测度。它是采用一种余弦镶边临界带滤波器组代替Mel频率三角滤波器组进行倒谱分析的。理论分析和实验结果都表明这种新测度的总体性能优于MFCC谱失真测度。它在主观感知上与Bark谱失真测度相当,而其计算复杂度却与MFCC谱失真测度相似,远低于Bark谱失真测度,适于实时系统的应用。2.提出了一种新的子波变换,即语音信号Bark子波变换。它是基于语音感知实验中Bark频率尺度的概念推导而来的。数学上它是  (本文共104页) 本文目录 | 阅读全文>>

厦门大学
厦门大学

基于语音质量估测模型的水声语音通信系统研究

为了解决恶劣水声信道环境下的可靠语音通信难题,基于客观质量评价的水声语音通信模型的研究具有很大的实际意义。本论文主要研究基于参数表示的语音通信质量估测模型,针对水声信道特性,设计了FM模拟水声语音通信质量的估测模型和MC-MFSK数字水声语音通信质量的估测模型,并通过仿真与海测实验验证以上两种模型的相关性能。本论文的主要研究工作如下:(1)针对基于参数提取的语音质量评估模型,考虑模拟水声语音通信质量估测模型的接收端需要正确提取原始语音的特征参数、数字水声语音通信质量估测模型需要依据接收端水印的损坏情况获取相关劣化参数,本文在两种估测模型中采用不同方式的水印算法获得相关参数。(2)针对水声信道特性,设计了FM模拟水声语音通信质量的估测模型,提出结合特征参数MFCC、LPCC、LSD的权重谱失真测度与接收语音质量PESQ-MOS的估测模型,此外,模型中调节因子动态MFCC谱失真测度的引入,使估测系统具有更好的适应性。(3)针对水声信...  (本文共97页) 本文目录 | 阅读全文>>

西南交通大学
西南交通大学

语音通信中音质客观评价研究

现代通信系统提供了广泛的语音服务,语音通信已经成为生活中不可或缺的交流方式。通信技术和通信服务的发展促进了对通信系统性能的评价需求,评判语音通信系统性能优劣的根本标志之一是系统所输出语音质量的好坏,因此准确有效的语音质量评估技术是提高通信系统性能的关键技术。主观评价能真实反映人对语音质量的整体满意程度,但主观评价费事费时且不适合实时性场合。近年来,以计算机信息处理为核心的语音质量客观评价成为大家关注的研究热点。本论文以军事研究项目为背景,对通信中的语音质量客观评价展开了广泛深入的研究。本文首先阐述了语音质量评价的含义,在介绍语音质量客观评价的原理及研究现状之后,指出了客观评价中存在的部分问题,并简要说明本论文的主要工作。第二章提出了一种语音特征参数MFSC,相比于MFCC,MFSC分析体现了更多的感知分析特性。将使用MFSC作为特征参数的客观测度Mel-SD用于语音质量评价测试,实验结果表明,相比于PESQ、Mel-CD,Mel...  (本文共148页) 本文目录 | 阅读全文>>

西南交通大学
西南交通大学

神经网络在语音质量客观评价应用中的研究

现有语音质量主观评价存在费时、费力、费钱,灵活性不够,重复性和稳定性较差,受人的主观影响较大等缺点。为了克服主观评价的缺点,有必要寻求方便、快捷的客观评价方法。传统的音质客观评价判断模型用简单的数学形式难以体现听觉系统对语音的感知性状,于是本文采用接近于主观评价处理方式的神经网络系统模型,针对大词汇量汉语语音数据库,进行基于输入-输出方式、仅基于输出方式的语音质量客观评价;以及针对有限单词闭集汉语语音数据库,进行基于转移概率测度的语音质量可懂度客观评价;并对相关神经网络的结构、算法进行分析研究。传统的音质客观评价方法高度依赖于特征参数和失真测度,而且对信道干扰式样的增加很敏感;判断模型用简单的数学形式难以体现听觉系统对语音的感知性状。本文通过建立以径向基函数神经网络(RBFNN)为听觉判断模型的语音质量客观评价系统,有效地实现了从语音特征参数空间到人的听觉感知的非线性映射。RBF神经网络语音质量客观评价系统模型对特征参数的依赖性...  (本文共163页) 本文目录 | 阅读全文>>

《信阳师范学院学报(自然科学版)》2008年02期
信阳师范学院学报(自然科学版)

语音失真测度系统的构成与算法实现

语音播放质量的好坏,往往是根据人们自己的听觉去进行判定的.这种评判方法费时、费工,有时还不客观.语音失真测度就是通过重建语音信号与样本(原始)语音信号在数学上的对比,给出二者的数值距离描述或听觉系统感知模型的量化指标[1].其基本原理框图如图1所示.图1语音失真测度体系F ig.1Speech d istortion m easu re system1系统构成1.1硬件结构语音测度系统由微机系统、端口适配电路板、综合信息处理板及AC/DC电源模块等组成(图2).图2系统组成框图F ig.2T he system b lock d iagram微机系统(含应用软件)通过端口适配器控制语音播放系统逐条播放语音通告,并对其输出的语音信号进行实时采样和调理.经调理后的语音信号由声卡送入微机,与标准语音库中的样板信息进行比对,再按选定的数学模型进行样板匹配计算[2],最后给出失真测度值.1.2软件结构整套软件采用开放性的软件设计指导思想,...  (本文共4页) 阅读全文>>

《声学学报》2000年05期
声学学报

一种基于听觉特性的语音失真测度方法

引言 众所周知,对于一个语音矢量量化系统以及一个语音处理系统来说,语音信号特征矢量之间失真距离的度量方法是至关重要的,它常决定了整个系统的性能。所谓失真距离就是按一定的准则来计算两个矢量之间的畸变程度,一般我们称这个准则为失真测度,失真测度的性质一般有别于度量空间中的距离测度。假设两个语音特征矢量为X和Y,失真测度用D(X,Y)表示,则D(X;Y)应具备有以下性质[1,ZI (1)D(X,Y)三0;当X—Y时等号成曳 (2) D(X, Y)< D(X, Z)+ D(Z; Y)。 (3)与语音质量的主观评价相一致。 (4)易于计算。 在对失真测度进行定义时,我们一般要着重考虑两方面问题:一方面要考虑所定义的失真测度便于计算;另一方面则要考虑它应当与语音质量的主观评价相一致,即失真度越大对应于主观感觉到的语音质量差别越大[‘,’]。总体说来失真测度可以分为两大类:第一类是欧氏距离准则,即两个矢量X和Y之间的失真距离用它们的欧几里德距...  (本文共5页) 阅读全文>>

《西南交通大学学报》2006年06期
西南交通大学学报

基于感知模型的美尔谱失真测度

评判语音信息传输系统性能优劣的重要指标之一是系统输出语音的质量[1].为了适应通信技术和服务发展的要求,研究灵活、可靠、准确的语音质量评价系统成为国内外研究者努力的目标[1~7].主观评价方法是由一组听评者对听到的语音给出质量等级判断.最典型的主观评价是MOS(meanopinion scores)方法.主观评价方法操作直接、易于理解,真实反映了人对语音质量的感知.然而,主观评价只能在特定的条件场合中才能进行,操作成本高,灵活性和可重复性差,不适合在生产过程和现场测试中使用.为了弥补主观评价的不足之处,用机器自动评价语音质量的客观评价方法应运而生.虽然从20世纪40年代起就开始客观评价研究的探索,但直到20世纪80年代以后,随着听觉生理和听觉心理方面的研究成果逐步应用到客观评价中,客观评价方面的工作才取得突破[1~8].Bark尺度和Mel尺度分别从不同角度表示人对声音频率的非线性感知特性.Bark域也称为临界频带群,是一种频域...  (本文共6页) 阅读全文>>