分享到:

语音的参数表示和质量客观评价研究

语音信号的表示和谱失真测度一直是贯穿于语音处理各个领域中的重要而基本的问题。虽历经几十年的研究和实践,产生了许多卓有成效的理论和方法,但随着对语音信号认识的进一步加深和近年来许多语音应用领域的蓬勃发展,对这一传统课题的研究再度活跃起来。语音质量客观评价更是语音表示及其谱失真测度理论的直接应用。本文重点研究语音信号的各种参数表示方法及其相应的失真测度,以及它们在语音质量客观评价方面的应用。1.提出了一种Bark尺度倒谱系数(BSCC)失真测度。它是采用一种余弦镶边临界带滤波器组代替Mel频率三角滤波器组进行倒谱分析的。理论分析和实验结果都表明这种新测度的总体性能优于MFCC谱失真测度。它在主观感知上与Bark谱失真测度相当,而其计算复杂度却与MFCC谱失真测度相似,远低于Bark谱失真测度,适于实时系统的应用。2.提出了一种新的子波变换,即语音信号Bark子波变换。它是基于语音感知实验中Bark频率尺度的概念推导而来的。数学上它是  (本文共104页) 本文目录 | 阅读全文>>

西南交通大学
西南交通大学

语音通信中音质客观评价研究

现代通信系统提供了广泛的语音服务,语音通信已经成为生活中不可或缺的交流方式。通信技术和通信服务的发展促进了对通信系统性能的评价需求,评判语音通信系统性能优劣的根本标志之一是系统所输出语音质量的好坏,因此准确有效的语音质量评估技术是提高通信系统性能的关键技术。主观评价能真实反映人对语音质量的整体满意程度,但主观评价费事费时且不适合实时性场合。近年来,以计算机信息处理为核心的语音质量客观评价成为大家关注的研究热点。本论文以军事研究项目为背景,对通信中的语音质量客观评价展开了广泛深入的研究。本文首先阐述了语音质量评价的含义,在介绍语音质量客观评价的原理及研究现状之后,指出了客观评价中存在的部分问题,并简要说明本论文的主要工作。第二章提出了一种语音特征参数MFSC,相比于MFCC,MFSC分析体现了更多的感知分析特性。将使用MFSC作为特征参数的客观测度Mel-SD用于语音质量评价测试,实验结果表明,相比于PESQ、Mel-CD,Mel...  (本文共148页) 本文目录 | 阅读全文>>

《信阳师范学院学报(自然科学版)》2008年02期
信阳师范学院学报(自然科学版)

语音失真测度系统的构成与算法实现

语音播放质量的好坏,往往是根据人们自己的听觉去进行判定的.这种评判方法费时、费工,有时还不客观.语音失真测度就是通过重建语音信号与样本(原始)语音信号在数学上的对比,给出二者的数值距离描述或听觉系统感知模型的量化指标[1].其基本原理框图如图1所示.图1语音失真测度体系F ig.1Speech d istortion m easu re system1系统构成1.1硬件结构语音测度系统由微机系统、端口适配电路板、综合信息处理板及AC/DC电源模块等组成(图2).图2系统组成框图F ig.2T he system b lock d iagram微机系统(含应用软件)通过端口适配器控制语音播放系统逐条播放语音通告,并对其输出的语音信号进行实时采样和调理.经调理后的语音信号由声卡送入微机,与标准语音库中的样板信息进行比对,再按选定的数学模型进行样板匹配计算[2],最后给出失真测度值.1.2软件结构整套软件采用开放性的软件设计指导思想,...  (本文共4页) 阅读全文>>

《声学学报》2000年05期
声学学报

一种基于听觉特性的语音失真测度方法

引言 众所周知,对于一个语音矢量量化系统以及一个语音处理系统来说,语音信号特征矢量之间失真距离的度量方法是至关重要的,它常决定了整个系统的性能。所谓失真距离就是按一定的准则来计算两个矢量之间的畸变程度,一般我们称这个准则为失真测度,失真测度的性质一般有别于度量空间中的距离测度。假设两个语音特征矢量为X和Y,失真测度用D(X,Y)表示,则D(X;Y)应具备有以下性质[1,ZI (1)D(X,Y)三0;当X—Y时等号成曳 (2) D(X, Y)< D(X, Z)+ D(Z; Y)。 (3)与语音质量的主观评价相一致。 (4)易于计算。 在对失真测度进行定义时,我们一般要着重考虑两方面问题:一方面要考虑所定义的失真测度便于计算;另一方面则要考虑它应当与语音质量的主观评价相一致,即失真度越大对应于主观感觉到的语音质量差别越大[‘,’]。总体说来失真测度可以分为两大类:第一类是欧氏距离准则,即两个矢量X和Y之间的失真距离用它们的欧几里德距...  (本文共5页) 阅读全文>>

《西南交通大学学报》2006年06期
西南交通大学学报

基于感知模型的美尔谱失真测度

评判语音信息传输系统性能优劣的重要指标之一是系统输出语音的质量[1].为了适应通信技术和服务发展的要求,研究灵活、可靠、准确的语音质量评价系统成为国内外研究者努力的目标[1~7].主观评价方法是由一组听评者对听到的语音给出质量等级判断.最典型的主观评价是MOS(meanopinion scores)方法.主观评价方法操作直接、易于理解,真实反映了人对语音质量的感知.然而,主观评价只能在特定的条件场合中才能进行,操作成本高,灵活性和可重复性差,不适合在生产过程和现场测试中使用.为了弥补主观评价的不足之处,用机器自动评价语音质量的客观评价方法应运而生.虽然从20世纪40年代起就开始客观评价研究的探索,但直到20世纪80年代以后,随着听觉生理和听觉心理方面的研究成果逐步应用到客观评价中,客观评价方面的工作才取得突破[1~8].Bark尺度和Mel尺度分别从不同角度表示人对声音频率的非线性感知特性.Bark域也称为临界频带群,是一种频域...  (本文共6页) 阅读全文>>

《兵工学报》2008年01期
兵工学报

基于小波谱失真测度的语音质量评估

在通信对抗装备试验中,常常使用话报的通信方式,利用语音信号的通信质量来评价干扰装备的干扰效果,在客观评价语音信号质量时,由于人耳对语音信号的多分辨率特性,使得对语音信号的客观评价工作带来了困难,用通用的谱分析法已经不能适应对语音信号的分析,从而不能对通信干扰装备的干扰效果进行有效地评估。近年来,人们对谱失真测度进行了深入的研究,并用谱失真测度来评价语音信号的通信质量,它具有与主观评价吻合性能较好的好处,在这一领域已经取得了许多的成果,文献[1]使用了LPC倒谱、文献[2-3]使用了Mel倒谱、及文献[4]提出的Bark谱等,这些研究中有的已经考虑了人耳的听觉特性,如Mel倒谱、Bark谱等,在对语音信号数据进行处理时,根据人耳的特性,对信号的频率采取了非均匀的划分,但是这些方法由于对信号频率的分解还是不够细致,使得评价结果不能达到很满意的结果,且由于计算过程中引入了过于复杂的数学模型,从而给实际应用中带来过多的麻烦。小波变换在语...  (本文共4页) 阅读全文>>

《西安电子科技大学学报》1999年06期
西安电子科技大学学报

一种采用余弦镶边临界带滤波器组的弯折谱失真测度

在多维谱特征空间中比较两种矢量差异性的测度,称之为谱失真测度[1](DistortionMeasure).作为语音谱特征矢量间的失真测度,要求其具有非负性;并当矢量相同时,测度为零;与主观感知的吻合性;以及计算上的简便性.在各种已提出的谱失真测度中,以Mel谱失真测度[2]和Bark谱失真测度[3]为代表的弯折频率谱失真测度,由于较充分地反映了人耳对频率及幅度的非线性感知特性,以及人耳在听到复杂声音时所表现的频率分析和谱合成特性,受到了广泛的重视和应用.在语音质量客观评价和语音识别等方面得到了大量实际应用,取得了较好的效果[2~5].文中分析了上述两种谱失真测度,提出一种新的基于余弦镶边临界带滤波器的弯折谱失真测度.1 余弦镶边临界带滤波弯折谱失真测度1.1 对Mel谱失真测度和Bark谱失真测度的探讨  Mel谱失真测度和Bark谱失真测度都是建立在语音信号频域分析基础上的,而且根据人类听觉系统对频率及幅度的感知实验结果[6,...  (本文共5页) 阅读全文>>