分享到:

语音质量客观评价方法的研究

语音质量评价是语音处理系统研发中的重要问题,因此有必要对日益庞杂的语音系统进行测评。文章阐述了语音质  (本文共5页) 阅读全文>>

湖北大学
湖北大学

语音质量评价中听觉关注模型研究

由于人们应用期望值的日渐提高,音频内容趋于多样化与复杂化。心理学研究表明人们在复杂声场环境中具有选择性的听觉关注机制。而现有的语音质量评价方法仅基于声学掩蔽模型和底层声学显著性特征,与真实主观听觉感受存在较大差异,因此需要寻求更准确、可靠的语音质量评价方法。本论文将听觉关注机制引入语音质量评价体系中,分别在主、客观评价方法中建立听觉关注模型,使得评价结果更符合人的听觉特性。主观评价采用MUSHRA平台,将典型环境与关注语音相结合,并对测试序列的听觉特征属性进行分割,从不同角度分属性评价语音质量,提高了主观评价的准确度,最后利用回归分析的方法计算分项属性的加权参数估计值。客观评价采用现有的PEAQ平台,听觉关注是自顶向下(典型环境)和自底向上(声音显著度)两种机制交互作用的过程,通过典型环境分类与特征参数计算将这两种机制相关联,利用回归分析方法将主观听觉感受拟合到客观评价结果中,计算特征参数的加权值。本论文通过建立听觉关注模型,不...  (本文共57页) 本文目录 | 阅读全文>>

哈尔滨理工大学
哈尔滨理工大学

基于深度学习的语音质量评价方法研究

语音是人们信息交流中不可或缺的,语音质量直接决定了信息交流是否通畅,因此如何有效地对输出的语音质量进行评价是国内外研究者共同努力的目标。针对现有的无参考语音质量评价与主观评价结果相关性较低、无法满足市场需求的问题,本文对无参考的语音质量评价进行了研究。本文研究了一种栈式自动编码机(SAE)和BP神经网络相结合的语音质量评价方法。该方法由BP和SAE组成的深度神经网络实现。通过栈式自动编码机提取语音质量的本质特征,再将此特征通过BP神经网络与主观MOS分数进行映射。仿真结果表明,在集内和集外语种语音质量测试中,该方法与已有的ITU-T P.563和基于模糊有向图支持向量机(FDGSVM)的语音质量评价方法相比,降低了均方误差,提高了与主观评价的相关系数,但增加了评价时长。针对上述方法评价时间长的问题,本文采用精英选择和自适应步长改进的萤火虫算法融合到BP神经网络中去解决,研究了一种基于SAE和改进的BP神经网络相结合的语音质量评价...  (本文共55页) 本文目录 | 阅读全文>>

西南交通大学
西南交通大学

神经网络在语音质量客观评价应用中的研究

现有语音质量主观评价存在费时、费力、费钱,灵活性不够,重复性和稳定性较差,受人的主观影响较大等缺点。为了克服主观评价的缺点,有必要寻求方便、快捷的客观评价方法。传统的音质客观评价判断模型用简单的数学形式难以体现听觉系统对语音的感知性状,于是本文采用接近于主观评价处理方式的神经网络系统模型,针对大词汇量汉语语音数据库,进行基于输入-输出方式、仅基于输出方式的语音质量客观评价;以及针对有限单词闭集汉语语音数据库,进行基于转移概率测度的语音质量可懂度客观评价;并对相关神经网络的结构、算法进行分析研究。传统的音质客观评价方法高度依赖于特征参数和失真测度,而且对信道干扰式样的增加很敏感;判断模型用简单的数学形式难以体现听觉系统对语音的感知性状。本文通过建立以径向基函数神经网络(RBFNN)为听觉判断模型的语音质量客观评价系统,有效地实现了从语音特征参数空间到人的听觉感知的非线性映射。RBF神经网络语音质量客观评价系统模型对特征参数的依赖性...  (本文共163页) 本文目录 | 阅读全文>>

华北电力大学(北京)
华北电力大学(北京)

语音增强算法性能的评估

语音增强是语音处理的一个重要领域,它是解决语音噪声污染、改善语音质量的一种有效手段,因此,寻求一种有效的方法来对语音增强算法的性能进行评估即对增强后的语音质量进行评价具有重要意义。论文介绍了语音增强算法和语音质量客观评价的发展、应用以及国内外研究的现状,深入研究了语音增强的各种算法和语音质量客观评价的各种客观失真测度。针对SNR不能反映语音信号时变特征的不足,引入了能反映语音局部失真水平的客观失真测度,选用了分段信噪比和能反映人耳听觉特性的BSD和Mel-CD谱失真测度,针对所选取的具有代表性的语音增强算法,从连续语音、连续语音的不同部分和孤立的语音音素三个角度对语音增强算法进行了全面的评估实验。论文运用客观失真测度与SNR的结合对语音增强算法的性能进行全面评估,大量不同类别语音的评估实验结果显示,该方法可以有效地对语音增强算法进行评估,这在语音增强实际应用领域具有重要的现实意义。  (本文共58页) 本文目录 | 阅读全文>>

北京邮电大学
北京邮电大学

基于机器学习的VoLTE语音质量评价算法研究

随着LTE系统的大规模商用和5G技术的不断发展,VoLTE(Voice over LTE,长期演进语音承载)的覆盖范围也在不断扩大,扩张速率不断加快,并在未来有可能全部取代窄带电话网络成为主流通信服务解决方案。在此背景下,如何灵活准确的评价VoLTE业务的用户满意程度日益成为运营商和研究人员所关注的重要问题。本论文研究VoLTE语音质量评价问题,主要工作及创新点如下:1.针对VoLTE语音的评价算法研究,本文建立了基于4G实网传输的VoLTE语料库,包含2万多条损伤样本,总时长超过60小时。为了模拟用户在实际通话中可能出现的多种场景,除最常见的通信质量较好的情况外,还设置了不同的损伤样本文件进行语音传输,损伤类型包括话音中断、单通、声音分贝变化等。得到损伤文件后与未损伤的语音文件进行对比并使用POLQA离线打分平台对损伤文件标注。2.提出了VoLTE语音质量的无参考评价NAVSQ(No-reference Assessment ...  (本文共84页) 本文目录 | 阅读全文>>