分享到:

低码率音频编码研究

本文研究并实现了一个用于可伸缩感知音频编码的信号模型,并对其进行优化,提出了一种由正弦+瞬态+噪声(Sines + Transients + Noise, STN)组成的信号自适应的混合模型。该模型非常适合码率和音质可伸缩编码的音频应用,实现对CD 音质或FM音质从低到中码率的编码和传输,比如6 到64千比特每秒(Kbps)。本文提出了一种基于感知信息提取STN 模型参量的算法。该算法基于共轭匹配跟踪(conjugate matching pursuit) 算法和交叠相加的分析综合法(analysis-by-synthesis overlap-add)。通过计算时变输入信号的心理声学参数,用信号的掩蔽值对匹配跟踪矩阵进行加权。该算法可以准确提取对人的听觉最重要的STN 元素,在面向极低码率应用时这一特点更突出。本文提出了一种新方法实现STN 模型中瞬态信号处理和预回声控制。该方法依赖于STN 正弦模型,因此,它避免了使用滤波器组  (本文共141页) 本文目录 | 阅读全文>>

华南理工大学
华南理工大学

基于正弦+噪声模型的宽带音频信号的表示与压缩

通信技术的发展使得实时多媒体通信称为可能,数字信号处理(Digital Signal Processing)技术在软、硬件方面的发展提供了更多更丰富的多媒体应用。数字音频信号的模型表示与压缩编码一直是学界和业界研究的热点课题。低码率、高音质、适合实时应用的宽带音频压缩算法的前景最被看好。本文从表示音频信号的模型出发,跟踪先进的研究成果,实现了一种通过确定分量(Deterministic Part)和随机分量(Stochastic Part)两部分表示宽带音频信号的模型——正弦+噪声模型(Sinusoid+Noise Model),提出了对模型的改进算法,研究了感知音频编码( Perceptual Audio Coding ) 的核心技术——心理声学模型(Psychoacoustic Model),并基于上述理论基础提出了一种低码率宽带音频压缩编码方案。在音频信号表示模型方面,本文研究了已经被广泛用于语音信号压缩的正弦模型和正弦+...  (本文共82页) 本文目录 | 阅读全文>>

上海交通大学
上海交通大学

面向移动低码率音频编解码技术研究

移动通信的快速发展和3G、B3G试验网的开通,带动了移动音乐点播、手机音频广播、手机电视、移动音频会议等新兴移动音频增值业务需求的快速增长。这些业务涉及到的音频信号内容可能包括音乐、语音以及两者的混合音频;而且移动通信无线信道具有传输码率受限(可能低于10kbps)﹑传输环境比较恶劣等特点。新的业务需求促进了面向移动低码率音频编解码技术的研究。国际上3GPP组织推出了AMR-WB+(扩展宽带自适应多速率)移动音频编码标准,MPEG则推出了EAAC+,我国AVS工作组也于2005年底启动了AVS-M移动音频编码标准的制订并于2007年8月底完成了WD文档Beta 1.3版。本文首先介绍了国内外面向移动低码率音频编解码技术的发展现状,总结了现有的主流低码率音频编解码技术,着重研究了代数码激励线性预测(ACELP)技术,变换码激励编码(TCX)技术,以及AMR-WB+中使用的ACELP/TCX混合编码技术,该技术将传统语音编码ACEL...  (本文共87页) 本文目录 | 阅读全文>>

《电声技术》1970年60期
电声技术

MPEG音频概述——当前和将来的低码率音频编码标准(上)

自从1988年以来,MPEG一直在从事着高质量低码率音频编码的标准化工作。在1992年和1994年,完成了MPEG1和MPEG2音频标准。MPEG的当前...  (本文共10页) 阅读全文>>

东华理工大学
东华理工大学

低码率音频带宽扩展设计与实现

随着互联网与移动通信技术的迅猛发展,音频数据量剧增。音频压缩算法的研究得到各大标准化组织(如MPEG、3GPP、ITU-T、AVS)的重视,低码率与高音质的编码技术成为研究热点。音频带宽扩展作为音频编码的重要内容之一也受到世界各国学者的重点关注。AVS P10是中国自主开发的移动音频编码标准,可提供高音质低码率的语音音频编码质量。本文分析了AVS P10中的带宽扩展技术,发现现有使用的子带复制策略因其子带相关性不强时会导致谐波缺失、谐波冗余等问题。为减少该类问题的产生,提高编码音质,本文提出了新的子带选择策略:皮尔逊相关系数法。具体为:依次计算每个高频子带和低频子带之间的相关性系数,最终选择一个最大值(即相关性最好)的子带并记录子带编号,然后复制对应的低频子带作为高频子带,循环这个步骤,直到四个高频子带都选择出了各自相关性最好的低频子带,最终完成高频重建。皮尔逊相关系数法虽然可以改善AVS P10中的一些编码瑕疵,但仍存在算法复...  (本文共71页) 本文目录 | 阅读全文>>

清华大学
清华大学

高采样率音频信号的参数编解码方案设计与实现

在数字调幅广播、移动通信和多媒体检索等需要低码率音频编码的应用领域,参数音频编码正在成为传统音频编码方法的必要补充。参数音频编码的核心问题是对音源模型的研究。论文对近二十年来参数音频编码及其音源模型的发展作了大体上的回顾,对其中具有代表性的音源模型进行了介绍。 现有的大部分音源模型主要是针对中低采样率(如32KHz、22KHz、16KHz,甚至8KHz)音频信号的,这样做固然可以大幅降低码率,但是由于音频带宽的不足使得编码合成音质受到了比较严重的影响。论文针对目前一部分参数音频编码音源模型在高采样率下出现的各种问题进行改进,提出一种面向44.1KHz/48KHz高采样率音频信号的参数音频编码系统,使用了可以有效兼顾码率与音质的多分辨率正弦模型和多分辨率ERB噪声模型。同时融合多种参数音频编码方案的优点,在编码器结构上进行了调整,将只对某类信号有较好编码效果的模块,如谐波结构分析模块、双变换短时成分检测与双变换短时模块等,作...  (本文共92页) 本文目录 | 阅读全文>>