分享到:

HMM识别孤立词的研究与实现

本文介绍了隐式 Markov 模型(简称 HMM)识别语音的基本原理,对在训练孤立词模型过程中采用的 Baum-Welch 算法和 Viter  (本文共9页) 阅读全文>>

西北大学
西北大学

汉语孤立词语音识别的研究与实现

孤立词语音识别实现简单、技术成熟,有着广泛的应用领域,是深入进行语音识别研究的基础。隐马尔可夫模型(HMM)是目前最流行的语音识别技术,许多成功的语音识别系统都是基于该技术实现的。本文通过一个在Windows平台上用VC++实现的基于连续隐马尔可夫模型(CDHMM)的汉语小词汇量、非特定人、孤立词语音识别系统,对孤立词语音识别进行了研究。论文首先研究了语音识别的基本知识,主要包括语音识别的原理;语音信号处理的基本知识;各种语音识别和训练的方法。然后研究了隐马尔可夫模型的原理及其在语音识别中的应用。在此基础上论文主要工作有以下:1)完成了一个使用连续隐马尔可夫模型的汉语小词汇量、非特定人、孤立词语音识别系统的设计和实现,并进行了实验。由于使用VC++实现系统,对信号处理较为复杂。因此在实现时没有选用美尔频率特征系数(MFCC),而是选用了近似于MFCC但计算相对简单的LPC美尔倒谱系数(LPCMCC)作为特征参数。2)实验时发现系...  (本文共70页) 本文目录 | 阅读全文>>

西安电子科技大学
西安电子科技大学

基于特定人的汉语语音识别的研究与实现

近年来,随着语音识别理论研究的深入和数字信号处理软、硬件技术的发展,语音识别技术的研究越来越受到人们的关注。另外,嵌入式技术的发展,使嵌入式语音识别技术成为语音识别领域发展的重要方向。本文简要介绍了语音识别技术的基本知识,给出了语音识别的系统模型,对模型中涉及的算法进行了重点的研究和实现。另外,论文对嵌入式语音识别系统也做了相应的研究和实现,并对语音识别技术的发展方向提出了展望。语音识别算法的研究与实现是本文的重点。根据语音识别系统的基本模型,论文对语音信号的预处理、特征提取和识别算法做了深入的研究,并在PC机上用MATLAB语言、动态时间规整识别算法设计和实现了一个特定人、小词汇量、孤立词语音识别系统。另外,论文对PC机上的语音识别系统用C语言进行了实现,并将新系统应用在XSBase开发平台上,进行了嵌入式语音识别技术的研究。  (本文共73页) 本文目录 | 阅读全文>>

南昌航空大学
南昌航空大学

基于DSP的孤立词语音识别系统的研究与实现

本文基于TMS320VC5502芯片设计了一个非特定人嵌入式语音识别系统。该系统采用乒乓式数据处理方式,能够保证语音信号的采集和语音信号的识别实时进行;采用了在线端点检测算法,可以有效检测出音频流中的说话语音;声学模型采用隐马尔科夫模型技术,可以克服传统DTW方法的缺陷,有效提高系统的识别精度。本文实现的语音识别系统主要由DSP硬件设备和相应的软件算法组成。采用TI公司的高速DSP芯片TMS320VC5502作为系统的硬件平台,通过麦克风实现语音信号的输入,然后由TLV320AIC23B音频编解码芯片采集处理,并由DMA管理器负责将语音信号传送至数据存储区。通过端点检测和特征提取,将语音信号转换为MFCC特征系数,最后由Viterbi算法得到最终的识别结果。该系统主要由语音信号的预处理、端点检测、特征参数提取、相似性度量等组成。本设计采用基于能量变化的方法进行端点检测,相比传统基于能量和过零率阈值的方法,可以提高检测的鲁棒性,降...  (本文共70页) 本文目录 | 阅读全文>>

北京交通大学
北京交通大学

基于小词汇量语音识别算法与TTS系统的车联网移动终端研究与实现

语音人机交互是人机交互工程的一项重要研究内容。目前,中文语音交互技术发展很快,系统应用已经比较成熟,如科大讯飞的移动TTS(Text to Speech文语转换)系统已经投入商用。本文以语音交互系统为研究对象,旨在以构建基于车联网的移动车载语音交互系统为研究目的,通过研究设计实现了系统语音识别及合成模块的相应算法,并分别构建了其对应的系统,实验测试结果良好,可以满足嵌入式移植及车联网环境下的需求。论文介绍了基于小词汇量语音识别算法与TTS系统的车联网移动终端的构建与实现;分析了Android手机平台的系统特性及嵌入式环境下语音交互模式的特点;讨论了基于该具体应用背景下特定的语音识别算法和语音合成算法,分别设计了语音识别模块(含在线模式与离线模式)与语音合成模块;对相应算法做了车联网环境下的适应性改进;在线模式下的语音识别研究:在PC机上利用HTK搭建语音识别系统,以此模拟车联网云计算中心的在线语音识别功能;而离线模式下的语音识别...  (本文共87页) 本文目录 | 阅读全文>>

河北工业大学
河北工业大学

基于数学形态学的语音识别系统的研究与实现

语音识别是当今人工智能领域的研究热点,目前,它越来越广泛地应用于社会生活的各个方面,提高了人机交互性,发挥了很好的社会效益。然而在实际环境中存在着很多不利因素影响着识别系统的性能,语音识别的鲁棒性问题受到了研究者的广泛关注。数字形态滤波器是从数学形态学发展出来的一种重要的非线性滤波技术,它在图像分析与处理、计算机视觉等领域获得了广泛的应用。近年来,形态学滤波逐渐被推广到一维信号处理领域,由于其良好的滤波性能,人们也开始探索它在语音处理方面的应用。本文重点集中于数学形态学在一维语音信号处理中的研究。依据数字语音信号的特点,设计了用于语音处理的形态学滤波算法。实验结果表明,形态学滤波能有效地抑制噪声的干扰,对混噪语音质量的增强效果显著。进而,将形态学滤波引入到语音识别当中,提出了一种基于数学形态学的抗噪声语音识别新方法。该方法使用形态滤波器去除待识别语音中的噪声,提取出尽可能纯净的原始语音信号;并且在模板训练之前加入了相同的形态学滤...  (本文共50页) 本文目录 | 阅读全文>>