分享到:

采用离散HMM的孤立词识别系统

0引言目前,隐马尔可夫模型技术是语音信号处理中的主流技术,孤立词识别是语音识别的一个重要分支,可以有效地应用于电话查询、电话银行业务等领域,有很高的实用价值。离散HMM在训练及识别时计算量小,对输入矢量的分布不必作先验假设,因而在对实时性要求较高的场合得到了较多的应用。本文实现的是一个基于离散的HMM的孤立词识别系统。1 HMM对语音信号的描述及应用语音信号是通过声源经声道处理产生的,是一种时变的随机信号。语音发音是有限的,所有可以认为声道的状态是有限的。人的声道特性划分为有限个特性平稳的部分或状态,每个状态对声音信号作用产生受该处的声道物理参量决定的短时信号[1]。这样,声道特性的变化用HMM的状态转移概率来描述,某一声道特性产生短时语音信号观察值的概率分布用HMM的状态生成概率表征,则HMM模型就有效地用于描述时变语音信号。基于HMM的识别系统的词汇表共包括V个词条,利用训练数据可以为每个词条建立一套HMM参数vλ,v=1~...  (本文共2页) 阅读全文>>

太原理工大学
太原理工大学

基于HMM模型的汉语数字语音识别算法的研究

语音识别是一门涉及面很广的交叉学科,它是目前发展最为迅速的信息研究领域之一,它与语音学、语言学、数理统计学和神经生理学等学科有非常密切的关系。汉语数字语音识别(mandarin digit speech recognition)的任务是识别“0”到“9”等10个非特定人汉语数字语音。本文着眼于汉语语音识别的主要问题,研究汉语语音识别的关键技术,以提高语音的识别率和识别模型的收敛速度。本文首先对现有的语音识别技术的发展现状进行了分析。在此基础上,介绍了语音识别的基本理论,包括语音信号产生的数学模型和汉语语音特征分析。在语音信号的端点检测方面提出了基于能量和过零率的改进检测方法,并进行了实验仿真和分析。其次详细阐述了线性预测倒谱系数(LPCC)及Mel频率倒谱系数(MFCC)等特征参数的提取方法,结合实验对这两种参数下的识别率进行了比较。实验证明基于MFCC的特征参数比LPCC参数具有更好的识别率。随后介绍了汉语语音识别中常用的方法...  (本文共85页) 本文目录 | 阅读全文>>

燕山大学
燕山大学

基于WD/HMM的语音识别算法研究

语音识别技术是信息技术领域的重要发展方向之一,目前其面临的一个重要挑战就是如何提高噪声环境下的语音识别率。特征提取作为语音识别的第一步,其性能对整个系统性能——语音识别率——具有至关重要的影响。因此,本文以提高系统在噪声环境下的语音识别率为目标,以提取抗噪声的语音特征参数为研究重点,研究了噪声环境下具有鲁棒性的语音识别系统。本文在深入理解语音识别基本原理的基础上,首先,介绍了几种被广泛应用的语音特征参数提取方法。其次,详细探讨了非平稳随机信号的时频分析方法——维格纳分布,从语音信号的时变特性出发,充分利用维格纳分布的优秀特性,把其应用于语音特征提取中,并与语音信号的同态处理方法相结合,提取出两组新的特征参数,即基于维格纳分布的语音倒谱参数WD-MFCC和基于对称相关函数的语音倒谱参数WV-MFCC。同时还得到基于维格纳分布的语谱图。最后,深入研究了隐马尔可夫模型在语音识别中的应用,把本文提出的两组语音特征参数和先前介绍的几种特征...  (本文共97页) 本文目录 | 阅读全文>>

上海交通大学
上海交通大学

基于HMM的语音识别算法研究及FPGA上的硬件实现

随着信息科学和语音技术的发展,用语音和计算机交流已成为现代科学技术发展的一个标志,语音识别也因此成为现代信息科学迫切需要发展的一个方向。语音识别关系到多学科研究领域;不同领域上的研究成果都对语音识别技术的发展作出了积极的贡献。目前主流的语音识别技术是基于统计概率模型识别的基本理论。本文以最终实现一个基于隐马尔可夫模型(Hidden Markov Model,简称HMM)的非特定人孤立词语音识别系统为目的,详细介绍了语音识别技术的基本概念、孤立词语音识别的一般方法和特点;着重探讨了语音特征矢量获取、HMM模型关键问题及解决算法;最后以Xilinx公司Virtex-II Pro现场可编程逻辑阵列(FPGA)为实验平台,成功实现了基于HMM非特定人的孤立词语音识别算法移植和优化。系统采用改进的基于语音对数域能量变化率的实时端点检测算法,仅对检测的有声段语音进行特征提取和解码,从而减少了要处理的语音帧数。本实验数据表明系统在150词条的...  (本文共72页) 本文目录 | 阅读全文>>

上海交通大学
上海交通大学

汉语语音识别应用系统中的若干关键技术研究

以语音作为人机交互手段所带来的巨大便利和深远影响吸引着人们不断探索计算机语音合成和语音识别技术,对于汉语来说,鼠标键盘的人机方式有先天的劣势,所以汉语的语音识别更具有现实意义。本文提出了一个完整的汉语识别系统方案,在介绍系统不同模块的原理同时,分析了典型做法的性能,并以此提出了一系列的改进方法。文章重点研究了以下三个领域:端点检测算法对孤立词和连接词的识别性能有很大影响,本文在经典双门限端点检测技术的基础上,采用设定上下界的门限值自适应方法,并针对汉语语音,提出了基于“字”的端点检测技术,避免了语音孤立词命令因不恰当的端点检测而造成的缺字或者前后有杂音时带来的问题。实际使用中造成孤立词识别性能不良的主要原因之一是词表外(OOV)音频的存在:使用者或者环境意外发出的声音可能误认为是语音命令而识别。本文比较了多种OOV拒识算法,最后采用了时间归一化,考虑了模板自匹配性能的神经网络方法。对于非特定人识别的另一问题是非特定人模板库的建立...  (本文共97页) 本文目录 | 阅读全文>>

南昌大学
南昌大学

汉语孤立词语音识别系统设计

随着各式机器在生产和生活中发挥着重要作用,因此改善人与机器的关系就显得尤为重要。语音识别作为一种具备良好体验的人机交互媒介,对其展开的研究具有重要的实际意义。文中介绍了语音识别理论和技术发展过程,对其主要方法作了较详细的论述和分析,特别对近年来呈现出主流发展方向的隐马尔科夫模型(HMM)方法作了较深入的讨论,并在此基础上提出了基于HMM的汉语孤立词语音识别系统的设计方案。同时,编程实现了一个小词汇量非特定人孤立词语音识别系统。论文主要完成以下的工作:(1)介绍了语音识别系统中涉及的相关概念与方法,在端点检测中引入了功率谱熵与短时平均幅度相结合的方法,采用MFCC作为特征参数并添加动态差分参数形成一个39维的特征矢量。(2)详细介绍了HMM的基本思想以及它在语音识别系统中的应用,并给出其中涉及的主要算法公式详细推导。在此基础上,分别对HMM的两个模型(DHMM和CHMM)的训练做出了详细的描述,包括参数值的选择与设定。并且对模型的...  (本文共61页) 本文目录 | 阅读全文>>