分享到:

科大讯飞勇夺说话人识别国际大赛第一

本报讯 在日前结束的国际说话人识别评测大赛上,科大讯飞语音实验室送评的识别系统获得综合指标第一名的优异成绩。 $$说话人识别技术,又称话者识别或声纹识别,是语音识别技术的重要方向和应用领域。该技术通过语音信号提取代表说话人身份的相关特征(如反映声门开合频率的基频特征、反映口腔大小形状及声道长度的频谱特征等),从而识别出说话人的身份,广泛应用于军事、国家安全和各产业领域。 $$由美...  (本文共1页) 阅读全文>>

权威出处: 科技日报2008-06-21
《宿州学院学报》2017年11期
宿州学院学报

细菌趋药性算法在说话人识别中的应用

说话人识别系统是语音识别的一种,其识别过程实质上是一个模式识别过程。目前说话人识别模型大多都是基于生成性(generative)的模型,如矢量量化(VQ)模型[1]和高斯混合(GMM)模型[2],并取得一定成功。支持向量机(SVM)作为一种区分性模型,是在统计学基础上发展起来的一门机器学习方法,它具有坚实的理论基础和强大的分类能力,能很好地应用在说话人识别问题上。说话人识别过程主要有四个部分:特征提取、模式训练、模式匹配和逻辑决策。声音经过录音设备储存,声纹转换成模拟信号,再经过处理变成计算机能识别的数字信号。选择能够代表不同说话人说话特性的特征参数,在进行模型训练和测试阶段,对语音信号进行处理,用提取到的特征参数对说话人识别模型进行训练和测试,并对系统模型中的参数进行估计和优化。将测试语音的特征参数与已有说话人模型进行对照检测匹配,根据对照检测和匹配的结果得出模式识别结果。由于说话人发音的不稳定、语音信号的复杂性、实际环境的多...  (本文共4页) 阅读全文>>

《电子器件》2018年04期
电子器件

基于修正Fukunaga-Koontz变换的说话人识别方法

自动说话人识别ASR(Automatic Speaker Recog-nition)[1]在门禁、信用卡交易和法庭证据等方面,起着越来越重要的作用,它已经成为生物识别的热门课题。自动说话人识别主要分为两部分:说话人特征参数的分析提取和模型的优化识别算法的应用。通常说话人识别的经典方法是基于高斯混合模型GMM(Gaussian Mixed Model)的识别方法,由于它作为统计模型能够吸收由不同说话人引起的说话人个性特征的变化,可以得到较好的识别性能。但是由于GMM作为统计模型对模型训练数据量有一定的依赖性,所以对于小样本的与文本无关说话人识别系统,要使GMM完全吸收由不同说话人引起的语音特征的变化是非常困难的。所以在实际应用中通常采用话者适应的方法使未知说话人的语音去适应已知标准说话人的语音模型。因此,近年来在说话人识别方法方面,基于高斯混合背景模型GMM-UBM(GaussianMixed Model-Universal Ba...  (本文共5页) 阅读全文>>

《电脑知识与技术》2017年22期
电脑知识与技术

说话人识别中基于深度信念网络的超向量降维的研究

说话人识别技术,又称为声纹识别技术,它是生物识别技术的一个分支。因为每个人的声道形状,喉咙大小,以及其他发声器官的不同,所以每个人的声音各有特色。由于人与人之间存在这样的物理性差异,因此每个说话人都有独特的说话特点[1],说话人识别技术则是根据这些特点对说话人身份进行识别和辨别的一项技术。进行说话人识别时,随着说话人样本规模的不断增加,系统对说话人识别的准确率则会随之衰减[2],为了提高说话人系统的识别性能,需要获取更精确的表征说话人信息的特征向量,因此超向量(Super Vector)[3]的概念被提了出来。超向量的基本理念是通过特定的方法,将大量的说话人训练语音帧特征向量进行压缩、映射,从而构造成高维度的、固定维度的特征向量。具体来说,就是利用说话人识别中的经典模型——基于通用背景模型(University Background Model,UBM)的高斯混合模型[4](Gaussian Mixture Model,GMM)...  (本文共3页) 阅读全文>>

《中国语音学报》2016年00期
中国语音学报

基于Mahalanobis距离的说话人识别模型研究

斯混合模型是人们普遍使用的模型,背1.引言景模型是一个高阶(通常1024或者2048)的高斯混合模型,用很多不同说最近二三十年以来,说话人识别[1]话人在不同环境下的语音特征训练得到。技术发展十分迅速,从20世纪经典的高对于目标说话人,可以在只有少量训练斯混合模型(Gaussian Mixture Model,语音的条件下,依据UBM模型采用最大GMM)[2],到21世纪初流行的支持向后验概率(Maximum a Posteriori,MAP)量机(Super Vector Machine,SVM)模型自适应方法得到一个目标说话人的[3,4],再到目前非常流行的i-vector(i-GMM,其大小与UBM相同。由UBM自dentity-vector)模型[5,6],说话人识别适应训练目标说话人的GMM时,一般都性能也得到大幅度提高。只修正均值,这样目标说话人的GMM与高斯混合模型是说话人识别领域的经UBM之间的差别在于均值的不同...  (本文共6页) 阅读全文>>

《中国刑警学院学报》2014年02期
中国刑警学院学报

基于元音共振峰特征的法庭说话人识别

1似然比方法概述法庭科学家早在20年前就已经意识到了简单的“认定/否定”所带来的负面问题,因此都在探索更好的评判证据价值和表述检验结论的方法。目前,使用似然比方法的DNA证据及分析模式已经普遍为世界各国法庭所接受。因此,国外一些专家尝试效仿DNA技术,将似然比方法应用于其他法庭证据,如玻璃、油漆、语音和指纹等,并且进行了大量的测试和评估。澳大利亚、英国和欧洲一些国家的学者提出在鉴定结论的表述和价值评判上引入了似然比方法。在法庭证据评价体系中利用似然比方法评判证据力度是一种科学有效的评价方法。该方法通过比较检材和样本的相似度,计算两者的似然概率,同时以经验背景数据(先验概率)为参考,最后得到支持起诉假设(认定同一)的后验概率。似然比方法适用于多种法庭证据,如DNA、玻璃、油漆、语音等,并且各种证据的似然比还可以合并,进行综合评价。似然比方法有利于更科学地评判法庭证据的价值,供法官客观科学地判断和采信证据,对于完善证据检验鉴定体系具...  (本文共3页) 阅读全文>>