分享到:

颜永红:“搜索”语音识别的未来

——人物档案——$$    颜永红$$    中科院声学所中科信利语音识别实验室主任。$$    1990年毕业于清华大学,1995年获得美国俄勒冈研究院博士学位,后在该校任教,曾担任OGI口语研究中心的副主任、英特尔微处理器实验室的主任工程师和人机界面总框架师,英特尔中国研究中心的主任和首席研究员,英特尔全球人机界面学术委员会主席。 $$    2002年入选中科院百人计划,任声学所研究员、博士生导师,中科信利语音实验室主任和所长助理。长期从事人机界面研究工作,目前从事的研究领域:大词表非特定人连续语音识别,多模口语系统,嵌入式系统,多媒体数据检索,系统自适应和快速搜索算法。$$    在不久的将来,互联网将成为一个浩大的音视频档案库,对下一代搜索引擎来说,语音识别技术是关键。$$    10年前,他曾是英特尔微处理器实验室的主任工程师和人机界面总框架师,英特尔中国研究中心的主任和首席研究员。$$    如今,他一手创办的中科...  (本文共3页) 阅读全文>>

权威出处: 科技日报2010-05-26
《内蒙古科技与经济》2019年18期
内蒙古科技与经济

浅谈语音识别

1 语音识别技术的概念通过话筒、录音机等设备将输入其中的语音转换成音频信号,使用傅里叶变换将音频信号由时域变换到频域,以方便进行音频信号的特征提取,再进行模式匹配等多个步骤,最后输出相应的文本信息。语音识别是一门同时贯穿了多领域的技术,如信号处理、模式识别、听觉机理、人工智能等,正是这些领域的作用使得语音识别得以实现。2 语音识别的发展历程和现状人类通过语言可以互相交流。随着机械设备的不断发展,使用人类语音取代代码直接控制机器成为一个新的发展方向。1952年,世界首个可以识别10个英语数字发音的语音系统在贝尔研究所问世,这是语音识别技术的开始。1987年12月,李开复运用专家统计的方法,创建了“独立连续语音识别系统”。1997年,IBM成功地推出了首款语音听写产品——IBM ViaVoice。2011年,中国语音识别行业的领军企业科大讯飞成功的将微软的DNN模型首次应用在汉语语音识别方面。2011年,应用在新发布的苹果手机Iph...  (本文共2页) 阅读全文>>

《中国科技信息》2019年Z1期
中国科技信息

语音识别声控小车设计

回顾人类历史的发展,我们可以看到,随着人们的发展,最开始通过手掌和四肢使用简单的工具传递简单的信息。再到人们学会控制发声,并使用耳朵接收信息,形成一个声音介导的传递通道,成为人类间最便捷,最重要的信息交流方式。声波是一种音频信号。另外,声波接收指向性的要求更加宽松。特别是对于视力,触觉等存在障碍(如老年人,弱视,残疾人)或特定人群(如儿童需要保护视力),语音更是最佳的交互选择。本文的主要内容:(1)简要阐述语音识别的基本概念;(2)制定硬件设计,软件设计及仿真方案;(3)连接各部分,并进行软件程序的编译下载和仿真,最终完成声控小车的设计。系统的设计与实现语音识别的定义语音识别,顾名思义,是将测试者的一段语音信息经过某种机器转化与其相符的文本信息,它与现代技术发展息息相关;其大致流程如图1所示,其包含下文介绍的几个部分:声学模型(AM):通过训练语音数据得到,输入是一基于语音识别在智能家居,工业制造,通信服务以及如Siri和Bix...  (本文共3页) 阅读全文>>

《中国新通信》2019年04期
中国新通信

语音识别大揭秘:计算机如何处理声音?

一、生活中的语音识别案例1.1科大讯飞实时翻译机“晓译”2017年,科大讯飞推出了一款实时翻译机,其凭借精致易携带的机型与强大的实时翻译功能,曾经一度成为网红,这款实时翻译机被命名为——“晓译”一段时间内大到国家中央领导人的多国会面会议,小到明星、学生的出国工作、旅行,都能看到“晓译”的身影,这款实时翻译机在国内可谓是家喻户晓,甚至就连国外也掀起了一阵使用这款实时翻译机的风潮。就在今年4月份,科大讯飞的另一款新产品——讯飞翻译器2.0诞生了,这款翻译机作为博鳌亚洲论坛指定翻译机实时翻译功能表现的极为突出,其不仅支持中文与全球33种语言的实时翻译,还支持粤语、四川话、河南话、东北话四种方言口音的识别,强大的功能使科大讯飞站上了国内语音识别翻译领域的巅峰,截至目前,科大讯飞已经占有中文语音技术市场70%以上的份额。那么如此强大的科大讯飞的实时翻译机是如何运转的呢?首先是前期的语音数据录入,将不同方言以及普通话的中文发音录入,之后通过...  (本文共2页) 阅读全文>>

《科技经济导刊》2019年12期
科技经济导刊

关于深度学习的语音识别应用研究

现如今的孤立词识别中对基于GMM的语音识别技术具有较为广泛的应用,但在连续、大量的语音识别任务中依旧具有一些识别上层面上的问题,现下通常基于深入学习实现针对连续、大量语音的识别,照比传统基于GMM的识别系统来讲,该识别系统的识别率可提升10%到20%左右。1深度学习在声学模型中的应用声学模式是语音识别系统中具备较高代表性的模型之一,主要基于众多声学特征实现建模训练,有助于明确不同声学基元相关的发音模式。现如今应用最为广泛的声学建模研究还是以GMM-HMM为中心进行的,但其具体是随着卷积神经网络及深度网络声学建模方法在微软方面的有效实践,才开始受到研究人员的广泛重视,进而在词识别率方面获得突破性发展。经由GMM针对HMM开展具体的输出密度模型构建操作,如果训练期间使用序列区分性准则,包括MPE以及MMI等,得出的结果一般较为理想[1]。但就GMM-HMM模型来讲,以训练复杂性的角度实施分析,照比最大似然及区分性两项准则,后者复杂性...  (本文共1页) 阅读全文>>

《日用电器》2019年07期
日用电器

关于语音识别在空调上的应用与改善

桑亚超李龙杰袁传青霍庆磊张乐(格力电器(合肥)有限公司合肥230088)Application and Improvement of Speech Recognition in Air Conditioning前言随着科学技术的不断更新迭代,人们生活的方方面面不断朝智能化方向发展,而人工智能在家居方面的应用,各个地区已屡见不鲜并呈爆炸式的增长。目前智能家居的概念已经深入广大消费者的心中,中国空调行业在该领域发展迅猛,已经成为智能普及度相对较高的白色家电之一。本文通过介绍语音识别在空调上的应用及测试方法等内容阐述其应用原理和判定要求和进一步的优化空间,为智能语音空调的发展提供借鉴。1语音识别的应用途径智能语音在空调上实现应用需要三个环节:首先是获取——将人发出的语音信号转化为可处理的数字信号;然后是预处理——对采集到的语音信号进行识别过滤,降噪、消回声、去混响等处理,形成可准确判断的有效音频信号;最后是预设置的的语音识别引擎对过滤...  (本文共5页) 阅读全文>>