分享到:

让电脑“听懂”人话

$T@@@比尔·盖茨不久前语言:5年后键盘和鼠标会被淘汰,人们将通过更自然的界面,如触摸式、视觉型以及声控界面与计算机进行交互。而其中的声控界面要想得到广泛应用,就必须解决一个问题;语音识别。@@@$$某一天,你打开电脑,对电脑说:“进入DO目录,运行杀毒软件,查杀该目录中的病毒。”电脑立即开始自动按你的命令执行,不需要你动鼠标或者键盘。这看起来似乎很难,实际上很多公司和科技人才正在向这个方向努力,而让电脑能“听”懂人话的关键技术就是语音识别技术。$E$$1 尚不成熟的语音识别技术$$语音识别技术是计算机领域中仍然处于不成熟阶段的技术之一。能够直接地从人类的自然语音中识别出准确的信号,并根据这样的信号来精准地控制计算机的运作,这是人类在计算机发明不久以后就提出的一个伟大的梦想。然而直到今天,语音识别技术虽然已经取得了一系列关键技术突破,但是仍然不能够完全满足人类日常应用的需要。$$比如你不能对计算机说“嗨,我说伙计,帮我搞一碗皮...  (本文共3页) 阅读全文>>

权威出处: 电脑报2008-03-03
《日用电器》2019年07期
日用电器

关于语音识别在空调上的应用与改善

桑亚超李龙杰袁传青霍庆磊张乐(格力电器(合肥)有限公司合肥230088)Application and Improvement of Speech Recognition in Air Conditioning前言随着科学技术的不断更新迭代,人们生活的方方面面不断朝智能化方向发展,而人工智能在家居方面的应用,各个地区已屡见不鲜并呈爆炸式的增长。目前智能家居的概念已经深入广大消费者的心中,中国空调行业在该领域发展迅猛,已经成为智能普及度相对较高的白色家电之一。本文通过介绍语音识别在空调上的应用及测试方法等内容阐述其应用原理和判定要求和进一步的优化空间,为智能语音空调的发展提供借鉴。1语音识别的应用途径智能语音在空调上实现应用需要三个环节:首先是获取——将人发出的语音信号转化为可处理的数字信号;然后是预处理——对采集到的语音信号进行识别过滤,降噪、消回声、去混响等处理,形成可准确判断的有效音频信号;最后是预设置的的语音识别引擎对过滤...  (本文共5页) 阅读全文>>

《中国科技信息》2019年Z1期
中国科技信息

语音识别声控小车设计

回顾人类历史的发展,我们可以看到,随着人们的发展,最开始通过手掌和四肢使用简单的工具传递简单的信息。再到人们学会控制发声,并使用耳朵接收信息,形成一个声音介导的传递通道,成为人类间最便捷,最重要的信息交流方式。声波是一种音频信号。另外,声波接收指向性的要求更加宽松。特别是对于视力,触觉等存在障碍(如老年人,弱视,残疾人)或特定人群(如儿童需要保护视力),语音更是最佳的交互选择。本文的主要内容:(1)简要阐述语音识别的基本概念;(2)制定硬件设计,软件设计及仿真方案;(3)连接各部分,并进行软件程序的编译下载和仿真,最终完成声控小车的设计。系统的设计与实现语音识别的定义语音识别,顾名思义,是将测试者的一段语音信息经过某种机器转化与其相符的文本信息,它与现代技术发展息息相关;其大致流程如图1所示,其包含下文介绍的几个部分:声学模型(AM):通过训练语音数据得到,输入是一基于语音识别在智能家居,工业制造,通信服务以及如Siri和Bix...  (本文共3页) 阅读全文>>

《中国新通信》2019年04期
中国新通信

语音识别大揭秘:计算机如何处理声音?

一、生活中的语音识别案例1.1科大讯飞实时翻译机“晓译”2017年,科大讯飞推出了一款实时翻译机,其凭借精致易携带的机型与强大的实时翻译功能,曾经一度成为网红,这款实时翻译机被命名为——“晓译”一段时间内大到国家中央领导人的多国会面会议,小到明星、学生的出国工作、旅行,都能看到“晓译”的身影,这款实时翻译机在国内可谓是家喻户晓,甚至就连国外也掀起了一阵使用这款实时翻译机的风潮。就在今年4月份,科大讯飞的另一款新产品——讯飞翻译器2.0诞生了,这款翻译机作为博鳌亚洲论坛指定翻译机实时翻译功能表现的极为突出,其不仅支持中文与全球33种语言的实时翻译,还支持粤语、四川话、河南话、东北话四种方言口音的识别,强大的功能使科大讯飞站上了国内语音识别翻译领域的巅峰,截至目前,科大讯飞已经占有中文语音技术市场70%以上的份额。那么如此强大的科大讯飞的实时翻译机是如何运转的呢?首先是前期的语音数据录入,将不同方言以及普通话的中文发音录入,之后通过...  (本文共2页) 阅读全文>>

《科技经济导刊》2019年12期
科技经济导刊

关于深度学习的语音识别应用研究

现如今的孤立词识别中对基于GMM的语音识别技术具有较为广泛的应用,但在连续、大量的语音识别任务中依旧具有一些识别上层面上的问题,现下通常基于深入学习实现针对连续、大量语音的识别,照比传统基于GMM的识别系统来讲,该识别系统的识别率可提升10%到20%左右。1深度学习在声学模型中的应用声学模式是语音识别系统中具备较高代表性的模型之一,主要基于众多声学特征实现建模训练,有助于明确不同声学基元相关的发音模式。现如今应用最为广泛的声学建模研究还是以GMM-HMM为中心进行的,但其具体是随着卷积神经网络及深度网络声学建模方法在微软方面的有效实践,才开始受到研究人员的广泛重视,进而在词识别率方面获得突破性发展。经由GMM针对HMM开展具体的输出密度模型构建操作,如果训练期间使用序列区分性准则,包括MPE以及MMI等,得出的结果一般较为理想[1]。但就GMM-HMM模型来讲,以训练复杂性的角度实施分析,照比最大似然及区分性两项准则,后者复杂性...  (本文共1页) 阅读全文>>

《机器人产业》2016年06期
机器人产业

语音识别64年大突破

语言,之所以重要,在于人类的思维能力是伴随着它的产生而迅速发展的,这也是人类在智能上区别于其他物种的原因。语音识别,作为人工智能应用的一个场景,也是研究者们一直试图解决的问题。今年10月底,微软宣布语音识别实识别一直是国内外许多科技公司重点发展的现了历史性突破,词错率仅5.9%,技术之一,百度首席科学家吴恩达就发推特英语的语音转录达到专业速录员恭贺微软在英语语音识别上的突破,同时也水平,微软的此次突破是机器的识别能力在回忆起一年前百度在汉语语音识别上的突破,其Deep Speech 2的短语识别的词错率已经降到了3.7%,Deep Speech 2转录某些语音的能英语水平上第一次超越人类。微软的这条消息发布之后在业内引起了极大的关注。语音力基本上是超人级的,能够比普通话母语者更精确地转录较短的查询。梦想从贝尔实验室开始不久前,麻省理工学院(MIT)主办的知名科技期刊《麻省理工科技评论》(MIT Technology Review...  (本文共6页) 阅读全文>>