分享到:

OCR技术及其应用

什么是OCR?$$扫描仪帮助我们将大量的文稿资料扫描并储存到计算机,形成图像数据,为我们的日常工作提供了不少的方便。但此时我们得到的仅仅是一幅幅关于文稿资料的点阵图像,一般情况下是无法象WORD文档那样自由编辑的。如何有条不紊地管理这些数据,或者说有没有一种更加先进和快捷的方法,以实现“文稿资料(如报纸杂志、传真或打印稿等)+扫描仪+相关软件=电脑可编辑的文本文件”呢?有,这就是OCR技术。$$OCR是英文Optical Character Recognition(光学字符识别)的缩写,它是模式识别领域一个很活跃的分支,是指利用图像处理、模式识别、人工智能等计算机技术手段,通过光学扫描把记录在纸张上的信息转化成电子文本。由于电子文本和传统的纸张文本相比,具有储存空间小、复制传递方便、查找快捷、修改容易等优点,所以OCR技术在很多领域得到了迅速推广。$$从20世纪60年代OCR开始研究,到90年代OCR开始广泛应用,目前OCR技术...  (本文共2页) 阅读全文>>

《警察技术》1940年30期
警察技术

OCR技术及其在证件上的应用

OCR技术及其在证件上的应用于锐OCR技术出现至今已有30多年的历史,特别是进入70年代后期,由于LSI及CCD器件的出现,使其进入一个崭新的实用阶段,在计算机自动录入、票据识别、邮件分拣、资料分析等很多方面获得了广泛的应用。可以说OCR技术是在模式识别和人工智能领域中最成功的应用之一。近几年,它又被成功地移植到证件行业上来,由于其独有的技术特点,发展很快。一、OCR技术简介OCR(即光学字符识别)技术在50年代末已经成熟,它属于自动化范畴图像处理的一个分枝,它的成功归结于数理统计学的发展。所谓光学字符识别,简言之就是把纸张上写有或印有的字符经光电转换、算法分析转化为机器(计算机)能够识读的字符信息。从50年代后期到现在发展出来的OCR技术识别原理可以简单地分为三大类,他们分别是:相关匹配识别、概率判定准则及句法模式识别。相关匹配识别原理是根据字符的直观形象抽取特征,用标准字符与判定字符在相关器中进行匹配来完成识别工作,这种匹配...  (本文共4页) 阅读全文>>

《软件导刊》2006年18期
软件导刊

OCR技术的教育应用研究

O前言教育信息化是信息和信息技术在教育、教学中的应用与推广,它的发展离不开各种信息技术的支持。OCR技术即光学字符识别技术,其一般的应用是使扫描仪将印刷品的文字转化为计算机可处理的文本。文本是教育信息基本的重要的形式。教育资源建设是发展教育信息化的基础,而信息获取和相关处理是资源建设中必不可少的工作。OCR技术不是获取文本信息的唯一方式,但可极大地减轻数据录人工作的强度,提高数据录人的速度,提高人们文本处理工作的效率。推广和应用该技术无疑对我国教育信息化的发展是有益的,对提高个人信息素养也大有帮助。1 OCR技术及其应用OeR是英文oprieal Charaeter Recog- nition的缩写,即采用各种光学设备识别手写或打印的字符。使用OCR技术,可通过扫描仪、数码相机等光学输人设备将报刊、书籍、文稿、票据以及其它印刷品的文字转化为计算机的图像信息,然后再转化为计算机的内码,也就是计算机的文本。OCR技术实际上是一种将计...  (本文共2页) 阅读全文>>

江西师范大学
江西师范大学

复杂背景下的文本提取技术

OCR(Optical Character Recognition,光学文本识别)技术作为基本的模式识别技术,在计算机输入系统、智能交通系统和安防系统等领域都获得了广泛的应用。根据应用领域的不同,可分为通用的OCR技术及复杂背景下的OCR技术两大类,前者主要应用于将文字材料自动识别录入到计算机系统中;后者则应用于复杂的工业环境中,如智能交通系统中的汽车牌照识别、集装箱编号识别、火车车皮编码识别等领域。复杂背景下的OCR技术涉及的图象处理与模式识别技术较通用的OCR技术更为复杂,是文本识别技术的研究前沿之一。本文在结合LPR(License Plate Recognition,车牌识别)技术进行实验的基础上,对复杂背景下的文本提取技术进行了研究,提出了基于PCNN(Pulse-CoupledNeural Networks,脉冲耦合神经网络)的边缘检测新方法;同时提出了基于形态学运算的断裂噪声过滤技术,有效实现文本字符特征的提取。P...  (本文共41页) 本文目录 | 阅读全文>>

中国科学院研究生院(计算技术研究所)
中国科学院研究生院(计算技术研究所)

低质量文本图像OCR技术的研究

本论文对低质量文本图像的OCR技术进行了深入的研究,目标就是从理论,算法和应用三个层次上研究低质量文本图像的高性能识别问题。研究工作主要包括以下几个方面:首先分析论述了低质量文本灰度图像条件下,文字识别与人的认知、经典人工智能问题、以及二值图像识别技术之间的关系,对低质量文本图像OCR技术的研究方向提出了有别于传统的观点和看法。在上述理论框架的指导下,结合低质量文本自身的特点和规律,设计了一个低质量文本图像的识别流程,并在各主要步骤给出了实用高效的算法,主要有:基于连通区域的层次结构切分算法:不同于传统的先行列切分,再字切分的算法过程,本方法采用了由小到大、自底向上的切分策略。通过连通区域特征的变化规律找出适用于切分的最佳阈值,再根据先验知识和启发式规则,对连通区域做适当的合并分割操作,最后得到最优的切分结果。实验表明,该方法对于低质量文本图像能够取得令人满意的切分效果。基于地形特征的种子区域增长算法:基于确定点和关键点概念,利...  (本文共116页) 本文目录 | 阅读全文>>

《交通世界》2018年32期
交通世界

OCR技术在桥梁管理系统中的应用

0引言桥梁管理系统是桥梁信息化管养的重要支撑工具,完整、准确的桥梁数据是桥梁管理系统发挥其高效查询、服务管养作用的基本前提。我国经历了三十多年的公路大建设时期,大量的桥梁数据以纸质文档的形式保存,这些数据需要电子化处理后进入桥梁管理系统,在没有好的技术解决方案支撑下,实现数据电子化管理需要大量的人工输入工作,且由于过多的人工参与,导致数据质量欠佳,数据遗漏、错误的情况较为严重,很大程度上制约了桥梁信息化管养发挥更大的作用。OCR全称为Optical Character Recognition,即光学字符识别,可将图片中的文本进行自动识别转换为电子化信息。将纸质桥梁信息通过扫描或拍照的方式转换为图片格式文件,再通过OCR技术对图像中的文本进行自动识别和提取,从而完成桥梁数据的高效电子化处理。1技术原理及场景特征分析1.1 OCR技术原理和发展历程OCR技术是指用电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模...  (本文共3页) 阅读全文>>