全文预览

OCR图像预处理实现原理

上传者:业精于勤 |  格式:doc  |  页数:56 |  大小:2916KB

文档介绍
理软件是上个世纪五十年代中后期的ERA。ERA是基于窥视孔方法,识别速率为120个字符/S。从OCR技术的发展历程看,分为三个阶段。第一代的OCR产品出现在上世纪六十年代初期,NCR、FARRINGTON、IBM公司分别研制、推出了自己的OCR软件。但它只能识别印刷体的数字、英文字母及部分符号,而且为严格指定的字体。第二代OCR产品诞生于上世纪六十年代中期到七十年代初期,可以识别手写字符。日本东芝公司研制、推出的OCR产品应用于IBM公司,在手写体邮政编码识别的信函自动分拣系统中取得了正确分拣率达到92%~93%的良好应用效果,广泛地应用在了实际生活中。第三代OCR产品主要解决的问题为对于质量较差的文档以及大字符集比如数学公式的识别。日本东芝公司于1983年发布了其研制的印刷体日本汉字的OCR系统,识别速度为70~100个字符/S,取得了99.5%的识别率。经过不断地改进,针对印刷体手写日本汉字的识别达到了实际应用水平。(2)国内发展及其现状我国在OCR技术方面的研究工作起步较晚,但是发展势头强劲,在七十年代才开始对数字、英语字母及字符的识别工作进行研究,到了七十年代末期才开始进行汉字的识别研究工作。我国政府从七五计划到现在的863计划一直坚持立足于国产的OCR识别技术的研究。从八十年代中期开始,国内的中文OCR技术的研究到达了高潮阶段,到了九十年代中期,国内汉王公司推出了汉字中文的OCR系统,达到了可以初步实用化的水平。目前,我国的OCR技术应用市场十分广泛。在信息技术以及计算机技术日益普及的今天,如何将汉字方便、快捷输入到计算机中并且能够高效率地进行识别,成为了影响人机交互式操作的重要难题,也成为计算机是否能够在我国得到普及和应用。目前,OCR对英文的正确识别率较高,而对于汉字,尤其是手写汉字,识别率较低。如何提高OCR对手写汉字的识别率,将是未来的一个重要的研究方向。

收藏

分享

举报
下载此文档