OCR字符识别技术发展史

OCR(,光学字符识别),是计算机视觉领域的重要研究内容之一opencv 加载分类器失败 , 在实际生产环境中具有巨大价值 。
传统的光学字符识别技术是一个经典的模式识别问题 , 包括对图片的预处理、特征提取、利用分类器分类等几个步骤,已经形成了较为完善的技术体系 。
【OCR字符识别技术发展史】OCR技术流程
OCR技术发展历史:
1929年德国人 取得了光学字符识别的专利,之后各国逐渐开始针对OCR技术进行研究 。早期的研究内容主要是针对识别方法的理论研究opencv 加载分类器失败,后来开始针对简单的0~9数字进行识别 。直到1966年IBM公司的 Casey和Nagy才开始了针对汉字等复杂字符的识别进行研究,并且使用模板匹配的方法识别了1000个印刷体汉字 。20世纪70年代初日本的学者也开始了汉字识别的研究 , 其中有代表性的成果有1977年东芝综合研究所研制的可以识别2000个单体印刷汉字的OCR识别系统 。
中国在OCR技术方面的研究工作起步较晚 , 直到70年代才逐渐开展了对于光学字符识别的研究 。我国在1986年提出“863”高新科技研究计划,“863”计划的信息领域课题组织了清华大学、北京信息工程学院、沈阳自动化所三家科研单位展开中文OCR的研发工作,将中国的汉字识别的研究进入一个实质性的阶段,并由清华大学率先推出了国内最早的OCR产品 。早期的OCR技术研究是基于模式识别的基础上进行的 , 模式识别的每一个模块都需要很好的设计,才能使整个系统达到较好的识别效果 。
随着近年深度学习的不断发展,基于卷积神经网络的OCR技术打破了传统OCR技术的框架,在识别效率以及准确率上都有了质的飞跃 。国际文档分析与识别大会(and ,ICDAR)于2003年大会设立“”,该竞赛主要评测和检验自然场景、网络图片、复杂视频文本自动提取与智能识别最新技术的性能,并设立了丰厚的奖金 。该竞赛极大地促进了OCR技术的发展,目前已经成为OCR技术研究进展重要的国际赛事及标准 。由于竞赛强大,实际应用性、高技术难度、诸多科研院校、科技公司都参与其中,目前已有89个国家的3500多支队伍参与 。
OCR技术的发展前景一片繁荣 。
本文到此结束,希望对大家有所帮助 。