如何将图片文字变为可编辑文档——OCR
2020-12-01 07:40:01
当我们需要把电脑上的文档展示到纸面上时,操作非常简单,我们只需要点击下打印,就可以把文档成功印制到纸面上。但如今更多的工作需求是要将纸面上的信息传递到电脑上,其中一种方式便是拍照和扫描,可这种方式却无法帮助我们对图片上信息进行编辑处理,因此OCR技术应运而生。
Optical Character Recognition,光学字符识别技术,它是过光学仪器,如影像扫描仪、传真机或任何摄影器材,将需要处理的文档传递给计算机,再有计算机进行处理获得文字信息。
首先是图像处理,OCR软件先将图片进行分析,区分图形、表格及文字段落等部分,然后对不同内容进行不同方式来处理。其中,对于文字部分OCR软件会降噪,去除图像杂质,然后通过调整图片的灰阶、彩色,最终得到黑白两色的图片,方便计算机辨识。同时通过位置调整实现图形矫正,更清晰地展示出相关文字内容。
其次是进行文字特征处理,就是将提炼出的黑白色文字与文字库内的文字进行一一比对,找到样式最为接近的文字,确定单个文字内容。一个好的OCR软件会将一个文字区分成多个部分,并设定各部分特征,使得文字比对更加准确。
最后是数据库信息比对,这一步是将对应的字符从单个字到字段、字集上进行比对,通过语境、语义的对比,最终明确特征不明显字符。
OCR除了图像处理及数据比对技术,还应用了文字环境,人工智能等其他技术。虽然今天OCR的处理效果并不尽人意,但是随着处理能力及机器学习技术的不断发展,相信未来OCR一定可以更准确有效地处理各种文字字体。
阅读剩余内容