来源 | 数字人才实训基地
知圈 |
前言
OCR的应用范畴:
OCR对图片都做了什么:
实践上我们预期的结果是把只要包含单个文字的图片交给计算机去翻译。
机器是怎样看到纸质或者电子文档或是图片上的文字的呢?接下来看一下他的工作流程。
工作流程:
首先要去掉杂质,这样程序就能够集中留意到文字上面。
预处置:
预处置主要包括灰度化,二值化,噪声去除,倾斜矫正等。
灰度化:
灰度图是只含亮度信息,不含颜色信息的图片。
在RGB模型中,假如R=G=B时,则彩色表示一种灰度颜色,其中R=G=B的值叫灰度值。
普通满足下面这个公式:
Gray=0.299R+0.587G+0.114B 这种参数思索到了人眼的生理特性。
原图.jpg