在日常的客服工作中,有很多用户会问我们一个相同的问题:你们的金鸣识别系统识别率能达到百分之几?能不能达到99%甚至100%?我们先来举个极端的例子:用户上传一张图片给我们程序识别,这张图片上的字是手写的,非常潦草,连肉眼都认不出是什么字,这种情况下,我们程序能识别的好吗?答案肯定是否定的:程序再利害,也利害不过人眼吧?如果连人都识别不出来,机器就甭说了!所以,这个问题的正确答案是:我们程序比市面上的识别转换软件识别率要高出许多,在使用我们程序的环境下,识别率一般与需识别的图片质量成正比。这里的“图片质量”会被很多朋友简单地理解成“文字清晰”,其实这只是其中的一个组成部分,具体而言,它主要包含以下几个部分:
一、文字清晰。要做到录入到电子设备的图片文字清晰,我们首先推荐用传统的扫描仪:一是将纸张放入传统扫描仪后,纸张会被压平整,二是扫出来的文字要比拍照的要清晰。
其次就是拍照类的扫描仪了。相比传统扫描仪,它除了不能保证纸张的平整外,清晰度虽然可能会稍差一点,但由于它是固定着的,拍出的照片就不存在因手抖动而产生的模糊了。当然,它还受环境光线的影响,最好能保证光线充足,如果光线不足,得到的图片就会偏黑甚至有明显的噪点,影响后期的识别质量。
最后就是拍照了。一般的拍照也能满足我们程序对图片质量的需要,只要拍的不是非常差,当然,拍出来的图片质量越好,识别效果就越好,识别率也越高。拍照时要注意手不要抖,一抖字就会模糊,连肉眼都看不清,别说程序了。
总之,无论采用什么录入设备,都要保证所得到的图片文字要清晰,起码要保证人眼能看清楚,如果人眼都看不清楚,程序就更加看不清楚了。
二、纸张放平整。所谓平整就是把纸张放平、保证纸张表面的整洁,不要有杂点和涂鸦以及脏东西(如汤水、果汁等)。
三、无关内容无需拍到。拍照时尽量不要拍到与识别内容无关的东西,特别是带字母、数字、汉字的东西(如键盘、叠得不整齐的纸张类文件等),尽量只拍需要识别的内容。