海量人员信息扫描采集系统

海量人员信息扫描采集系统

1.1 概述

《海量人员信息扫描采集系统》由“海量粘贴卡打印系统”、“海量图文分割系统”和“海量信息录入系统”3个子系统组成。是专业的人像报表快速录入系统,适合任何表格类型。系统采用先进的人脸检测技术、二维条码技术、模版定位技术、OCR识别技术等,自动根据用户定义模版快速分割、提取人像照片及文字信息单元格、识别二代证复印件和填涂信息,并提供屏幕对照方式文字输入界面。系统极大提高录入速度和录入正确性,而且便于后期纠错,可广泛适用于需要大批量采集人员照片信息和文字信息的场合。

1.2系统流程

1)根据需要采集的人员信息,可进入[系统工具][配置信息]中选择合适的人员信息采集表(也可以在用户自己的管理系统中打印人员信息采集表),然后在备注中输入需要显示在粘贴卡上的信息

2)将采集表发放到各部门,完成照片粘贴、信息更正后将回收的采集表通过扫描仪整版批量扫描到电脑中 (建议扫描分辨率300-600dpi)

3)在“海量图文分割系统”中打开扫描的图片,第一次处理该类图片时请先定义模版文件,然后通过[提取图片]实现自动分割、自动命名、自动头像提取、自动背景替换。如表格上有二代证复印件和选择项填涂信息,也可以根据用户需要进行识别处理。

    4)对自动提取的头像,仔细校验修改完毕后,进入“海量信息录入系统”,打开对应的数据文件,设定合适的文字信息单元框图片存放路径,就可以在屏幕上显示文字信息单元框,对照录入和勘误人员信息即可。也可以在“海量图文分割系统”的[系统工具][结果导出]中导出[全部信息]到其他文件夹或其他电脑上再使用“海量信息录入系统”。

  1.3系统原理

1)图片分割:从扫描的整幅图片中分割出各单元图片;

2)头像提取:采用人工智能和模式识别技术实现人脸检测,提取头像有效部分;

3)自动表头定位:根据设置的报表表头自动在每张图片中查找匹配,并根据找到的表头为参照确定其他信息在图片中的位置。

1.4系统特色

1)能自动分割表格上的照片框、二代证框、条码框等区域,并通过人脸检测技术来提取头像信息,保证处理后的照片统一、规范,便于直接使用。

2)具有DataMatrixPDF417等二维码软件解码和编号信息自动识别功能,能根据识别的二维码或编号信息来命名提取的照片、原始图片、单元图片和二代证图片。其他还要求提供按原图扩展命名、自动命名等命名方式。

3)具有批量优化功能,对照片能自动替换背景、自动对比度调节、自动生成透明背景图片。

4)提供定位标记精确定位功能,可自动找到表格图片的定位孔位置,实现版面自动倾斜校正和分割。降低对扫描和打印操作的要求。

5)能自动识别表格上的填涂信息并保存到数据库中。支持单选项和多选项的识别。

6)具有文字OCR识别功能,能根据需要识别二代证复印件文字信息并自动入库。

7)软件具有表格批量处理功能,能自动、快速批量处理同一文件夹下的所有采集表,对处理成功和不成功的图片能自动分类。

8)软件具有数码照片批量处理功能,能快速高效地批量处理文件夹下的所有数码照片,根据设置的参数实现自动头像提取,同时能自动删除非人脸照片、黑白照片、小尺寸照片。

9)具有良好的扩展性,软件根据不同的采集表设置相应的分割模版后,能处理不同的类型的表格。

10)软件提供屏幕对照的信息勘误和数据录入功能,能自动判断并筛选出误识别的填涂标记。提高输入效率,也便于后期查错纠错而不需找原始纸质材料。

11)数据和照片导出时要具有批量名称替换功能。

12)导出结果包括重新命名的原始图片、裁切命名后的照片、二代证图片、单元图片和TXT格式的填涂数据等。

1.5技术参数

1)表格自动处理速度: ≥1000/小时

2)头像提取准确率: ≥99%以上

3)自动命名准确率: ≥99%以上

4)定位标记判断准确率: ≥99%以上

5)填涂标记判断准确率: ≥99%以上

6)二代证复印件识别准确率: ≥90%以上

7)背景替换准确率: 90%左右