i.系统概述
怡鲁档案数字化质量与流程管控系统网络版,是基于档案数字化扫描加工处理流程,按照扫描、数据质检、目录著录、对应检查、数据验收进行任务分工,以提高档案扫描、图像质检、目录著录、对应检查、数据验收工作效率为目的,科学量化数字化处理各环节工作进展,统一调配人员分工,实现档案扫描快速高效、图像处理检查准确高效、数据处理远程同步协作、数据集中存储安全可靠。考虑任务驱动的方法,每个扫描任务从受理到完成是一个完整生命周期,创建后有档号、页数等属性,当存在多个同类处理岗位时,任务可根据优先级自主分配处理岗位。另外处理流水线工作量是否均衡,如扫描员基本不用费脑,有的扫描设备可以秒扫,为平衡工作量,任务的扫描部分完成后可选择扫描员兼任检查员。
系统基于SQLserver2008R2数据库,采用FTP网络传输协议,将档案扫描图像数据批量传输至服务器。图像质检员,按照数据上传顺序依次下载图像进行质量检查处理,发现错误数据可打回重新处理。目录著录员,主要完成档案目录信息的修改、查询以及打回重扫。对应检查员,主要完成档案目录信息的检查、查询、对著录错误的档号进行修改以及打回重扫等功能。目录抽检员,能够根据档号查询调阅对应的目录信息、扫描图像信息以及流程各环节的相关处理人员信息。管理员实现人员管理、数据管理、工作量查询统计等系统综合管理控制功能。
本软件是通过普通或高速扫描仪将各种纸质文档、资料扫描录入计算机,经过图像处理、压缩、优化并存储为电子影像文件的工具软件;是单位、企业资料管理部门进行文档电子化,将传统纸质文档管理改为先进、统一、高效的电子化文档管理的绝佳好帮手,可以广泛应用在图书馆、档案馆、出版社、政府机关、银行、工商、税务、保险、医院等机构、各种企事业档案部门及档案数字化扫描加工企业。
ii.系统环境需求
系统可以安装在WinXP、Win2003、Win7等操作系统,软件在使用前,使用WinXP系统需要安装dotNetRT_WithFix_AIO_X86_XP.exe、vc2010sp1redist_x86.exe,其它操作系统需要安装Microsoft .NET Framework 4.0。安装SQLserver2008R2数据库,解压缩《安装与数据库》中的dataset.rar,附加数据库ILUDOC。配置FTP服务器,物理路径指向《安装与数据库》中的FTProot(也可将该文件夹拷贝到其他硬盘),系统运行登录管理员:admin,默认密码:1。
•基于x86的个人电脑,推荐PIII以上CPU;
•Windows 2000、Windows XP、Windows Vista、Windows 7;
•推荐256MB以上内存;
•多于50MB的硬盘空间,加20MB额外临时空间用于安装;
•与Windows兼容的输入设备(鼠标);
•支持16位真彩色、1024*768分辨率的显卡及显示器;
•支持TWAIN 协议绝大部分品牌扫描仪;
iii.系统登录
系统登录包括管理员和操作员登录,管理员能够增加、删除、修改人员名称、密码、角色,一个人员可以被赋予多种角色,登录后可以取得对应的操作权限。操作员登录后直接进入操作界面。在系统成功登录之前,要确保数据库连接正常和FTP连接正常,可以通过“数据库连接”和“FTP连接”进行测试。
对于多角色用户,系统登录后,可以通过业务处理进行角色操作切换。
iv.系统管理
系统管理员名称为admin,默认密码为1,角色为管理员。其主要是根据工作任务的需要,进行人员管理、数据管理、系统配置、工作量查询统计等系统综合管理控制操作。
(一)基本管理
基本管理包括修改管理员密码、用户管理、PDF转换、使用说明等操作功能。
1、修改管理员密码
2、用户管理
管理维护扫描员、质检员、目录著录员、对应检查员和目录抽检员,能够增加、删除、修改人员名称、密码、门类、角色,一个人员可以被赋予多种角色,登录后可以取得对应的操作权限。
角色设定时,如果角色是目录著录员、对应检查员、目录抽检员,则给其指定单个操作门类。该人员操作门类可修改。给著录员指定需要操作的单个门类,完成该门类操作后,由管理员更改为其它门类,再继续操作。著录员、著录员检查有未提交的案卷时,管理员不能给其修改设置新门类。修改门类前,先进行目录著录设置,人员操作门类是基于档号分类表的。
3、工作量查询统计
能够按时间统计扫描员、质检员、目录著录员、对应检查员完成的数量,统计扫描员扫描错误数量,并计算出错误率,并把统计结果保存到Excel文件中。能够查询全部文档处理进度,获取某卷或某些文档处理进度。总工作量统计时,能够按扫描、图像质检、目录著录、对应检查数量,以柱状图的方式进行显示,辅助项目管理人员进行调配人员。操作员为多角色时,按角色统计工作量。
4、双层PDF转换
能够将选定的图像文件,批量转换成PDF文件,辅助操作员进行数据转换和数据导入。
5、使用说明
同其他用户登录后一样,能够方便调出使用说明文件,为操作员提供帮助支持。
(二)系统维护
1、数据管理
数据管理包括数据查询、数据修改、数据还原、数据删除、一致性检查、错误档号导出、进度控制等功能。系统能够根据任务需要改变图像文档处理流程,选择性使整个项目文档越过图像质检、目录著录环节,直接进入对应检查环节。
(1)数据查询
数据查询模块,能够根据档号查询出该档号对应的扫描员、扫描提交时间、质检员、质检提交时间、目录著录员、目录著录提交时间、对应检查员、对应检查提交时间、档号错误信息等内容,方便项目负责人全面掌握该档号的详细信息。
(2)数据修改
数据修改模块,能够将原始档号修改为新档号,将数据库中该档号数据全部修改,并修改服务器“扫描文件”、“图像处理文件”文件夹内,图像对应的档号名称。
(3)数据还原
数据还原模块,是将该档号数据处理状态恢复到扫描提交后状态,并删除服务器“图像处理文件”文件夹内,该档号对应的图像数据。
(4)数据删除
扫描档号删除,是将数据库中该档号数据全部删除,并删除服务器“扫描文件”、“图像处理文件”文件夹内,该档号对应的图像数据。档案目录删除,是将档案系统数据库中,该门类对应表中的记录删除。
(5)一致性检查
扫描文件一致性检查,是将数据库中档号包含的图像名称和FTP“扫描文件”中的图像名称进行对应检查。图像处理文件一致性检查,是将数据库中已完成图像处理的档号包含的图像名称,和FTP“图像处理文件”中的图像名称进行对应检查。
(6)错误档号导出
错误档号导出,是根据条件查询限制条件,包括操作员、起始档号、档号包含、全部档号、部分重扫、整卷重扫等,将在这些限制条件内的错误档号,以Excel格式进行生成,辅助项目管理人员掌控档案扫描存在的问题。
(7)进度控制
进度控制模块,是按照项目进展总体要求,在扫描、图像质检、目录著录、对应检查依次进行的四个环节,可以人为控制项目进度,直接选择跳过图像质检,或者跳过目录著录。跳过图像质检,则意味着项目流程为扫描-目录著录-对应检查;跳过目录著录,则意味着项目流程为扫描-图像质检-对应检查;同时,也可以同时勾选跳过图像质检和跳过目录著录,则意味着项目流程为扫描-对应检查。这种处理方式能够极大地提高项目效率,灵活应对项目具体要求。
2、目录著录设置
在档案管理系统数据库中,不同门类的档案目录信息存储在不同的库表中,该模块的主要功能是为了使完成扫描提交后的档号找到对应的存储库表,以服务于后续的目录著录和对应检查流程。
如果档号存在包含门类字符的规律,则直接存进相关库表中。如果包含字符相同,肯定属于同一门类;如果该门类没有包含字符,则设定起止档号,进行判断。一个门类可存在多种包含字符。数据录入控制:有包含字符的没有起止档号;有起止档号的没有包含字符。任意包含字符、起止档号均不能重复。
库表名称作为主键。门类名称通过查询table_description获取,格式:库表(库表名称)。包含字符格式以“;”隔开。起止档号:格式(起档号,终档号;)。包含字符,最后一位要是“-”。待修改库表字段格式:字段(字段名),字段(字段名)。
起止档号必须包含“-”,如 A111-2015-Y-DW-001到A111-2015-Y-DW-200,起止档号最后一个“-”前的字符串要一致,起档号必须大于止档号。
备注:库表字段必须有recid(唯一关键字)、archive_no(档号)、maintitle(题名)、页数(quantity),目录著录设置的时候不需要维护,全部为默认已经添加。不同门类不能设置相同的包含字符和起止档号。
v.扫描图处
扫描图处员登录后进入扫描界面,该模块具有档案扫描、图像处理、网络提交、部分重扫和整卷重扫等功能。档案扫描支持自动扫描、重扫、插扫、高扫等操作,扫描后可自动倾斜校正、移除底色、清晰处理。系统显示支持单屏、双屏、四屏和六屏显示,并支持在多屏状态下进行处理操作。网络提交支持多个档号文件批量上传提交,传输完成后提示提交结果。操作员登录后,同样具备密码修改、工作量查询统计等功能。
1、文档扫描
在进行文档扫描之前,需要先安装扫描驱动程序,并选择安装好的扫描驱动。点击“选择扫描仪”,弹出界面。
扫描快捷键是Ctrl键,扫描后文件保存格式可以选择jpg、bmp、tif、png等格式。自动扫描时间间隔单位是秒,设置后按照时间间隔自动扫描。扫描保存位数,是指扫描后保存文件名称的位数,比如设置为3,则自动保存后为001.jpg,001为3位数字。起始编号不设置,则保存时以001开始,如果设置了则以设置编号为起始名称。对档案文件进行集中扫描保存,自动缓存在程序所在目录temp\saomiaofiles。
重扫是在点击“部分重扫”后,由图像处理员打回的某档号内图像,可以重新进行扫描,扫描名称为选择的打回图像名称。插扫,是在选择图像后面插入新扫描的图像。如,选择图像003.jpg,点击“插扫”, 后面图像依次改名,003.jpg改为004. jpg,依次类推,扫描图像保存为选择图像003.jpg。高扫,是针对具备批量高速扫描设备,能够将放入的多页文件进行批量自动扫描。
扫描一份新的文档,需要以下步骤:
(1) 打开扫描仪,并确认是否和计算机正常连接;
(2)将纸质文档放入扫描仪(关于扫描仪的操作请参考扫描仪用户说明书);
(3)如果计算机安装有多台扫描设备,请先选择当前使用的扫描仪设备;
(4)设置文档图像存储的各个选项参数;
(5)在操作栏扫描标签中设置各项扫描参数、设置扫描预处理选项及设置预处理的图像处理选项;
(6)选择“文件”菜单的“新建扫描”子菜单或“扫描”菜单的“扫描新文档”子菜单,在弹出的窗口界面设置文件类型、命名规则、存储路径、图像压缩设置参数。
(7)文件类型:支持单页TIF文件格式,JPG文件格式,BMP文件格式,多页TIF文件格式。命名规则:TIF格式支持多页存储模式及单页存储模式,JPG和BMP只能支持单页存储模式;注:多页存储指一份文档存储为一个图像文件,该文档可能有几页或几十页、几百页,单页存储指的是一份文档有多少页就有多少个图像文件,也就是一页文档一个图像文件。文件名、存储路径:输入文件名及选择图像存储目录。图像压缩设置:黑白图像支持CCITT Group 3 、CCITT Group 4、LZW等压缩算法;彩色图像支持JPEG、LZW、无压缩等压缩算法。
(8)扫描仪开始扫描文档,系统弹出扫描进度窗口,要取消扫描,请点击“取消”按钮;文档扫描过程中图像会逐一显示在软件的界面中,文档图像将自动保存在计算机磁盘选定的目录中。
2、扫描数据提交
扫描数据提交,包括本地提交和网络提交。点击“导入”,可将存储在本地计算机上的图像文件,导入到程序所在目录temp\saomiaofiles。本地提交,是将扫描后存储在程序所在目录temp\saomiaofiles内的文件,保存到计算机其它位置,另存成功后把档号0118-2005-Y-026自动加1保存,下次参考档号自动调取。能够判断哪些档号文件夹已经上传,哪些未上传,已经上传的不可重复提交。
扫描数据上传成功后,程序所在目录temp\saomiaofiles内文件夹清空。网络提交后把档号0118-2005-Y-026自动加1保存,下次参考档号自动调取。能够判断哪些档号文件夹已经上传,哪些未上传,已经上传的不可重复提交。指定本地文件夹路径,将该文件夹下多个档号文件全部网络提交。对重新扫描文件提交,判断该卷文档处理状态:图像处理员打回、质量检查员打回,分别进行提交。
网络提交,是将程序所在目录temp\saomiaofiles的扫描图像文件,提交传输至服务器。网络提交是实现整卷文档提交,对重新扫描文件提交。完成一卷文档扫描、初次质量检查后,将数据文件提交到服务器,保存在服务器硬盘“扫描文件”中,同时,数据库中保存提交记录,提交记录表内容包括:档号、文件名。文件唯一标识是指档号+文件名,如:0118-2005-Y\001.jpg。
网络批量提交,是将保存在计算机本地的图像文件,批量提交传输至服务器。网络批量提交过程中,根据档号进行检查该档号是否包含“-”、该档号文件夹内是否为空、判断该档号所属门类,最后将不符合条件的档号通过TXT文件显示出来。
3、部分重扫和整卷重扫
“新卷扫描”,是为扫描新卷做准备,清空软件界面文档列表,清空本地程序temp\saomiaofiles内的图像文件。
“部分重扫”,是接收图像质检员反馈的错误文件信息,并重新扫描后上传到服务器,并通知图像质检员。按照文件标识,找到首次扫描的文件,在界面左侧显示,界面右侧显示重新扫描的文件,将该卷错误文件全部重新扫描,并初次质量检查后,将数据文件提交到服务器,覆盖文件档号路径下的文件,并发送给图像质检员提示信息。提交文件时,提交记录表内容追加:图像处理扫描员重扫时间。按钮旁边以红色数字形式,动态显示需要重新扫描档号数量,以提示扫描员。
“整卷重扫”,是接收图像质检员、目录著录员、对应检查员和目录抽检员,整卷打回重扫的档号。数据下载完成后,将删除服务器该档号对应的扫描文件、图像处理文件夹内的图像数据。
【扫描文件】:原始扫描文件。
【图像处理文件】:图像质检员纠正后保存的文件、扫描员重新扫描上传的文件,图像质检员纠正处理后保存的文件,以及需要扫描员重新扫描上传的文件。
4、图像质量初次检查
扫描员能够对扫描文件进行初次质量检查,发现问题可以进行处理,本功能是扫描员根据个人实际情况可选的功能,不是必须完成的功能。
5、重新排序
需要先确定类型和位数,可以将图像排序后保存为选定的类型和位数。方便使用打回重扫功能,删除中间某张图片后,全部图片重新进行排序。
vi. 图像质检
图像质检员,能够将扫描员上传的图像文件进行处理,使之符合档案扫描加工处理的要求。通过获取新卷,获得扫描员上传的图像文件,获取顺序是扫描员上传的时间先后顺序,将图像文件下载到本地后,进行各种图像处理,处理完成后将处理完的图像上传至服务器。
1、图像获取及下载
图像质检员“获取新卷”,只获取所属门类的数据。质检员下载文件、修改文件存放在程序所在目录temp\tuxiangfiles。“导入”,可把存储在其他位置的图像,导入程序所在目录temp\tuxiangfiles。“本地提交”,可把程序所在目录temp\tuxiangfiles图像,另存在其他位置,另存成功后把档号0118-2005-Y-026自动加1保存,下次参考档号自动调取。能够判断哪些档号文件夹已经上传,哪些未上传,已经上传的不可重复提交。获取新卷图像,是对扫描员提交的图像,随机自动获取待处理的档号,获取后(提交记录表2)内容追加:图像质检员,下载文件到程序所在目录temp\tuxiangfiles,图像质检员不知道该文档扫描员。process_download_time1(取数据库服务器时间),自动提示有XX个档号图像未处理。
2、扫描员反馈图像
对反馈给扫描员需要扫描员重新扫描的文件,扫描员提交错误更正文件后,图像质检员自动下载错误更正文件,下载文件到程序所在目录temp\ tuxiangfiles,对错误更正文件进行检查。检查过程中可对文件进行修改操作,检查完成后,再次进行网络提交。说明:此时发现错误文档需要扫描员重扫,打回错误文档只有一次机会。自动提示有XX个档号图像未处理。
3、图像处理及标记功能
将该档号文件下载到本地进行处理,如果文件检查出错误,需要扫描员重新扫描,按回车键进行标记,此信息存储在process_error1(图像处理错误表1)里,内容包括:文件唯一标识,档号+文件名。每一页图像必须处理,存在一页不处理就无法提交。并可一屏显示多页。点击浏览图像后,目录中该文档文件名改为蓝色;按回车键标记错误图像后,目录中该文档文件名改为红色。
4、网络提交
(1)实现整卷文档图像处理完成后进行提交
完成一卷文档处理后,将数据文件提交到服务器,保存在服务器硬盘“图像处理文件”中,文件唯一标识是指档号+文件名,如:0118-2005-Y\001.jpg。上传成功后,程序所在目录temp\tuxiangfiles内文件夹清空。能够判断哪些档号文件夹已经上传,哪些未上传,已经上传的不可重复提交。
(2)对需要扫描员重新扫描的文件进行反馈
如果该文档登记错误记录,需要扫描员重新扫描,在网络提交时提醒图像质检员,是否通知扫描员,如果选择“是”,在submit_record2(提交记录表2)修改图像处理反馈时间process_fankui_time;如果选择“否”,直接修改提交时间,完成提交。
(3)对反馈给扫描员需要扫描员重新扫描的文件,扫描员提交错误更正文件后,图像质检员再次处理完成后,进行网络提交,将数据文件提交到服务器,覆盖文件档号路径下的文件,修改提交时间,完成提交。
(4)质检员提交时,向档案系统数据库批量添加该档号对应的页数。档案库已有目录,则不添加档号只修改页数。
5、图像处理
本软件提供了丰富的图像处理功能,图像处理操作包括倾斜校正、左倾、右倾、图像裁剪、左转、右转、图像清晰处理、移除底色、图像手动去污、图像另存、开始批量处理、180度旋转、放大、缩小、原始大小、合适显示、拾色、拾图、开始幻灯方式检查等操作。
vii.识别著录
目录信息著录,主要是根据扫描图像信息,录入档案信息系统数据库档号对应的题名、文件编号、密级等目录信息,实现档案目录信息的修改、查询以及打回重扫。录入方式支持手工修改、OCR识别录入,通过拉框选择图像区域,将识别内容自动录入到题名位置,极大提高了档案目录著录的工作效率。
1、图像获取及下载
目录著录员“获取新卷”,只列出有扫描件、有目录档号无题名所属门类的数据。获取的档号应该是同一门类的,数据按档号进行排序。左侧目录信息区域,点击或者按“ENTER”键,可以实现更换档号目录,此时右侧显示档号目录对应的图像信息。更换档号目录后,档号对应列底色由白色改为淡蓝色,如果此时未进行网络提交,下次点击“获取新卷”,则将上次未提交的目录先显示出来,直到操作员完成该档号目录著录提交,才能获取其它新卷。
目录著录员下载的图像文件存放在程序所在目录temp\duiyingfiles,网络提交后删除该文件夹内的全部图像文件。在第二次之后点击该目录时,系统判断已经下载该档号图像,则不再重复下载,也不会自动返回首页。
2、网络提交
网络提交,是指在获取新卷目录的题名信息全部著录完成后,将目录信息存储到档案系统数据库。网络提交,题名不能为空,档号不能修改,程序只控制档号和题名不能为空,其它不控制。系统会自动检查是否存在有题名为空的情况,如果存在某条目录题名为空。
系统不具备新增档案目录功能,如果必须添加档案目录,可通过EXCEL数据导入或者档案软件著录,导入EXCEL数据应该在图像质检之前。
3、打回重扫
如果存在扫描图像重复扫描、多扫、漏扫等情况,则需要将扫描图像打回给该图像的扫描员,扫描员整卷重扫提交后再次进入处理流程。打回重扫时,需要先将档号加入打回重扫,点击网络提交后,一并将打回重扫档号信息存入数据库。在“加入打回重扫”按钮下方档号列表,点击右键可以删除或者清空打回重扫档号。打回重扫,不删除档案系统数据库目录信息,如果已经完成目录题名著录,则通过管理员删除该目录信息,重新进入流程。
4、目录检查和扫描检查
该模块功能主要是对档案系统数据库中的目录信息和扫描图像进行检查,查找出缺少的档号目录和扫描图像。目录检查,是检查已扫描没目录的档号;扫描检查,是检查有目录未扫描的档号。检查结果通过TXT文件进行显示,方便用户进一步进行查缺补漏。
5、OCR识别
在进行OCR识别之前需要先点击“OCR识别”按钮,该按钮由红色变为绿色后方可进行识别,不需要进行OCR识别时,为提高计算机速度需要再次点击该按钮,该按钮由绿色变为红色,可关闭后台开启的OCR识别服务。
OCR识别技术,可将光学字符识别(OCR)和智能字符识别(ICR)技术合并到应用程序中,并且包含用于开发稳健的、高性能的和可扩展的图像识别方案所需要的技术。
6、其它辅助操作
“批量添加首行字段”,是根据选中第一行某列单元格内容,批量重复添加到该列其它行,时间和档号字段不可修改。“Enter”键可向下检查目录,右键双击可将上一单元格内容复制到本单元格。锁定第4列页数,该列禁止修改、OCR识别、批量添加首行。增加“显示目录”复选框,能够查看该档号对应的末尾为000或0000文件夹图片,能够辅助操作员进行目录著录。
“查询剩余新卷”,能够查询该门类剩余的未进行目录著录的档号数量,获取新卷时如果未进行目录著录的档号数量为零时也进行提示。
viii.对应检查
通过对应检查功能模块,按照选择的档号分别下载图像数据,在浏览图像的基础上同步著录修改对应信息,实现嵌入式看图著录和对应检查功能。档案信息著录支持Excel格式数据录入,通过档案管理系统数据导入模块,将录入信息批量导入数据库,对应检查功能模块实现档案图像内容与录入信息的校对,同时如果录入信息有遗漏,系统支持重新修改录入信息。
对应检查功能模块具有对档案信息的检查、浏览、修改等功能,操作人员可按照逐条切换档案信息的方式进行档案对应检查,选中档案信息后自动查找对应的图像信息,并下载图像进行显示,如果没查到图像信息则图像区域不显示。为了方便掌握全部档案著录和对应图像扫描情况,对应检查模块能够检查全部档案已经扫描未著录信息的情况,同时也可以检查全部档案已经著录信息未扫描图像的情况,确保全部档案信息著录不存在遗漏。
系统嵌入式看图著录功能,采用操作员登录-图像批量提交-图像对应检查-档案信息著录的科学化操作管理流程,支持多人同步上线看图著录,图像与档案信息对应检索显示,有效提高了看图著录工作效率和准确率。针对按档号传输至服务器的图像,根据图像与档号信息的一一对应检查,通过浏览图像实现更改档号、文件编号、题名、页数等档案信息,对档案信息进行准确维护修改,实现通过对应检查方式进行看图著录的功能。
1、图像获取及下载
对应检查员“获取新卷”,只列出所属门类的题名不为空的数据。获取的档号应该是同一门类的,数据按档号进行排序。左侧目录信息区域,点击或者按“ENTER”键,可以实现更换档号目录,此时右侧显示档号目录对应的图像信息。更换档号目录后,档号对应列底色由白色改为淡蓝色,如果此时未进行网络提交,下次点击“获取新卷”,则将上次未提交的目录先显示出来,直到操作员完成该档号对应检查提交,才能获取其它新卷。
对应检查员下载的图像文件存放在程序所在目录temp\duiyingfiles,网络提交后删除该文件夹内的全部图像文件。在第二次之后点击该目录时,系统判断已经下载该档号图像,则不再重复下载,也不会自动返回首页。
2、网络提交
网络提交,是指在获取新卷目录全部检查完成后,将目录信息存储到档案系统数据库。网络提交,题名不能为空,档号不能修改,程序只控制档号和题名不能为空,其它不控制。系统会自动检查是否存在有题名为空的情况,如果存在某条目录题名为空。
系统不具备新增档案目录功能,如果必须添加档案目录,可通过EXCEL数据导入或者档案软件著录,导入EXCEL数据应该在图像质检之前。
3、打回重扫
如果存在扫描图像重复扫描、多扫、漏扫等情况,则需要将扫描图像打回给该图像的扫描员,扫描员整卷重扫提交后再次进入处理流程。打回重扫时,需要先将档号加入打回重扫,点击网络提交后,一并将打回重扫档号信息存入数据库。在“加入打回重扫”按钮下方档号列表,点击右键可以删除或者清空打回重扫档号。打回重扫,不删除档案系统数据库目录信息,如果已经完成目录题名著录,则通过管理员删除该目录信息,重新进入流程。
4、目录检查和扫描检查
该模块功能主要是对档案系统数据库中的目录信息和扫描图像进行检查,查找出缺少的档号目录和扫描图像。目录检查,是检查已扫描没目录的档号;扫描检查,是检查有目录未扫描的档号。检查结果通过TXT文件进行显示,方便用户进一步进行查缺补漏。
5、OCR识别
在进行OCR识别之前需要先点击“OCR识别”按钮,该按钮由红色变为绿色后方可进行识别,不需要进行OCR识别时,为提高计算机速度需要再次点击该按钮,该按钮由绿色变为红色,可关闭后台开启的OCR识别服务。
6、其它辅助操作
“批量添加首行字段”,是根据选中第一行某列单元格内容,批量重复添加到该列其它行,时间和档号字段不可修改。“Enter”键可向下检查目录,右键双击可将上一单元格内容复制到本单元格。锁定第4列页数,该列禁止修改、OCR识别、批量添加首行。增加“显示目录”复选框,能够查看该档号对应的末尾为000或0000文件夹图片,能够辅助操作员进行目录著录。
“查询剩余新卷”,能够查询该门类剩余的未进行目录著录的档号数量,获取新卷时如果未进行目录著录的档号数量为零时也进行提示。
ix.数据验收
数据验收功能,主要用于项目组负责人对完成的档案目录著录、图像扫描情况进行抽检,可以抽检该门类任意档号,能够获取该档号的具体操作人员信息,包括扫描员、质检员、目录著录员、对应检查员。同时,对检查出的档案目录错误信息也可以进行修改提交。目录抽检功能模块有效提高了档案目录著录、图像扫描情况检查的效率,并能够一目了然地掌握目录完成相关人员信息。
1、图像获取及下载
如果界面右侧档号输入框为空,点击上方“获取新卷”,则按照所属门类档号排序获取Rowsnum条数据(Rowsnum为config.ini字段)。如果输入档号,则以此档号为起始向下查询获取Rowsnum条数据。左侧目录信息区域,点击或者按“ENTER”键,可以实现更换档号目录,此时右侧显示档号目录对应的图像信息。目录抽检员下载的图像文件存放在程序所在目录temp\duiyingfiles,网络提交后删除该文件夹内的全部图像文件。在第二次之后点击该目录时,系统判断已经下载该档号图像,则不再重复下载,也不会自动返回首页。
2、网络提交
网络提交,是指在获取新卷目录后,将目录信息存储到档案系统数据库。网络提交,题名不能为空,档号不能修改,程序只控制档号和题名不能为空,其它不控制。目录抽检员不进行工作量统计。
3、打回重扫
如果存在扫描图像重复扫描、多扫、漏扫等情况,则需要将扫描图像打回给该图像的扫描员,扫描员整卷重扫提交后再次进入处理流程。打回重扫时,需要先将档号加入打回重扫,点击网络提交后,一并将打回重扫档号信息存入数据库。在“加入打回重扫”按钮下方档号列表,点击右键可以删除或者清空打回重扫档号。打回重扫,不删除档案系统数据库目录信息,如果已经完成目录题名著录,则通过管理员删除该目录信息,重新进入流程。
4、目录检查和扫描检查
该模块功能主要是对档案系统数据库中的目录信息和扫描图像进行检查,查找出缺少的档号目录和扫描图像。目录检查,是检查已扫描没目录的档号;扫描检查,是检查有目录未扫描的档号。检查结果通过TXT文件进行显示,方便用户进一步进行查缺补漏。
5、OCR识别
在进行OCR识别之前需要先点击“OCR识别”按钮,该按钮由红色变为绿色后方可进行识别,不需要进行OCR识别时,为提高计算机速度需要再次点击该按钮,该按钮由绿色变为红色,可关闭后台开启的OCR识别服务。
6、目录信息查询修改
在界面右侧查询框内,输入正确的档号,点击“查询档号”按钮,在界面左侧录入栏显示查询结果。选中档号,图像栏显示对应图像。依据图像内容修改档案信息。点击“网络提交”,保存修改的信息。
7、其它辅助操作
“批量添加首行字段”,是根据选中第一行某列单元格内容,批量重复添加到该列其它行,时间和档号字段不可修改。“Enter”键可向下检查目录,右键双击可将上一单元格内容复制到本单元格。锁定第4列页数,该列禁止修改、OCR识别、批量添加首行。增加“显示目录”复选框,能够查看该档号对应的末尾为000或0000文件夹图片,能够辅助操作员进行目录著录。 百度大脑是百度技术多年积累和业务实践的集大成,包括视觉、语音、自然语言处理、知识图谱、深度学习等 AI 核心技术和 AI 开放平台。百度大脑为百度所有业务提供AI能力和底层支撑,并赋能产业和开发者。截止2019年7月,百度大脑已经开放了210项领先的AI技术能力,开发者数量达到130万,平台上开发者的日均调用次数同比增长108%,定制化平台模型的数量也在飞速增长。来自不同行业,拥有不同背景的开发者们,都在借助百度大脑快速地获得AI能力。