充著录。环节五:OCR识别。OCR识别后的双层PDF因同时兼顾视觉效果和检索便捷性,极大地方便了电子文件的管理。现阶段主要通过AdobeAcrobatXIPro软件进行识别,识别采取批量识别和单个识别结合的方法,I~il:ttl;量识别遇到障碍后,对此文件进行单个识别,再对之后的批量识别。通过观察缩略图,可以对图纸、手写(如会议记录)等识别效率低下的档案不识别.以提高工作效率。环节六:数据质检。一是要特别注意档案数字化过程中全宗、目录、案卷等档案组成单位的完整性,不宜进行随意分割,不应因为一个全宗年代久远纸质较差不方便扫描而只抽取便于扫描的部分数字化,从而破坏档案的整体价值。二是图像质量检查,对扫描处理后的图像是否清晰、完整进行检查,遗漏的应进行补扫,不符合质量要求的图像,重新进行处理或重扫。三是应对目录数据库著录项目的完整性、著录内容的规范性进行检查,对质量不合格的目录数据进行修改或重新著录。对PDF文件的检查要注意几个等量关系,即PDF文件数量要等于目录条目数量,扫描页面数量等于编写页码数量并且等于档案目录中条目页数的累计值,如果上述等量关系不成立。则之前某一环节出错,需要倒查,修改,还可以通过观察缩略图纠错,因为一份档案首页和其他页有着明显的区别,可以大致作一判断。档案数据资源是数字档案馆建设的核心内容,科学严谨的工作流程是档案数字化加工的基础,加强管理是解决数据质量问题的重要措施,工作人员的责任心和业务素质更是保证工作质量和效率的关键,对今后档案保存、查阅、利用尤为重要。作为一名兰台人,应该肩负起工作使命,不管是自行开展档案数字化加工还是外包给企业实施,都应本着对历史负责的态度,把好档案数字化制作的每一个关El,控制好关键质量节点,从结果控制向过程控制转变,确保数据信息无错误,真正做到为历史负责,为现实服务,替未来着想。(作者单位:汉中市农业科学研究所汉中市档案局)