员工档案数字化分类全流程实操指南 5步完成标准化体系搭建

前置准备:所需工具与物料清单

所有工具均提供免费可落地选项,无需额外付费采购:

  • 扫描工具:普通平板扫描仪/高拍仪,分辨率支持300DPI即可
  • OCR识别工具:开源PaddleOCR,官方地址:https://github.com/PaddlePaddle/PaddleOCR
  • 归档工具:100人以下团队用Windows本地文件夹+Excel即可,100人以上团队用开源Paperless-ngx档案系统,官方地址:https://github.com/paperless-ngx/paperless-ngx
  • 基础物料:存量纸质员工档案、已收集电子档案原件、全员唯一工号对照表(无工号可按入职日期+随机3位数字生成,确保唯一即可)

实操步骤:5步完成标准化分类落地

步骤1:统一分类维度与编码规则

所有档案统一采用3级分类规则,禁止自定义维度避免混乱:

  • 一级分类:在职(编码Z)、离职(编码L)、退休(编码T),禁止用部门、姓名作为一级分类,避免员工异动后档案失联
  • 二级分类:基础信息(JC,含身份证、学历证复印件等)、劳动合同(LD,含劳动合同、竞业协议、保密协议等)、薪酬福利(XC,含工资条、社保缴纳记录、公积金记录等)、绩效考评(JX,含绩效考核表、奖惩记录等)、培训经历(PX,含培训证书、上岗证明等)、异动记录(YD,含调岗、升降职记录等)、其他(QT)
  • 三级分类:档案生成年份,用4位数字表示,比如2024

统一文件命名规则:工号-二级分类编码-生成日期(8位数字)-文件序号,示例:Z1001-JC-20240315-01,所有档案必须按该规则命名后再归档。

步骤2:存量纸质档案数字化预处理

  • 扫描参数统一设置:分辨率300DPI、彩色扫描、存储格式为PDF/A(长期归档专用格式,避免版本兼容问题),扫描仪无PDF/A选项的,扫描后用免费工具转换:https://smallpdf.com/cn/pdf-to-pdfa,直接上传即可转换
  • OCR识别配置:先执行安装命令:pip install paddlepaddle paddleocr,安装完成后执行识别命令:paddleocr --image_dir 扫描件本地路径 --use_angle_cls true --lang ch,识别出的文本内容直接粘贴到对应PDF的备注字段,方便后续全文检索
  • 每扫描完成10份档案,核对工号、姓名与档案内容一致性,避免张冠李戴

步骤3:电子档案批量分类归档

100人以下团队用本地文件夹归档,先创建固定文件夹结构:

``` 员工档案库 ├─ 在职 │ ├─ 基础信息 │ ├─ 劳动合同 │ ├─ 薪酬福利 │ ├─ 绩效考评 │ ├─ 培训经历 │ ├─ 异动记录 │ └─ 其他 ├─ 离职 │ (同上二级分类结构) └─ 退休 (同上二级分类结构) ```

批量移动文件无需手动操作,复制以下代码到记事本,保存为归档.bat放到员工档案库根目录,双击运行即可自动按文件名分类:

``` @echo off :: 移动基础信息类档案 for /f "delims=" %%i in ('dir /b /a-d -JC-.pdf') do move "%%i" 在职\基础信息\ :: 移动劳动合同类档案 for /f "delims=" %%i in ('dir /b /a-d -LD-.pdf') do move "%%i" 在职\劳动合同\ :: 其他分类按上述格式替换编码和路径即可 pause ```

员工档案数字化分类全流程实操指南 5步完成标准化体系搭建

100人以上团队直接用Docker一键部署Paperless-ngx系统,执行以下命令即可:

``` docker run -d \ --name paperless \ -e PUID=1000 \ -e PGID=1000 \ -e TZ=Asia/Shanghai \ -p 8000:8000 \ -v 本地数据存储路径:/usr/src/paperless/data \ -v 本地文件存储路径:/usr/src/paperless/media \ --restart unless-stopped \ ghcr.io/paperless-ngx/paperless-ngx:latest ```

部署完成后访问http://本机IP:8000进入后台,在【设置-分类】中配置前文的3级分类规则,上传文件时系统会自动识别文件名匹配分类,无需手动操作。

步骤4:分类权限配置

按最小权限原则配置访问权限,避免档案泄露:

  • HR专员:可读写所有在职员工档案,只读离职/退休档案
  • 部门负责人:只读本部门员工基础信息、绩效档案,不可查看薪酬、劳动合同等敏感内容
  • 员工本人:只读本人所有档案,不可修改
  • 系统管理员:仅负责系统维护,不可查看任何档案内容

本地文件夹用户直接右键文件夹-【属性-安全-编辑】,添加对应用户组配置权限即可;Paperless-ngx用户在后台【用户组】中直接勾选对应分类的读写权限即可。

步骤5:分类结果校验

必须完成3项校验才能正式投入使用:

  • 命名规则校验:抽查不低于10%的档案,确认文件名完全符合统一规则,不合格的重新命名
  • 分类准确率校验:抽查不低于20%的档案,确认分类层级完全正确,准确率必须达到100%,不合格的调整分类
  • 检索校验:输入任意工号+二级分类编码,能在3秒内定位到对应档案,检索失败的重新生成文件夹索引/Paperless-ngx系统重新构建全文检索

后续维护:分类体系动态更新规则

  • 每月5号前完成上月新增员工档案的归档,严格按照分类规则上传
  • 员工发生调岗、离职、退休等异动后24小时内,调整对应档案的一级分类
  • 每年12月31日完成全库校验,清理重复文件、无效文件,如需新增二级分类,先统一更新编码规则,再全量同步调整存量档案分类

常见问题排查

  • OCR识别乱码:检查扫描分辨率是否达到300DPI,执行pip install --upgrade paddleocr升级到最新版本即可解决
  • 本地文件夹权限配置后用户无法访问:检查文件夹路径是否包含中文,取消文件夹的“只读”属性后重新配置权限
  • Paperless-ngx无法访问:检查宿主机8000端口是否开放,确认命令中的PUID/PGID和宿主机登录用户的ID一致,执行id 用户名即可查看对应ID
AI咨询
热线电话

028-85154420

15388110056

全国售前咨询电话

扫码咨询
安答联动微信公众号二维码

微信扫码关注安答联动

申请试用
热线电话
申请试用

安答联动档案管理系统