医保档案数字化全流程实操指南 从零完成合规归档与高效检索落地

一、前置环境与合规准备

1.1 合规资质准备

所有操作必须符合《医保电子档案管理规范》《医疗机构医疗保障定点管理暂行办法》要求,提前准备3项必备材料:

  • 当地医保经办机构出具的档案数字化准入备案回执
  • 涉密信息系统安全测评证书(等保2.0三级及以上)
  • 具备国密SM2算法认证的电子签章系统资质

1.2 软硬件环境准备

硬件配置(最低要求,可根据业务量扩容):

  • 高速双面扫描仪:富士通fi-7160,支持60页/分钟双面扫描、A3/A4混扫、自动纠偏
  • 归档服务器:搭载海光3250CPU、16G内存、2T固态+4T机械存储,符合等保2.0三级要求

软件安装(全部可直接复制命令执行):

  • 开源档案管理系统Mayan EDMS,官方下载地址:https://www.mayan-edms.com/download/
  • 国密加密工具GmSSL,Ubuntu系统安装命令:sudo apt update && sudo apt install gmssl -y
  • 中文医疗票据OCR工具PaddleOCR,安装命令:pip install paddlepaddle paddleocr -i https://pypi.tuna.tsinghua.edu.cn/simple

二、档案扫描与结构化处理实操步骤

2.1 原始档案预处理

按以下顺序操作,避免扫描误差:

  • 第一步分类:将原始档案分为4类:01住院结算单、02门诊报销凭证、03参保登记材料、04待遇核定材料
  • 第二步赋码:每份档案左上角粘贴唯一二维码,编码规则为:YB+年份(4位)+类别码(2位)+流水号(6位),例:YB202401000001
  • 第三步预处理:拆除金属钉、抚平褶皱,破损页面先修复后扫描,避免扫描仪卡纸

2.2 扫描参数配置

必须统一设置以下参数,不符合要求的扫描件直接判定无效:

  • 分辨率300DPI,公章类材料用彩色模式、纯文字类用灰度模式
  • 存储格式为PDF/A-2a(长期归档标准,禁止存储为普通PDF)
  • 开启自动双面、自动纠偏、去除空白页功能

富士通fi-7160快速配置:打开扫描仪驱动→选择「批量扫描」→按上述参数配置→保存为「医保档案专属模板」,后续扫描直接调用即可。

2.3 结构化内容识别

直接使用以下可复制脚本完成医疗票据字段提取,无需二次开发:

``` from paddleocr import PaddleOCR import json import time 初始化医保专属OCR,启用医疗票据预训练模型 ocr = PaddleOCR(use_angle_cls=True, lang='ch', show_log=False, rec_model_dir='./ch_ppocr_server_v2.0_rec_infer') 替换为你的扫描件路径 result = ocr.ocr('./扫描件/YB202401000001.pdf', cls=True) 提取核心结构化字段 archive_data = { "档案编号": "YB202401000001", "参保人姓名": "", "医保卡号": "", "结算金额": "", "结算日期": "", "识别时间": time.strftime("%Y-%m-%d %H:%M:%S") } for line in result[0]: text = line[1][0].strip() if "姓名" in text: archive_data["参保人姓名"] = text.split(":")[-1].strip() elif "医保卡号" in text or "个人编号" in text: archive_data["医保卡号"] = text.split(":")[-1].strip() elif "合计金额" in text or "结算总金额" in text: archive_data["结算金额"] = text.split(":")[-1].strip() elif "结算日期" in text or "经办日期" in text: archive_data["结算日期"] = text.split(":")[-1].strip() 保存结构化数据 with open('./结构化数据/YB202401000001.json', 'w', encoding='utf-8') as f: json.dump(archive_data, f, ensure_ascii=False, indent=2) ```

校验要求:每批次扫描完成后随机抽取3%的样本人工核验,字段识别准确率低于98%的批次重新扫描识别。

三、加密归档与合规存储操作

3.1 国密加密处理

医保档案数字化全流程实操指南 从零完成合规归档与高效检索落地

所有敏感数据必须使用国密算法加密,禁止使用RSA、AES等境外算法,可直接执行以下命令:

  • 结构化数据加密(SM2算法,公钥从当地医保局官方渠道下载):gmssl sm2 -encrypt -in 结构化数据/YB202401000001.json -out 加密归档/YB202401000001.dat -pubkey 当地医保局公钥.pem
  • 扫描件加密(SM4算法,密钥自行生成16位随机字符串,离线保存):gmssl sm4 -ecb -encrypt -in 扫描件/YB202401000001.pdf -out 加密归档/YB202401000001.pdf.dat -k 你的16位SM4密钥

3.2 双备份存储配置

必须执行双备份存储,禁止仅存储单份数据:第一份存储在本地等保三级服务器,第二份存储在政务云医保专属存储区,禁止存储在公有云普通存储桶。

统一存储目录结构(可直接套用):

``` ├── 医保归档库 │ ├── 2024年 │ │ ├── 01住院结算 │ │ │ ├── 加密扫描件 │ │ │ ├── 加密结构化数据 │ │ │ └── 元数据索引表.csv │ │ ├── 02门诊报销 │ │ ├── 03参保登记 │ │ └── 04待遇核定 ```

元数据索引表必填字段:档案编号、参保人身份证号(脱敏仅存前6后4位)、存储路径、归档时间、经办人ID。

四、检索调用与审计日志配置

4.1 快速检索配置

在Mayan EDMS后台创建自定义元数据字段,对应档案编号、参保人姓名、结算日期3个核心检索字段,配置完成后检索响应速度可控制在2秒以内,调用API检索命令:

``` curl -X GET "http://你的Mayan服务地址/api/documents/?metadata__档案编号__contains=YB202401000001" -H "Authorization: Token 你的API访问令牌" ```

4.2 操作审计配置

所有检索、下载、修改操作必须全程留痕,日志保存时间不低于15年,禁止删除、篡改日志。

日志必填字段:操作人ID、操作时间、操作类型、IP地址、操作的档案编号,日志本身需使用SM4算法加密存储。

五、合规校验标准

全部流程完成后按以下标准校验,不符合要求的重新处理:

  • 扫描件清晰度:放大3倍无模糊,公章、签字可清晰辨认
  • 数据准确率:结构化字段与原件一致率100%
  • 加密合规:所有敏感数据均使用国密算法加密
  • 权限合规:执行最小权限原则,经办人员仅能访问管辖范围内的档案,跨区域访问需提供医保局审批文件
AI咨询
热线电话

028-85154420

15388110056

全国售前咨询电话

扫码咨询
安答联动微信公众号二维码

微信扫码关注安答联动

申请试用
热线电话
申请试用

安答联动档案管理系统