清代档案管理软件本地化搭建实操 覆盖著录存管检索全流程操作

一、前期环境准备

1.1 软硬件最低要求

操作系统支持Windows10+/macOS12+/CentOS7.6及以上版本,硬件配置要求CPU≥2核,内存≥4G,硬盘空闲空间≥50G(用于存储档案扫描件及索引数据)。

1.2 基础依赖安装

本方案基于开源档案管理系统Docspell二次适配清代档案管理需求,依赖Docker环境运行,安装步骤如下:

  • Windows/macOS用户直接下载安装包:https://desktop.docker.com/win/main/amd64/Docker%20Desktop%20Installer.exe ,双击安装后重启电脑即可
  • CentOS用户执行以下命令完成安装: ``` yum install -y yum-utils yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo yum install -y docker-ce docker-ce-cli containerd.io systemctl start docker && systemctl enable docker ```
  • 安装完成后执行docker -v,返回版本号即表示安装成功

二、软件部署操作

2.1 核心配置文件编写

清代档案管理软件本地化搭建实操 覆盖著录存管检索全流程操作

在本地新建空白文件夹,命名为qing-archive,在文件夹内新建名为docker-compose.yml的文件,将以下配置完整复制粘贴保存:

```yaml version: "3" services: docspell: image: docspell/docspell:0.39.0 ports: - "7880:7880" environment: DOCSPELL_SERVER__BACKEND__FILES__PROCESSING__OCR__ENABLED: "true" DOCSPELL_SERVER__BACKEND__FILES__PROCESSING__OCR__LANGUAGES: "chi_sim,chi_tra" DOCSPELL_SERVER__BACKEND__CUSTOM_FIELDS: | [ {"name":"朝代","type":"text","required":true,"defaultValue":"清代"}, {"name":"纪年","type":"text","required":true,"placeholder":"如康熙十二年、光绪元年"}, {"name":"责任者","type":"text","required":true,"placeholder":"如军机处、内务府、李鸿章"}, {"name":"文种","type":"select","options":["题本","奏本","朱批","谕旨","咨文","照会","契约","方志"],"required":true}, {"name":"载体形态","type":"select","options":["纸质","拓片","缣帛","木刻本","手抄本"],"required":true}, {"name":"收藏单位","type":"text","required":false} ] DOCSPELL_SERVER__BACKEND__CATEGORIES: | ["内阁档案","军机处档案","宫中档案","内务府档案","地方衙门档案","民间契约档案","其他清代档案"] volumes: - ./docspell-data:/opt/docspell/data depends_on: - db restart: always db: image: postgres:14-alpine environment: POSTGRES_PASSWORD: Qd@gl2024 POSTGRES_DB: docspell volumes: - ./postgres-data:/var/lib/postgresql/data restart: always ```

以上配置已预设清代档案专属著录字段、分类选项,支持繁体古籍OCR识别,无需额外修改即可直接使用。

2.2 启动运行

  • Windows用户在qing-archive文件夹地址栏输入cmd,回车打开命令窗口;CentOS用户直接cd进入qing-archive目录
  • 执行命令docker compose up -d,等待2-3分钟镜像拉取、服务启动完成
  • 打开浏览器访问http://127.0.0.1:7880 ,默认账号为admin,默认密码为admin,首次登录强制修改密码即可进入系统
  • 局域网其他设备访问的话,将127.0.0.1替换为部署机器的局域网IP即可,CentOS用户需执行命令firewall-cmd --add-port=7880/tcp --permanent && firewall-cmd --reload开放端口

三、核心功能实操

3.1 单份档案著录

  • 登录系统后点击左侧【上传档案】按钮,选择本地的清代档案扫描件,支持JPG/PNG/PDF/TIFF格式,单文件最大支持2G
  • 上传完成后系统自动弹出著录表单,朝代字段已默认填充为“清代”,依次填写纪年、责任者,选择对应文种、载体形态、所属分类,选填收藏单位
  • 确认信息无误后点击【提交归档】,系统自动完成OCR文字提取、全文索引生成,10M以内的文件30秒内即可完成归档

3.2 批量档案导入

  • 点击左侧【批量导入】按钮,下载系统提供的Excel著录模板
  • 按照模板列要求填写所有档案的著录信息,扫描件文件名必须和模板中“文件名”列完全一致,否则会匹配失败
  • 将所有扫描件和填好的Excel表打包为ZIP压缩包,注意不要嵌套文件夹,所有文件直接放在压缩包根目录
  • 上传压缩包后系统自动校验著录信息,校验通过后自动完成批量归档,100份以内的档案5分钟内即可完成全部导入

3.3 档案检索操作

  • 顶部搜索框支持模糊检索、精准字段检索,输入关键词即可匹配档案OCR文本、著录信息,例如输入“文种:朱批 纪年:康熙十二年”即可精准筛选对应档案
  • 左侧分类栏可直接点击对应分类筛选该类目下所有档案,支持按纪年、上传时间、责任者排序
  • 点击检索结果即可查看档案原图、著录信息、OCR提取文本,支持原图下载、著录信息导出为Excel格式

四、常见问题与数据备份

4.1 常见问题排查

  • 页面无法访问:执行docker ps查看两个容器是否为Up状态,若未启动执行docker compose up -d重启即可
  • OCR识别准确率低:可在配置文件的OCR语言参数中加入“chi_sim_vert”支持竖排古籍识别,修改后执行docker compose up -d --force-recreate重启服务即可
  • 需新增著录字段:直接修改docker-compose.yml中CUSTOM_FIELDS配置项,重启服务后即可生效,已有档案数据不会丢失

4.2 数据备份操作

  • 执行docker compose down停止服务
  • 将qing-archive目录下的docspell-data、postgres-data两个文件夹整体复制到备份硬盘即可完成全量备份
  • 恢复数据时将备份的两个文件夹替换新服务器qing-archive目录下的对应文件夹,执行docker compose up -d即可恢复全部档案数据
AI咨询
热线电话

028-85154420

15388110056

全国售前咨询电话

扫码咨询
安答联动微信公众号二维码

微信扫码关注安答联动

申请试用
热线电话
申请试用

安答联动档案管理系统