档案软件单机版搭建与使用全流程实操指南
环境准备与基础工具安装
在开始搭建档案管理系统之前,必须确保操作系统中已经安装了 Docker 和 Docker Compose。本教程以 Windows 10/11 系统为例,Linux 系统操作步骤除安装包不同外,后续命令基本一致。
第一步:下载并安装 Docker Desktop
直接访问 Docker 官方提供的下载地址获取最新安装包:
https://www.docker.com/products/docker-desktop/
下载完成后,双击运行安装程序。安装过程中务必勾选 "Use WSL 2 instead of Hyper-V" 选项(如果系统提示需要启用 WSL 功能,请按照提示允许并重启电脑)。安装完毕后,启动 Docker Desktop,确保底部状态栏显示为绿色 "Docker Desktop is running",这代表容器引擎已就绪。
第二步:创建项目目录
在磁盘根目录(如 D 盘)下新建一个文件夹用于存放档案软件的所有配置和数据,建议命名为 paperless。打开命令行工具(PowerShell 或 CMD),进入该目录:
cd D:\paperless
部署配置文件详解
我们需要通过 Docker Compose 来编排服务。Paperless-ngx 依赖 PostgreSQL 数据库、Redis 消息队列以及一些用于 OCR 识别的辅助服务。在 D:\paperless 文件夹内新建一个文本文件,重命名为 docker-compose.yml,并将以下完整配置代码复制进去。
该配置已针对中文环境优化,开启了中文 OCR 识别支持,并映射了本地存储路径,防止数据随容器销毁而丢失。
```yaml version: "3.4" services: broker: image: docker.io/library/redis:7 restart: always volumes: - redisdata:/data db: image: docker.io/library/postgres:15 restart: always volumes: - dbdata:/var/lib/postgresql/data environment: POSTGRES_USER: paperless POSTGRES_PASSWORD: paperless POSTGRES_DB: paperless webserver: image: ghcr.io/paperless-ngx/paperless-ngx:latest restart: always depends_on: - db - broker ports: - "8000:8000" volumes: - data:/usr/src/paperless/data - media:/usr/src/paperless/media - ./export:/usr/src/paperless/export - ./consume:/usr/src/paperless/consume environment: PAPERLESS_REDIS: redis://broker:6379 PAPERLESS_DBHOST: db PAPERLESS_DBUSER: paperless PAPERLESS_DBPASS: paperless PAPERLESS_DBNAME: paperless PAPERLESS_OCR_LANGUAGE: chi_sim+eng PAPERLESS_TIME_ZONE: Asia/Shanghai USERMAP_UID: 1000 USERMAP_GID: 1000 gotenberg: image: docker.io/gotenberg/gotenberg:7 restart: always volumes: - gotenbergdata:/data tika: image: docker.io/apache/tika:latest restart: always volumes: data: media: dbdata: redisdata: gotenbergdata: ```配置说明:
- ports 映射:将容器内的 8000 端口映射到宿主机,后续通过浏览器访问 localhost:8000 即可。
- volumes 挂载:./consume 目录是监控文件夹,放入这里的文件会被自动摄入;./export 目录用于导出处理后的文档。
- PAPERLESS_OCR_LANGUAGE:设置为 chi_sim+eng,确保软件能识别简体中文和英文。
启动服务与初始化管理员
第一步:启动容器服务
在 D:\paperless 目录下打开命令行,执行以下命令拉取镜像并启动所有服务:
docker compose up -d
首次运行需要下载镜像,根据网速不同可能需要几分钟。请耐心等待直到命令行停止滚动并显示 "Done" 或状态为 "Up"。
第二步:创建超级管理员账户
服务启动后,必须先创建管理员用户才能登录系统。继续在命令行执行:
docker compose exec webserver manage createsuperuser
按照提示依次输入用户名(如 admin)、电子邮箱和密码。输入密码时屏幕不会显示字符,这是正常的安全机制,输入完成后回车确认。
第三步:访问系统首页
打开浏览器,在地址栏输入:
http://localhost:8000
使用刚才创建的管理员账号登录。如果看到仪表盘界面,说明单机版档案软件已经部署成功。
核心功能实操:文档摄入与OCR识别
实操一:通过拖拽上传档案

登录后,点击界面右上角的 "上传文档" 按钮。将本地电脑上的 PDF 或图片文件(JPG、PNG)直接拖拽到弹出的上传区域。
上传过程中,系统会自动进行 OCR(光学字符识别)处理。如果是中文文档,因为我们在配置文件中预置了 chi_sim 语言包,系统会自动提取其中的中文文字。上传完成后,文档会出现在列表中,状态栏通常显示绿色的 "Success"。
实操二:使用监控文件夹自动归档
这是最符合“单机版”使用习惯的功能。在电脑资源管理器中打开 D:\paperless\consume 文件夹。
将需要归档的扫描件或 PDF 直接复制或剪切到这个文件夹内。不需要任何额外操作,Paperless-ngx 会自动检测到新文件,将其吸入系统进行 OCR 处理,处理完成后原文件夹内的文件会自动消失(已被移动到系统内部数据库),并在网页界面生成对应的档案条目。
实操三:查看与校对识别结果
在文档列表中点击任意一篇文档的标题进入详情页。右侧会显示文档的预览图。点击侧边栏的 "已识别的文本",可以看到 OCR 提取出的纯文本内容。如果发现识别有误,这里允许手动修正,修正后的内容将作为搜索索引。
档案管理与检索技巧
实操一:设置标签与文档类型
为了管理海量档案,必须利用元数据。在设置页面预先创建好标签,例如“发票”、“合同”、“身份证”等。
在文档列表页,勾选一个或多个文档,点击顶部的 "编辑" 按钮。在弹出的面板中,可以指定文档类型、添加标签、设置归档日期(Correspondence Date)以及关联通信方(如“某某公司”)。设置完成后点击保存,文档在列表中会显示对应的彩色标签。
实操二:高精度全文检索
由于进行了 OCR 处理,所有的扫描图片 PDF 都变成了可搜索的文本。在页面顶部的搜索框中输入关键词。
例如输入“2023年采购”,系统会检索所有包含该词组的文档内容,不仅限于文件名。搜索结果支持高亮显示,点击搜索结果即可直接跳转到文档中对应的具体位置。
实操三:文档导出与归档
如果需要将处理后的档案备份到本地,在文档列表勾选目标文件,点击 "导出"。系统会将文档及其元数据打包生成一个 ZIP 文件。默认情况下,这些文件会存放在 D:\paperless\export 目录中,你可以定期将该目录的内容拷贝到移动硬盘进行冷备份。
数据备份与迁移维护
作为单机版软件,数据安全性完全依赖本地维护。Docker 容器本身是临时的,但我们在配置文件中挂载了 volumes(数据卷)和本地目录,因此数据是持久化的。
备份操作:
最简单的备份方式是直接打包 D:\paperless 整个文件夹。该文件夹包含了配置文件、导出数据、监控数据以及 Docker 管理的数据卷引用(具体数据位于 Docker 的管理目录,通常在 C:\Users\Public\Documents\Hyper-V\Virtual Hard Disks 或 Docker Desktop 的 WSL distro 数据中)。
为了确保万无一失,建议定期执行数据库转储命令。在命令行运行:
docker compose exec db pg_dump -U paperless paperless > backup.sql
这会在当前目录生成一个 backup.sql 文件,包含了所有的档案元数据和索引信息。
恢复操作:
如果需要重装系统或迁移到其他电脑,只需将 D:\paperless 文件夹复制到新电脑,安装 Docker,然后在该目录下运行 docker compose up -d 即可自动恢复所有服务。
如果是通过 SQL 文件恢复,在启动服务后运行:
cat backup.sql | docker compose exec -T db psql -U paperless paperless