档案数字化系统落地及配套双软认证资质全流程纯干货实操

一、前置准备清单(必查必做)

1.1 档案数字化前置

  • 硬件准备清单:扫描仪(推荐高速双面馈纸式,如爱普生DS-570WII,预算有限可选中晶FileScan 1860XL Plus)、A4/A3专用档案纸托(防静电)、大容量NAS(或本地raid5硬盘组,单盘≥4TB,总容量建议为待扫描档案预估容量×3)、档案防拆扫描器(可选,涉密类必须)
  • 软件准备清单:基础扫描驱动(对应扫描仪官网下载:爱普生https://epson.com.cn/support/scanners,中晶https://www.microtek.com.cn/support/drivers/)、OCR识别引擎(开源Tesseract5.3.3,或者在线百度OCR通用文字识别标准版用于测试)、开源归档工具Dspace 7.6(官网https://github.com/DSpace/DSpace/releases/tag/dspace-7.6)
  • 人员/文档准备:1名熟悉Windows/Linux操作的技术人员、待扫描档案分类目录(Excel格式,含档号、题名、责任者、日期、密级、页数)

1.2 双软认证前置

  • 知识产权前置:至少1项软件著作权(简称软著),软著名称需带“档案数字化管理系统”或“档案数字化采集系统”等核心关键词
  • 财务前置:近1年软件开发收入占企业总收入比例≥50%,研发费用占企业总收入比例≥5%
  • 人员前置:大专及以上学历员工占比≥40%,研发人员占比≥20%
  • 资质前置:营业执照经营范围需包含“软件开发”“信息技术咨询”等相关内容

二、档案数字化系统快速落地(开源版)

2.1 基础环境搭建(Linux Debian 12/Ubuntu 22.04LTS二选一)

使用root或sudo权限执行以下命令:

```bash 1. 更新系统源 apt update && apt upgrade -y 2. 安装JDK17(Dspace7.6必须) apt install openjdk-17-jdk -y 3. 安装PostgreSQL14(Dspace7.6指定数据库) apt install postgresql-14 postgresql-client-14 -y 4. 安装Tomcat9(Dspace7.6指定Web容器) apt install tomcat9 tomcat9-admin -y 5. 安装依赖工具 apt install git maven ant unzip imagemagick ghostscript tesseract-ocr tesseract-ocr-chi-sim -y ```

2.2 Dspace数据库配置

切换到postgres用户:

```bash su - postgres psql ```

档案数字化系统落地及配套双软认证资质全流程纯干货实操

在psql命令行执行以下代码(复制粘贴时注意修改密码):

```sql CREATE USER dspace WITH PASSWORD 'dspace_strong_password_123'; CREATE DATABASE dspace OWNER dspace; \q exit ```

2.3 Dspace安装与配置

  • 下载并解压Dspace:
```bash cd /opt wget https://github.com/DSpace/DSpace/releases/download/dspace-7.6/dspace-7.6-release.zip unzip dspace-7.6-release.zip cd dspace-7.6-release ```
  • 配置数据库连接:

打开dspace/config/local.cfg(新建该文件):

```bash nano dspace/config/local.cfg ```

复制粘贴以下完整内容并保存(Ctrl+O回车,Ctrl+X):

``` dspace.dir=/opt/dspace db.url=jdbc:postgresql://localhost:5432/dspace db.username=dspace db.password=dspace_strong_password_123 db.driver=org.postgresql.Driver tomcat.home=/var/lib/tomcat9 中文OCR配置 ocr.engine=tesseract ocr.tesseract.path=/usr/bin/tesseract ocr.tesseract.lang=chi_sim+eng ```
  • 初始化Dspace:
```bash mvn package -DskipTests cd dspace/target/dspace-installer ant fresh_install ```
  • 部署到Tomcat并启动:
```bash cp -r /opt/dspace/webapps/ /var/lib/tomcat9/webapps/ chown -R tomcat9:tomcat9 /opt/dspace /var/lib/tomcat9/webapps/ systemctl restart tomcat9 systemctl enable tomcat9 ```

2.4 档案数字化基础操作

  • 创建管理员账户:浏览器访问http://服务器IP:8080/dspace,执行注册-登录-联系系统所有者(默认未启用,可通过命令行创建):
```bash cd /opt/dspace/bin ./dspace create-administrator -e admin@example.com -f 管理员 -l 账号 -p admin_strong_password_123 ```
  • 批量导入档案:使用提前制作的Excel分类目录生成符合Dspace Simple Archive Format(SAF)格式的文件夹,然后执行:
```bash cd /opt/dspace/bin ./dspace import -a -e admin@example.com -c 123456789/1(此处替换为创建的社区/集合ID) -s /path/to/saf/folder -m /path/to/map/file.txt ```

三、双软认证资质申报全流程

3.1 软件著作权申报(最快3-5工作日下证)

  • 登录中国版权保护中心官网:https://www.ccopyright.com.cn/
  • 核心操作步骤:注册账号→实名认证(企业需上传营业执照、法人身份证)→软件登记→计算机软件著作权登记申请→填写申请表(软件全称:带关键词,简称:随意,开发完成日期/发表日期:建议选近1-2个月)→上传源程序(前30页+后30页,不足60页全上传,每页不少于50行,首尾为代码头/代码尾)→上传软件说明书(不少于10页,含系统架构图、操作截图、功能说明)→提交审核→缴费(普通300元/件,加急3-5工作日需联系地方版权代理或走绿色通道)

3.2 软件产品登记(地方软件行业协会受理)

  • 准备材料:软著证书、软件产品检测报告(联系当地具备CNAS/CMA资质的软件检测机构,如中国软件测评中心地方分中心)、营业执照、软件产品名称规范表
  • 核心操作步骤:登录地方软件行业协会官网(如北京https://www.bsia.org.cn/,广东https://www.gdsia.org.cn/)→注册账号→实名认证→软件产品登记→上传材料→提交审核→缴费(检测费约1500-2000元/件,登记费免费)

3.3 软件企业认定(地方工信局/软件行业协会受理)

  • 准备材料:营业执照、软著证书、软件产品登记证书、近1年财务审计报告(需注明软件开发收入、研发费用占比)、近1年研发人员名单及社保证明、近1年软件开发合同及发票
  • 核心操作步骤:登录地方工信局官网“软件和信息技术服务业公共服务平台”→注册账号→实名认证→软件企业认定→填写申请表→上传材料→提交审核→等待公示(公示期7天)→领取软件企业证书

四、常见卡壳问题及解决方法

  • Dspace启动失败:检查JDK版本是否为17,PostgreSQL是否启动,数据库密码是否正确
  • 中文OCR识别错误率高:下载Tesseract中文训练集扩展包https://github.com/tesseract-ocr/tessdata_fast/blob/main/chi_sim.traineddata,替换/usr/share/tesseract-ocr/5/tessdata/下的原文件
  • 软著源程序格式不对:使用Word设置页眉为“软件全称+源程序”,页脚为页码,删除注释和空行,每页至少50行
  • 软件开发收入占比不够:提前1-2个月调整财务结构,将与档案数字化系统相关的合同、发票归入软件开发收入
AI咨询
热线电话

028-85154420

15388110056

全国售前咨询电话

扫码咨询
安答联动微信公众号二维码

微信扫码关注安答联动

申请试用
热线电话
申请试用

安答联动档案管理系统