综合档案管理系统日常巡检+故障快速排查全实操指南

一、基础环境日常巡检(每周1次)

1.1 服务器硬件状态检查

以主流国产浪潮/联想服务器为例,操作步骤:

  • 远程登录IPMI/BMC管理界面,默认地址通常标注在服务器侧面/说明书(浪潮IP地址:192.168.0.120,联想XClarity Controller:192.168.70.125),默认账号:admin,默认密码:admin@123(首次登录后必须强制修改)
  • 查看CPU温度、硬盘读写率、内存使用率、电源冗余状态四个核心指标,正常阈值:CPU≤75℃、机械硬盘读写率≤90%、SSD≤80%、内存≤85%、双电源必须同时在线
  • 生成近7天硬件日志,搜索关键字“WARNING”“ERROR”,如发现则截图保存并同步排查

1.2 软件服务状态检查

假设系统部署在CentOS 7/8/Stream、Nginx+Tomcat中间件、MySQL 8.0数据库上,操作步骤:

  • SSH远程登录服务器,命令:ssh root@你的服务器公网/内网IP
  • 检查Nginx状态:systemctl status nginx,必须显示active (running),否则执行重启:systemctl restart nginx
  • 检查Tomcat状态(假设部署在/opt/tomcat8目录,端口8080):先看端口监听:netstat -tulnp | grep 8080,再看进程:ps -ef | grep tomcat,无监听/进程则执行启动:/opt/tomcat8/bin/startup.sh
  • 检查MySQL状态:systemctl status mysqld,必须显示active (running),否则执行重启:systemctl restart mysqld,重启后建议登录数据库验证:mysql -u root -p(输入密码后能进入交互界面即可)

1.3 数据存储空间检查

综合档案管理系统日常巡检+故障快速排查全实操指南

操作步骤:

  • 检查系统存储总览:df -h,重点看根分区(/)、MySQL数据存储分区(默认/var/lib/mysql)、档案附件存储分区(假设/mnt/archive_data),剩余空间必须≥20%
  • 清理临时文件(CentOS通用):rm -rf /tmp/rm -rf /var/tmp/
  • 清理Tomcat日志(仅保留近30天,假设日志目录/opt/tomcat8/logs):find /opt/tomcat8/logs -mtime +30 -name ".log" -exec rm -f {} \;,建议设置为crontab定时任务,每周一凌晨3点执行:

定时任务添加方法:执行crontab -e,按i进入编辑模式,粘贴以下内容后按ESC、输入:wq保存退出:

``` 0 3 1 rm -rf /tmp/ && rm -rf /var/tmp/ && find /opt/tomcat8/logs -mtime +30 -name ".log" -exec rm -f {} \; ```

二、业务数据日常维护(每日1次)

2.1 数据库增量备份(本地+异地)

操作步骤:

  • 本地备份(假设备份目录/opt/mysql_backup,数据库名archive_system):先创建备份目录:mkdir -p /opt/mysql_backup,然后手动备份验证:mysqldump -u root -p'你的MySQL密码' --single-transaction --routines --triggers archive_system > /opt/mysql_backup/archive_system_$(date +%Y%m%d_%H%M%S).sql,备份完成后验证文件大小:ls -lh /opt/mysql_backup,大小合理即可
  • 设置本地定时增量备份(mysqldump为全量?修正:用mysqldump+binlog做全量+增量的组合,每日凌晨2点全量,每小时binlog增量):全量定时任务添加:
``` 0 2 /usr/bin/mysqldump -u root -p'你的MySQL密码' --single-transaction --routines --triggers archive_system > /opt/mysql_backup/archive_system_full_$(date +%Y%m%d_%H%M%S).sql && find /opt/mysql_backup -name "archive_system_full_.sql" -mtime +7 -exec rm -f {} \; ```
  • binlog增量配置:先确认MySQL开启binlog:mysql -u root -p -e "SHOW VARIABLES LIKE 'log_bin';",如返回ON则继续,OFF则修改/etc/my.cnf(CentOS7)或/etc/my.cnf.d/mysql-server.cnf(CentOS8),在[mysqld]下添加:
``` log_bin = /var/lib/mysql/mysql-bin server_id = 1 binlog_format = ROW expire_logs_days = 7 ```
  • 修改后重启MySQL:systemctl restart mysqld,再每小时增量备份binlog(假设增量目录/opt/mysql_binlog_backup):先创建目录:mkdir -p /opt/mysql_binlog_backup,定时任务:
``` 0 /usr/bin/rsync -avz /var/lib/mysql/mysql-bin. /opt/mysql_binlog_backup/ ```
  • 异地备份(推荐用rsync同步到另一台内网服务器,假设异地服务器IP192.168.1.200,用户名backup,目录/home/backup/archive):先做SSH免密登录:本地执行ssh-keygen -t rsa -P '',一路回车,然后ssh-copy-id backup@192.168.1.200,输入异地backup密码完成,最后添加定时同步任务:
``` 30 2 /usr/bin/rsync -avz /opt/mysql_backup/ /home/backup/archive/mysql_backup/ && /usr/bin/rsync -avz /opt/mysql_binlog_backup/ /home/backup/archive/mysql_binlog_backup/ ```

2.2 档案附件完整性校验

假设系统生成附件时保存了MD5值在数据库的archive_attachments表(md5字段、path字段),操作步骤:

  • 编写Python脚本批量校验(服务器需提前安装Python3.6+,命令:yum install python3 -y),在/opt目录下创建check_attachments.py:
```python import hashlib import pymysql import os 配置信息 DB_HOST = 'localhost' DB_PORT = 3306 DB_USER = 'root' DB_PASS = '你的MySQL密码' DB_NAME = 'archive_system' ATTACH_ROOT = '/mnt/archive_data' def get_file_md5(file_path): if not os.path.exists(file_path): return None md5_obj = hashlib.md5() with open(file_path, 'rb') as f: for chunk in iter(lambda: f.read(4096), b''): md5_obj.update(chunk) return md5_obj.hexdigest() def main(): conn = pymysql.connect(host=DB_HOST, port=DB_PORT, user=DB_USER, password=DB_PASS, database=DB_NAME) cursor = conn.cursor(pymysql.cursors.DictCursor) cursor.execute("SELECT id, path, md5 FROM archive_attachments WHERE is_deleted = 0") attachments = cursor.fetchall() error_list = [] for att in attachments: full_path = os.path.join(ATTACH_ROOT, att['path'].lstrip('/')) real_md5 = get_file_md5(full_path) if not real_md5 or real_md5 != att['md5']: error_list.append(f"附件ID:{att['id']},路径:{att['path']},状态:{'缺失' if not real_md5 else 'MD5不匹配'}") if error_list: with open('/opt/attachments_error_$(date +%Y%m%d).log', 'w', encoding='utf-8') as f: f.write('\n'.join(error_list)) cursor.close() conn.close() if __name__ == '__main__': main() ```
  • 安装pymysql:pip3 install pymysql
  • 手动运行验证:python3 /opt/check_attachments.py
  • 设置每日凌晨4点定时校验:crontab -e添加:
``` 0 4 /usr/bin/python3 /opt/check_attachments.py ```

三、常见故障快速排查(10分钟定位)

3.1 系统无法访问

排查顺序:

  • 检查本地网络:ping公网/内网IP:ping 你的服务器IP,不通则联系网络管理员
  • 检查防火墙:systemctl status firewalld,开启的话看80/443(Nginx)、8080(Tomcat直连)端口是否开放:firewall-cmd --list-ports,未开放则临时开放:firewall-cmd --add-port=80/tcp --permanent,永久生效后重启:firewall-cmd --reload
  • 检查Nginx/Tomcat状态:参照1.2步骤
  • 检查Nginx配置:nginx -t,报错则修改配置后重启

3.2 上传附件失败

排查顺序:

  • 检查附件存储分区剩余空间:参照1.3步骤
  • 检查存储分区权限:ls -ld /mnt/archive_data,必须确保Tomcat运行用户(假设是tomcat)有读写权限,没有则执行:chown -R tomcat:tomcat /mnt/archive_data
  • 检查Tomcat最大上传大小限制:修改/opt/tomcat8/conf/server.xml,在标签内添加:maxPostSize="104857600"(100MB,按需调整),修改后重启Tomcat
AI咨询
热线电话

028-85154420

15388110056

全国售前咨询电话

扫码咨询
安答联动微信公众号二维码

微信扫码关注安答联动

申请试用
热线电话
申请试用

安答联动档案管理系统