三步筛选常用开源档案软件综合排名可直接上手制作方法
第一步:整理可公开获取的开源档案软件名单
这一步是基础,要从权威开源平台筛选符合基础功能的档案软件,优先过滤掉活跃度极低的项目,具体操作如下:
- 打开GitHub官方网站 https://github.com/search?q=archive+software&type=repositories&s=stars&o=desc(已自动按Stars降序、类型设为仓库)
- 在搜索结果页面左侧筛选栏,依次点击 Programming Language → 勾选Python/Java(主流语言更易找到跨平台部署)、Updated → 勾选Last month(近1个月更新,排除废弃项目)、License → 勾选MIT/Apache-2.0(完全商用/免费无限制)
- 手动翻前10页,排除功能明确不是通用档案管理的(如只支持GitHub仓库归档的),提取剩余仓库的名称、Stars数、Last Updated时间、项目描述3个字段,复制到Excel新建工作表的A、B、C、D列
第二步:获取并计算百度指数、GitHub Issues/PR数据

这一步补充用户认知度、社区支持度2个维度,操作要精确获取标准化后加权计算得分,具体操作如下:
2.1 认知度数据提取与处理
- 打开百度指数官方网站 https://index.baidu.com/v2/main/index.html/,登录个人百度账号(无账号需免费注册)
- 在搜索框逐个输入Excel表中的软件名称,选择近30天整体搜索指数(默认整体=PC+移动,覆盖全场景),将数值填入E列
- 对E列数据做标准化处理:先找出E列最大值记为MAX_E,用公式
=(当前单元格E值/MAX_E)40(认知度占总权重40%)计算标准化认知度得分,填入F列
2.2 社区支持度数据提取与处理
- 回到刚才的GitHub搜索结果页面,逐个点击对应仓库,找到仓库右上角的Issues标签页、Pull requests标签页
- 分别记录近30天的Open+Closed Issues数填入G列,近30天的Merged PR数填入H列
- 对G+H列总和做标准化处理:找出G+H列最大值记为MAX_GH,用公式
=(当前单元格G+H值/MAX_GH)30(社区问题解决与迭代意愿占总权重30%)计算标准化社区支持度得分,填入I列
2.3 剩余权重计算
- 对B列Stars数做标准化处理:找出B列最大值记为MAX_B,用公式
=(当前单元格B值/MAX_B)20(社区认可度占总权重20%)计算标准化Stars得分,填入J列 - 对C列Last Updated时间做标准化处理:先将C列格式统一设为“yyyy-mm-dd”,用公式
=TODAY()-当前单元格C值计算距离今日的天数记为D_diff,找出D_diff列最大值记为MAX_D_diff,用公式=ROUND(((MAX_D_diff-当前单元格D_diff)/MAX_D_diff)10,1(越新更新权重越高,剩余权重10%)计算标准化活跃度得分,填入K列
第三步:加权汇总并生成排名
这一步汇总所有得分,一键生成带排名的可视化或文本表格,具体操作如下:
- 在L列计算总得分:用公式
=F列+I列+J列+K列,输入后按Enter,下拉填充到所有软件行 - 选中A到L列所有数据,点击Excel顶部菜单栏的 数据 → 排序
- 在排序对话框中,主要关键字选 总得分,次序选 降序,点击 确定
- 在M列生成排名:在M2单元格输入公式
=RANK.EQ(L2,$L$2:$L$X)(X替换为最后一行数据的行号),按Enter,下拉填充完成排名 - (可选)生成简单柱状图可视化排名:选中A列(软件名)和L列(总得分)数据,点击顶部菜单栏的 插入 → 簇状柱形图,调整图表大小和标题即可