Python 实现 Excel 多表合并清洗:自动生成总表、汇总表和异常表
2026/6/1 15:43:01 网站建设 项目流程

摘要:

本文用一个门店销售表案例,演示如何用 Python 读取文件夹中的多个 Excel,完成日期标准化、金额校验、手机号校验、重复订单检查,并输出总销售明细、门店汇总和异常数据。

文章结构:

1. 业务场景

财务或运营经常需要合并多个门店销售表。原始表字段类似,但数据质量不稳定,常见问题包括日期格式不统一、销售额不是数字、手机号缺失、重复订单号等。

2. 样例数据

本案例包含 5 个门店销售表,每个表包含:

  • 门店

  • 日期

  • 订单号

  • 商品

  • 销售额

  • 数量

  • 客户手机号

3. 清洗规则

  • 合并文件夹中所有.xlsx文件。

  • 删除全空行。

  • 日期统一为YYYY-MM-DD

  • 销售额必须是数字。

  • 手机号必须是 11 位数字。

  • 重复订单号只保留第一条。

  • 异常数据写入异常表。

4. 输出结果

工具最终生成一个 Excel 文件,包含 3 个工作表:

  • 总销售明细

  • 门店汇总

  • 异常数据

5. 核心实现思路

  • 使用openpyxl读取多个 Excel。

  • 遍历每一行数据,按规则清洗。

  • 用集合记录已出现的订单号,检查重复。

  • 用字典按门店统计订单数、销售额、商品件数。

  • openpyxl写入结果文件并设置表头样式。

6. 可扩展方向

  • 增加字段映射配置。

  • 支持不同表头别名。

  • 增加按月份、区域、业务员汇总。

  • 打包成 exe,给不会 Python 的用户使用。

  • 增加处理日志和错误提示。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询