HR 救星:用 Python 批量提取 100 份简历中的“姓名+电话+学校”,自动填入 Excel
2026/5/9 4:32:58
网站建设
项目流程
标签:#Python #办公自动化 #RPA #正则表达式 #HR工具 #数据清洗
🧐 前言:核心难点是什么?
简历是典型的非结构化数据。
- 格式不统一:有的是 PDF,有的是 Word。
- 排版不统一:有的名字在左上角,有的在中间;有的写“毕业院校”,有的写“教育经历”。
我们要解决两个问题:
- 读取:如何让 Python 读懂 PDF 和 Word?
- 提取:如何在杂乱的文字中精准抓取手机号和学校?(答案:正则表达式)
自动化流程图 (Mermaid):