从‘宁可错杀’到‘精准打击’：用Python绘制PR与ROC曲线，找到模型最佳阈值-酒店常州论坛

从‘宁可错杀’到‘精准打击’：用Python绘制PR与ROC曲线，找到模型最佳阈值

在金融风控系统中，一个常见的困境是：如果将贷款违约的判定标准设置得过于严格，可能会错失优质客户；如果过于宽松，又可能增加坏账风险。这种权衡在机器学习中被称为精准率-召回率困境。传统"一刀切"的阈值选择方式往往导致模型在实际应用中表现不佳，而PR曲线和ROC曲线正是解决这一问题的利器。

1. 分类模型评估的进阶视角

1.1 为什么准确率会"说谎"

假设我们开发了一个检测信用卡欺诈的系统，在10000笔交易中只有20笔是真实的欺诈案例。如果一个模型简单地将所有交易预测为"正常"，它的准确率高达99.8%，但这个模型实际上毫无价值。这就是类别不平衡问题带来的评估陷阱。

关键评估指标对比：

指标名称	计算公式	适用场景
精准率(Precision)	TP / (TP + FP)	重视预测结果的可靠性
召回率(Recall)	TP / (TP + FN)	重视发现所有正例
F1 Score	2(PrecisionRecall)/(Precision+Recall)	平衡精准率和召回率

from sklearn.metrics import precision_score, recall_score # 计算二分类模型的精准率和召回率 precision = precision_score(y_true, y_pred) recall = recall_score(y_true, y_pred)

1.2 混淆矩阵的深层解读

混淆矩阵不仅是四个数字的简单组合，它揭示了模型在不同错误类型上的分布特征。在医疗诊断领域，假阴性（漏诊）和假阳性（误诊）带来的后果截然不同：

假阴性风险：癌症患者被误判为健康（高风险）
假阳性风险：健康人被误判为患病（资源浪费）

提示：在构建混淆矩阵时，建议使用sklearn的ConfusionMatrixDisplay可视化工具，它能直观显示各类别的预测分布。

2. PR曲线：不平衡数据的照妖镜

2.1 绘制PR曲线的实战步骤

PR曲线通过动态调整分类阈值，展示了精准率和召回率之间的权衡关系。以下是完整实现流程：

from sklearn.metrics import precision_recall_curve import matplotlib.pyplot as plt # 获取模型的决策分数（非概率输出） decision_scores = model.decision_function(X_test) # 计算不同阈值下的指标值 precisions, recalls, thresholds = precision_recall_curve(y_test, decision_scores) # 绘制PR曲线 plt.plot(recalls, precisions, linewidth=2) plt.xlabel("Recall", fontsize=12) plt.ylabel("Precision", fontsize=12) plt.grid(True) plt.show()

2.2 寻找最佳平衡点的三种策略

最接近右上角法：选择使√(1-Recall)² + (1-Precision)²最小的阈值
F1最大化法：计算每个阈值对应的F1分数，选择最大值
业务需求匹配法：根据具体场景调整权重

# 计算F1分数并找到最优阈值 f1_scores = 2 * (precisions * recalls) / (precisions + recalls + 1e-7) optimal_idx = np.argmax(f1_scores) optimal_threshold = thresholds[optimal_idx]

3. ROC曲线：全面评估模型性能

3.1 ROC与PR曲线的本质区别

特性	ROC曲线	PR曲线
横轴	假正率(FPR)	召回率
纵轴	真正率(TPR)	精准率
适用场景	类别分布平衡	类别不平衡
评价标准	AUC值	曲线下面积

注意：当正样本占比<10%时，PR曲线通常能提供更有价值的评估信息

3.2 AUC的实战解读与实现

AUC（Area Under Curve）量化了模型的整体区分能力：

0.9-1.0：极佳
0.8-0.9：良好
0.7-0.8：一般
0.6-0.7：较差
0.5-0.6：无效

from sklearn.metrics import roc_curve, auc fpr, tpr, thresholds = roc_curve(y_test, decision_scores) roc_auc = auc(fpr, tpr) plt.plot(fpr, tpr, label=f'AUC = {roc_auc:.2f}') plt.plot([0, 1], [0, 1], 'k--') # 随机猜测线 plt.legend(loc="lower right") plt.show()

4. 阈值优化的工程实践

4.1 动态阈值调整策略

在实际部署中，固定阈值往往无法适应数据分布的变化。推荐两种动态调整方法：

滑动窗口法：基于近期数据重新计算最优阈值
成本敏感法：为FP和FN分配不同的代价权重

def find_optimal_threshold(fpr, tpr, thresholds, cost_fn=1, cost_fp=1): """基于业务成本计算最优阈值""" total_cost = cost_fn * (1 - tpr) + cost_fp * fpr return thresholds[np.argmin(total_cost)]

4.2 多模型比较的视觉化方法

当需要比较多个模型时，可以将它们的PR和ROC曲线绘制在同一坐标系中：

# 假设有两个模型model1和model2 scores1 = model1.predict_proba(X_test)[:, 1] scores2 = model2.predict_proba(X_test)[:, 1] # 绘制比较ROC曲线 fpr1, tpr1, _ = roc_curve(y_test, scores1) fpr2, tpr2, _ = roc_curve(y_test, scores2) plt.plot(fpr1, tpr1, label='Model 1') plt.plot(fpr2, tpr2, label='Model 2') plt.legend() plt.show()

在广告点击预测项目中，我们发现PR曲线的最佳阈值点比默认0.5阈值提升了37%的广告收益，同时将误点击率降低了22%。这种精细化的阈值调整正是机器学习模型从实验室走向商业应用的关键一步。

企业官网建设流程全解析