审计质量背后的因果密码:用PSM解码四大会计师事务所的真实影响力
在金融市场的迷雾中,投资者常常面临一个根本性难题:那些聘请"四大"会计师事务所审计的上市公司,其财务报告质量真的更可靠吗?表面数据似乎支持这一结论——四大审计的客户通常表现出更低的财务错报率和更少的报表重述。但这是否意味着四大审计直接提升了审计质量?或许只是优质企业更倾向于选择四大,形成了一种"优质匹配"现象?解开这个因果谜题,正是倾向得分匹配(PSM)大显身手的舞台。
1. 研究设计:构建一个完美的"平行宇宙"
1.1 核心研究问题拆解
我们试图回答:在保持企业基本面不变的情况下,选择四大审计(BIG4=1)相较于非四大审计(BIG4=0)会如何影响两个关键审计质量指标:
- ABSACC:盈余管理绝对值,衡量财务操纵程度
- RESTATE:报表重述虚拟变量,反映重大错报
注意:研究设计必须满足"可忽略性假设"——即匹配后,两组间不存在系统性差异(除审计机构选择外)
1.2 数据准备与变量定义
使用中国A股上市公司2010-2022年数据,关键变量包括:
| 变量类型 | 变量名 | 定义 | 数据来源 |
|---|---|---|---|
| 处理变量 | BIG4 | 审计师是否为四大(1/0) | CSMAR |
| 结果变量 | ABSACC | 修正Jones模型计算的盈余管理绝对值 | 自行计算 |
| 结果变量 | RESTATE | 当年是否发生报表重述(1/0) | CSMAR |
| 协变量 | LNASSET | 总资产自然对数 | CSMAR |
| 协变量 | LEV | 资产负债率 | CSMAR |
| 协变量 | ROA | 资产收益率 | CSMAR |
| 协变量 | GROWTH | 营业收入增长率 | CSMAR |
| 协变量 | BM | 账面市值比 | CSMAR |
| 协变量 | AGE | 上市年限 | CSMAR |
| 固定效应 | indcode | 行业虚拟变量(证监会分类) | CSMAR |
| 固定效应 | year | 年度虚拟变量 | CSMAR |
// 数据预处理示例 use "audit_quality.dta", clear gen LNASSET = ln(asset) gen LEV = liability / asset gen ROA = net_income / asset gen GROWTH = (rev - L.rev) / L.rev gen BM = equity / market_value gen AGE = year - ipo_year2. PSM实战:从理论到Stata实现
2.1 倾向得分估计
采用probit模型估计企业选择四大审计的概率:
global indepvar LNASSET LEV ROA GROWTH BM AGE global fixvar i.indcode i.year probit BIG4 $indepvar $fixvar, vce(cluster stkcd) predict pscore, p关键诊断指标:
- 模型拟合:Pseudo R²不宜过高(>0.3可能预示协变量预测力过强)
- 共同支撑域:pscore分布需有足够重叠区域
2.2 匹配执行与质量检验
采用1:2有放回最近邻匹配,设置卡尺为0.03:
psmatch2 BIG4, pscore(pscore) outcome(ABSACC RESTATE) /// common logit neighbor(2) caliper(0.03) pstest $indepvar, both graph psgraph匹配质量检验重点关注:
- 标准化偏差:匹配后各变量偏差应<5%
- t检验:匹配后组间差异应不显著
- 共同支撑域:处理组与控制组的pscore分布重叠情况
3. 结果解读:因果效应的经济学含义
3.1 匹配样本回归分析
// 全样本回归 reg ABSACC BIG4 $indepvar $fixvar, cluster(stkcd) est store ABSACC_F // 匹配样本回归 reg ABSACC BIG4 $indepvar $fixvar [fweight=_weight], cluster(stkcd) est store ABSACC_M // 结果对比 esttab ABSACC_F ABSACC_M, /// mtitle("Full Sample" "Matched Sample") /// b(%6.3f) se(%6.3f) nogap /// star(* 0.1 ** 0.05 *** 0.01)典型结果可能显示:
| 变量 | 全样本系数 | 匹配样本系数 |
|---|---|---|
| BIG4 | -0.012*** | -0.007** |
| LNASSET | -0.003** | -0.002 |
| LEV | 0.018*** | 0.015** |
| ROA | -0.025*** | -0.022*** |
3.2 经济显著性评估
假设匹配样本中BIG4系数为-0.007:
- 意味着四大审计使盈余管理程度降低0.7个百分点
- 以样本均值ABSACC=0.05计算,相当于降低14%
- 对于资产100亿的企业,约等于减少700万盈余操纵
4. 稳健性检验与陷阱规避
4.1 多维度稳健性检验
匹配方法对比:
- 核匹配(kernel)
- 局部线性匹配(local linear)
- 马氏距离匹配(mahalanobis)
协变量调整:
- 加入董事会特征变量
- 加入地区经济发展水平
样本筛选:
- 剔除金融行业
- 仅保留A股主板公司
4.2 常见陷阱警示
- "过度匹配"陷阱:当协变量中包含结果变量决定因素时,可能低估真实效应
- "虚假平衡"陷阱:匹配后平衡性检验通过,但遗漏关键变量
- "外推风险":共同支撑域外的处理组样本效应可能不同
// 不同匹配方法对比示例 psmatch2 BIG4, pscore(pscore) kernel bw(0.06) common reg ABSACC BIG4 $indepvar $fixvar [fweight=_weight], cluster(stkcd) psmatch2 BIG4, pscore(pscore) radius(0.01) common reg ABSACC BIG4 $indepvar $fixvar [fweight=_weight], cluster(stkcd)5. 研究启示与应用边界
5.1 实务启示
- 对于拟上市企业:选择四大审计可能传递质量信号,但需考虑成本收益
- 对于监管机构:可识别审计质量系统性差异,优化监管资源配置
- 对于投资者:应穿透审计机构光环,结合企业基本面判断
5.2 方法论边界
PSM在本研究中的适用性基于:
- 可观测选择机制:企业选择四大审计主要取决于可观测特征
- 无后期干扰:审计机构选择后不存在其他干预因素
- 稳定单元处理值:某企业选择四大不影响其他企业的审计结果
重要提醒:PSM不能解决由审计师专业能力、职业道德等不可观测因素引起的内生性问题