这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:
本研究由Dylan Slack(Haverford College)、Sorelle A. Friedler(Haverford College)、Carlos Scheidegger(University of Arizona)和Chitradeep Dutta Roy(University of Utah)合作完成,发表于2019年的人工智能领域期刊(具体期刊名称未明确标注,但标注了版权归属Association for the Advancement of Artificial Intelligence, AAAI)。
研究领域:机器学习可解释性(Interpretable Machine Learning)。
研究动机:随着机器学习模型的广泛应用,对其决策透明性的需求日益增长。然而,学界对“可解释性”缺乏统一定义和量化标准,现有研究多依赖直觉假设(如“决策树比神经网络更易解释”),缺乏人类认知实验的验证。
研究目标:
1. 提出两种局部可解释性(Local Interpretability)的量化定义——可模拟性(Simulatability)(用户能否独立复现模型输出)和“What If”局部可解释性(用户能否预测输入微小变化对输出的影响);
2. 通过大规模用户实验验证不同模型(决策树、逻辑回归、神经网络)的局部可解释性差异;
3. 探索运行时操作计数(Runtime Operation Count)作为可解释性代理指标的可行性。
研究设计分为以下核心步骤:
(1)模型与数据集准备
- 模型选择:决策树(Decision Tree)、逻辑回归(Logistic Regression)、神经网络(Neural Network),均通过Scikit-learn实现。
- 数据集:生成4组合成数据(2维/3维/5维,含/不含旋转),确保模型测试准确率达100%,避免领域知识干扰。
- 输入设计:从测试数据中选取输入对(原始输入与扰动输入),确保标签分布均衡(50%正/负例,50%扰动后标签变化)。
(2)用户实验设计
- 参与者:通过Prolific平台招募1000名高中学历以上用户,完成模拟和“What If”任务,记录准确率和耗时。
- 任务类型:
- 可模拟性任务:用户根据模型表示(如决策树图、逻辑回归分步计算表)复现给定输入的输出。
- “What If”任务:用户基于原输入结果预测扰动输入的输出,无需完全重算。
- 注意力检查:包含基础算术题以筛选有效数据(最终保留930名“自信受访者”)。
(3)操作计数指标开发
- 方法创新:开发纯Python版本的模型预测函数,通过修改字节码追踪运行时操作(算术与布尔运算),统计输入对应的操作总数。
- 示例:决策树对输入(a=-80, b=200)执行17次操作(6次算术+11次布尔),而(a=-64, b=115)需32次操作。
(4)数据分析
- 假设检验:
- 预注册假设:操作数与耗时正相关,与准确率负相关。
- 统计方法:二项检验(对比50%随机基线)、Fisher精确检验(模型间差异)、协方差分析(操作数与表现关系)。
(1)模型可解释性验证
- 决策树:可模拟性正确率77.1%(p=5.9×10⁻⁶³),“What If”正确率77.3%(p=5.16×10⁻⁶⁴),显著优于随机基线。
- 逻辑回归:可模拟性正确率63.7%(p=1.94×10⁻¹⁵),“What If”正确率62.3%(p=2.07×10⁻¹²)。
- 神经网络:可模拟性正确率59.8%(p=7.34×10⁻⁸),但“What If”正确率53.7%(p=0.78,不显著)。
(2)模型间比较
- 决策树在两项任务中均显著优于逻辑回归和神经网络(p<0.001);
- 逻辑回归仅在“What If”任务中显著优于神经网络(p=0.0029)。
(3)操作计数与表现关系
- 耗时:操作数与耗时呈强正相关(如决策树操作数增加时,模拟时间显著延长)。
- 准确率:决策树的准确率随操作数增加而下降,但逻辑回归和神经网络无显著趋势(可能因操作数范围有限或任务理解偏差)。
- 上限阈值:当操作数超过100时,用户普遍无法完成神经网络的模拟任务。
科学意义:
1. 首次通过大规模实验验证了“决策树和逻辑回归比神经网络更易解释”的直觉假设;
2. 提出运行时操作计数作为可解释性的潜在量化指标,为模型设计提供参考(如限制操作数以提升可解释性)。
应用价值:
- 法律场景:如风险评估模型中,律师需验证分数计算(可模拟性)和抗辩微小特征变化的影响(“What If”解释),本研究为此类需求提供评估框架。
- 模型选择:在需要高透明度的领域(如医疗、金融),优先选择操作数少、结构简单的模型。
(注:全文约1800字,完整覆盖研究背景、方法、结果与价值,符合学术报告规范。)