分享自:

为算法可靠性认识论辩护

期刊:european journal for philosophy of scienceDOI:10.1007/s13194-025-00664-2

类型b:学术报告

作者及机构
本文作者为Juan M. Durán,来自荷兰代尔夫特理工大学(Delft University of Technology)的技术、政策与管理学院(Faculty of Technology, Policy and Management)。该论文于2025年6月11日在线发表于《European Journal for Philosophy of Science》(2025年第15卷第37期)。

论文主题
本文题为《In Defense of Reliabilist Epistemology of Algorithms》,旨在为算法的可靠主义认识论(reliabilist epistemology of algorithms)辩护,反驳Paul Humphreys提出的“统计上不显著但严重的错误”(statistically insignificant but serious errors, SIS-errors)对可靠主义的挑战。

主要观点及论据

1. Humphreys对可靠主义的挑战

Humphreys认为,算法的可靠性不仅取决于输出结果的频率(即高准确率),还取决于输出质量。即使算法在绝大多数情况下表现良好,但若出现极端严重的错误(SIS-errors),其可靠性评估应被撤销。例如,在法医面部识别中,若算法错误指认一名无辜者为罪犯,即使错误率极低,这种严重错误仍足以质疑算法的可靠性。

支持论据:
- 以Ariane 5火箭失败为例,其惯性参考系统(IRS)因数值溢出导致灾难性错误,尽管此前运行良好,但单一严重错误足以否定其可靠性。
- 可靠主义(如Goldman的过程可靠主义)通常依赖高频率的正确输出,但Humphreys指出,SIS-errors的严重性可能颠覆频率标准的有效性。

2. 计算可靠主义(Computational Reliabilism, CR)的辩护框架

Durán提出以计算可靠主义(CR)为基础,通过三类可靠性指标(reliability indicators, RI)应对SIS-errors:
- Type1-RI:技术性能指标(如算法精度、容错性、模块化等);
- Type2-RI:科学实践指标(如科学概念的实现、因果模型等);
- Type3-RI:社会建构指标(如科学共同体对算法的接受度、公众辩论等)。

支持论据:
- CR将可靠性视为动态过程,而非静态属性,允许通过调整RI应对错误。例如,面部识别算法在遮挡环境下失效时,可通过更新Type2-RI(如引入遮挡适应性方法)恢复可靠性。
- 以Wu & Zhang的犯罪面部识别研究为例,其高准确率依赖肤浅特征(如嘴部弧度),而忽视犯罪学理论(Type2-RI缺失),导致潜在SIS-errors。

3. 针对随机与系统性SIS-errors的认知条件

Durán提出两类认知条件以维护算法可靠性:
- 反认知坏运气条件(Anti-Epistemic Bad Luck Condition):若SIS-errors是随机的(如单次数值溢出),可通过重复实验验证其偶然性,避免撤销可靠性评估。
- 反击败条款(Anti-Defeat Clause):若SIS-errors源于系统性缺陷(如错误的方法论),则需用更优的RI(如科学理论支持的指标)替代原有指标。例如,用社会犯罪学指标替代面部特征指标。

支持论据:
- NarxCare算法因未考虑宠物用药(Type3-RI缺失)误判患者为药物滥用者,但通过社会辩论(如医生复核病史)可纠正错误并恢复可靠性。
- 条件性可靠性(Conditional Reliability)允许在环境变化时暂停而非撤销评估,如视觉感知在雾天失效,但晴天仍可靠。

4. 算法可靠性的社会维度

Durán强调Type3-RI的核心作用,主张通过科学共同体和公众参与(如参与式技术评估)填补缺失的RI,从而识别并纠正SIS-errors。例如,BenevolentAI发现关节炎药物可治疗COVID-19,尽管对免疫缺陷患者有副作用,但通过医学界的风险权衡,其整体可靠性得以保留。

支持论据:
- Humphreys的“混合情景”(hybrid scenario)支持人机协作的认知模式,与CR的社会建构指标一致。

论文的意义与价值

  1. 理论贡献
  • 为可靠主义认识论提供抵御SIS-errors的系统性框架,扩展了Goldman过程可靠主义的适用范围。
  • 提出“认知坏运气”等新概念,丰富了算法错误的哲学分析工具。
  1. 实践意义
  • 指导算法设计者通过动态RI管理风险,避免因单一错误全盘否定技术价值。
  • 强调跨学科协作(如计算机科学、犯罪学、医学)对算法可靠性的必要性。

亮点

  1. 创新性论点:首次将SIS-errors明确定义为认识论问题,而非单纯技术缺陷。
  2. 方法论整合:结合计算科学、社会科学与哲学,提出多维度可靠性评估体系。
  3. 案例驱动:通过Ariane 5、NarxCare等真实案例,凸显理论的现实解释力。

其他有价值内容

  • 对“透明性”(transparency)作为认识论策略的批判,指出其无法克服算法的不透明性(epistemic opacity)。
  • 呼吁在算法治理中平衡效率与可靠性,避免过度依赖频率主义标准。
上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com