类型b:学术报告
作者及机构
本文作者为Juan M. Durán,来自荷兰代尔夫特理工大学(Delft University of Technology)的技术、政策与管理学院(Faculty of Technology, Policy and Management)。该论文于2025年6月11日在线发表于《European Journal for Philosophy of Science》(2025年第15卷第37期)。
论文主题
本文题为《In Defense of Reliabilist Epistemology of Algorithms》,旨在为算法的可靠主义认识论(reliabilist epistemology of algorithms)辩护,反驳Paul Humphreys提出的“统计上不显著但严重的错误”(statistically insignificant but serious errors, SIS-errors)对可靠主义的挑战。
Humphreys认为,算法的可靠性不仅取决于输出结果的频率(即高准确率),还取决于输出质量。即使算法在绝大多数情况下表现良好,但若出现极端严重的错误(SIS-errors),其可靠性评估应被撤销。例如,在法医面部识别中,若算法错误指认一名无辜者为罪犯,即使错误率极低,这种严重错误仍足以质疑算法的可靠性。
支持论据:
- 以Ariane 5火箭失败为例,其惯性参考系统(IRS)因数值溢出导致灾难性错误,尽管此前运行良好,但单一严重错误足以否定其可靠性。
- 可靠主义(如Goldman的过程可靠主义)通常依赖高频率的正确输出,但Humphreys指出,SIS-errors的严重性可能颠覆频率标准的有效性。
Durán提出以计算可靠主义(CR)为基础,通过三类可靠性指标(reliability indicators, RI)应对SIS-errors:
- Type1-RI:技术性能指标(如算法精度、容错性、模块化等);
- Type2-RI:科学实践指标(如科学概念的实现、因果模型等);
- Type3-RI:社会建构指标(如科学共同体对算法的接受度、公众辩论等)。
支持论据:
- CR将可靠性视为动态过程,而非静态属性,允许通过调整RI应对错误。例如,面部识别算法在遮挡环境下失效时,可通过更新Type2-RI(如引入遮挡适应性方法)恢复可靠性。
- 以Wu & Zhang的犯罪面部识别研究为例,其高准确率依赖肤浅特征(如嘴部弧度),而忽视犯罪学理论(Type2-RI缺失),导致潜在SIS-errors。
Durán提出两类认知条件以维护算法可靠性:
- 反认知坏运气条件(Anti-Epistemic Bad Luck Condition):若SIS-errors是随机的(如单次数值溢出),可通过重复实验验证其偶然性,避免撤销可靠性评估。
- 反击败条款(Anti-Defeat Clause):若SIS-errors源于系统性缺陷(如错误的方法论),则需用更优的RI(如科学理论支持的指标)替代原有指标。例如,用社会犯罪学指标替代面部特征指标。
支持论据:
- NarxCare算法因未考虑宠物用药(Type3-RI缺失)误判患者为药物滥用者,但通过社会辩论(如医生复核病史)可纠正错误并恢复可靠性。
- 条件性可靠性(Conditional Reliability)允许在环境变化时暂停而非撤销评估,如视觉感知在雾天失效,但晴天仍可靠。
Durán强调Type3-RI的核心作用,主张通过科学共同体和公众参与(如参与式技术评估)填补缺失的RI,从而识别并纠正SIS-errors。例如,BenevolentAI发现关节炎药物可治疗COVID-19,尽管对免疫缺陷患者有副作用,但通过医学界的风险权衡,其整体可靠性得以保留。
支持论据:
- Humphreys的“混合情景”(hybrid scenario)支持人机协作的认知模式,与CR的社会建构指标一致。