基于随机森林与SHAP分析的网约车司机算法厌恶情绪驱动因素及应对策略研究

分享自：
基于随机森林与SHAP分析的网约车司机算法厌恶情绪驱动因素及应对策略研究

期刊:人民公交DOI:10.16857/j.cnki.cn11-5903/u.2026.08.017
关于《基于随机森林模型与shap分析的网约车司机算法厌恶情绪驱动因素及策略研究》的学术研究报告一、 研究作者、机构及发表信息
本研究的主要作者为石卓颖、陶鑫然、赵思翔，均来自东南大学经济管理学院。该研究发表于《人民公交》期刊的2026年08月期。
二、 学术背景与研究目标
本研究属于管理科学与平台经济领域的交叉研究，聚焦于网约车平台的算法治理问题。随着平台经济的兴起，以算法为核心的人工智能技术已深度渗透到网约车等共享经济模式中，通过调度派单、动态定价等手段提升市场效率。然而，算法在带来效率的同时，也引发了“算法厌恶”（Algorithm Aversion）情绪，即平台服务的提供者（司机）因算法决策的不透明、不公或对其不利而产生的不满与对立情绪。这种情绪已导致司机流失、服务质量下降、平台声誉受损等不良后果，对行业的长期健康发展构成威胁。
尽管已有研究关注网约车平台的算法机制争议及司机不满的经济与沟通因素，但多集中于宏观机制讨论，缺乏对司机群体内部异质性及其对算法厌恶情绪差异化影响的微观层面、实证驱动的深入探究。因此，本研究旨在填补这一空白。其核心目标是：运用数据驱动的机器学习方法，深入剖析影响网约车司机算法厌恶情绪的具体驱动因素，识别不同厌恶程度司机群体的特征差异，并基于实证发现，从多维度提出具有针对性的策略建议，以期为缓解司机算法厌恶、优化平台生态治理、推动网约车平台经济的高质量发展提供理论依据与实践参考。
三、 详细研究流程与方法
本研究遵循了一套严谨的从数据收集到模型分析再到策略构建的完整工作流程，主要包括以下四个核心阶段：
数据调研与预处理阶段：
研究样本与数据来源： 研究对象为中国的网约车司机。研究团队通过“线上问卷调研”与“线下访谈”相结合的方式收集数据。调研范围覆盖了江苏、湖南、山西等多个省份的城市，最终获得了共计105份有效问卷结果。样本的基本特征描述显示，受访司机以男性为主（男女比例约9:1），平均年龄约35岁，平均从业时长约3.5年，平均驾龄约15年，符合网约车司机群体的常见画像。
数据处理与检验： 在正式分析前，研究团队对收集的问卷量表数据进行了严格的信度与效度检验。信度检验采用克朗巴哈系数（Cronbach’s α），结果为0.807，表明量表具有较好的内部一致性。效度检验采用KMO（Kaiser-Meyer-Olkin）检验和巴特利特球形检验，KMO值为0.712（大于0.7的标准），p值小于0.01，表明数据适合进行因子分析，问卷结构效度良好。此外，研究还对核心变量进行了描述性统计和斯皮尔曼（Spearman）相关性分析。结果显示，司机对算法的“厌恶情绪”平均分为2.54分（满分5分），“满意度”平均分为2.59分，且两者之间存在显著的负相关关系（相关系数为-0.574，p<0.001），这为后续探究厌恶情绪的驱动因素奠定了逻辑基础。
模型构建与特征重要性分析阶段：
分析方法： 为了探究多个潜在特征（变量）对司机算法厌恶情绪的影响，本研究采用了机器学习中的“随机森林模型”（Random Forest Model）。该模型是一种集成学习算法，通过构建大量决策树并进行投票或平均来提高预测的准确性和稳定性，并能评估各个特征对预测结果的重要性。
实施过程： 研究将105份样本数据按8:2的比例随机划分为训练集（用于构建模型）和测试集（用于验证模型）。模型生成了200棵决策树进行组合与分类。通过运行随机森林模型，研究计算出了各个调查项（特征）对预测司机是否产生算法厌恶情绪的“重要性”排序。
核心发现（此阶段结果）： 分析结果显示，对司机算法厌恶情绪解释力最强的三大特征依次是：1) “算法决策比人类调度更高效”（司机对此观点的认同或否定程度）；2) “算法派单应更优先‘就近原则’但现实并非如此”；3) “乘客故意差评”。这表明，算法本身的决策逻辑（是否真的高效）、算法规则的执行公平性（是否遵循就近原则）以及司乘矛盾（乘客恶意评价）是引发司机算法厌恶的最关键领域。相比之下，如“反馈渠道不够流畅”等平台管理细节问题的解释力相对较弱。
影响机制深度解析阶段：
分析方法： 为了更进一步揭示上述重要特征如何具体影响司机的厌恶情绪（是加剧还是抑制），以及这种影响在不同司机群体中是否存在差异，本研究引入了“SHAP分析”（SHapley Additive exPlanations）。SHAP是一种基于博弈论的解释方法，可以为每一个样本的每一个特征计算一个SHAP值，用以量化该特征对模型预测结果（此处为厌恶情绪程度）的贡献方向和大小。
实施过程： 研究首先根据司机对平台算法厌恶情绪的程度，将全部样本划分为“高厌恶群体”和“低厌恶群体”两类。然后，分别对这两个群体计算各个特征的SHAP值的均值。正值表示该特征会推高模型的预测值（即加剧厌恶情绪），负值则表示会降低预测值（即抑制或缓解厌恶情绪）。通过比较两个群体在不同特征上的SHAP均值模式，可以洞察其内在的影响机制。
核心发现（此阶段结果）： 对于高厌恶群体： 影响最大的五个特征中，仅有“平台抽成过高”的SHAP均值为正，其余四个特征（未明确列出具体名称，但从上下文推断可能涉及对某些现状的容忍或认可）的SHAP均值均为负。这表明，“平台抽成过高”是直接加剧高厌恶群体情绪的核心痛点。而其他几个负值特征，虽然目前表现为抑制厌恶，但可能源于司机暂时的容忍，若不加以优化，未来可能转化为激化矛盾的因素。
对于低厌恶群体： 影响最大的五个特征中，“与平台沟通时，反馈渠道不够流畅”和“平台抽成过高”的SHAP均值均为负值且影响力最强。这意味着，低厌恶群体对抽成过高和沟通不畅问题的容忍度相对更高。而另外三个特征（推测与“派单公平性”、“接单过程体验”及“算法为效率牺牲司机利益”的认知相关）的SHAP均值为正，表明这些问题一旦出现，会显著加剧这部分司机的厌恶情绪。
策略建议形成阶段： 基于随机森林模型识别出的关键因素以及SHAP分析揭示的群体差异化影响机制，研究从三个维度提出了系统性的优化策略。
四、 主要研究结果及其对结论的贡献
本研究通过上述流程，得到了一系列层层递进、相互支撑的研究结果：
首先，描述性统计与相关性检验确认了网约车司机群体中普遍存在算法厌恶情绪（均值2.54，高于理论中值2.5），且这种情绪与对平台的满意度显著负相关。这初步验证了研究问题的现实性与重要性，并为后续寻找驱动因素提供了因变量（厌恶情绪）的明确指向。
接着，随机森林模型的特征重要性排序将抽象的不满情绪具体化为可操作的考察维度。它揭示了引发司机反感的三类核心问题：算法效能质疑、规则执行不公、外部（乘客）行为失范。这一结果将研究焦点从泛泛的“不满”引导至几个具体的、可干预的“病灶”上，为制定精准策略提供了靶点。
然后，SHAP分析的群体比较是本研究的点睛之笔，它极大地深化了对研究问题的理解。结果显示，司机群体并非铁板一块，高厌恶与低厌恶司机对相同问题的敏感度和反应模式存在系统性差异。对于高厌恶司机，经济因素（抽成）是当前的主要矛盾；对于低厌恶司机，他们对经济问题的忍耐力较强，但对流程公平和体验细节更为敏感。这一发现具有关键的政策含义：它表明“一刀切”的平台策略可能效率低下，甚至适得其反。例如，单纯优化派单逻辑可能无法平息高厌恶司机因抽成问题引发的怒火，而对低厌恶司机大谈抽成透明化可能不如改善其接单体验来得有效。这一结果为提出“差异化策略”提供了直接且坚实的实证依据。
最后，综合性的策略建议正是以上述所有分析结果为基础逻辑推导出的。平台运营维度的“优化人工处理优先级”对应了沟通反馈问题；司机知情维度的“提升算法透明度”、“披露抽成比例并设计激励”、“整合司机经验数据优化导航”分别针对了规则不公、核心经济诉求和算法适配性问题；乘客限制维度的“建立乘客信用档案”、“提高差评复核效率”则直接回应了“乘客故意差评”这一重要驱动因素。而贯穿其中的“针对高、低厌恶群体实施差异化策略”的思路，则完全源自SHAP分析的深刻洞见。
五、 研究结论与价值
本研究得出核心结论：网约车司机的算法厌恶情绪由多重因素驱动，且司机群体内部存在显著的异质性。高厌恶群体主要受“平台抽成过高”这一经济因素直接驱动，而低厌恶群体则对“派单公平性”、“接单体验”及“算法为效率牺牲司机利益”等问题更为敏感。因此，平台治理必须摒弃单一思路，转向精细化、差异化的策略。
本研究的价值体现在： * 理论价值： 将机器学习方法（随机森林模型、SHAP分析）系统性地应用于平台经济中的劳动者情绪与行为研究，为理解“算法厌恶”这一新兴现象提供了新颖的、数据驱动的分析框架。研究强调了司机群体异质性的关键作用，丰富了平台治理和算法管理的理论视角。 * 实践价值： 为网约车平台运营商提供了清晰的问题诊断图和 actionable 的策略工具箱。研究明确指出，缓解算法厌恶不能仅停留在“提高透明度”的口号上，而需针对不同司机群体的核心诉求，在抽成机制、派单逻辑、沟通渠道、乘客管理等多个环节进行协同优化，实施“一类一策”的精准治理。 * 政策价值： 为行业监管者提供了参考。研究揭示了平台、司机、乘客三方互动中的具体摩擦点，提示监管政策可能需要关注算法公平性审查、劳动者（司机）权益保护（如收入稳定性、知情权）以及构建健康的司乘信用生态体系。
六、 研究亮点
方法创新： 本研究是较早将随机森林模型与SHAP解释性分析结合，用于量化研究网约车司机算法厌恶情绪驱动因素及群体差异的实证研究。这种方法组合不仅能够识别关键因素，还能深度解析其影响方向和群体异质性，超越了传统的相关性分析或回归分析。
视角聚焦： 研究没有停留在对司机不满情绪的笼统描述上，而是通过数据分析，成功地将司机群体区分为“高厌恶”与“低厌恶”两类，并深入剖析了两类群体截然不同的“痛点”图谱。这种细分视角对于制定有效策略至关重要。
策略的实证基础与系统性： 提出的所有策略建议均严格建立在前期模型分析的实证发现之上，形成了“问题识别（特征重要性）— 机制解析（SHAP群体差异）— 对策提出（三维度差异化策略）”的完整逻辑闭环。策略涵盖了平台运营、司机知情权、乘客行为约束三个相互关联的维度，构成了一个系统性的治理方案。
七、 其他有价值的內容
研究在文献综述部分系统梳理了现有研究，指出算法管理导致的信息不对称、司机谈判权缺失、动态定价与抽成规则不透明、人机沟通低效等是引发司机不满的普遍原因。这为本研究的实证分析提供了理论基础和问题语境。同时，研究也坦承了自身局限，即样本量（105份）和覆盖范围（主要集中在几个省份）有限，这为未来研究通过扩大样本量和地理范围以验证和拓展本研究结论指明了方向。此外，研究团队为本科生，其选题的前沿性和研究设计的规范性，展现了良好的科研潜力。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问