分享自:

基于纳什讨价还价博弈与遗憾理论的群体决策中策略性操纵行为分析

期刊:IEEE Transactions on Systems, Man, and Cybernetics: SystemsDOI:10.1109/TSMC.2025.3582734

关于基于纳什议价博弈和遗憾理论分析群体决策中策略性操纵行为的学术报告

本文旨在向研究者介绍由Yufeng Shen、Xueling Ma、Yukun Bao、Zeshui Xu及Jianming Zhan共同完成,并于2025年10月发表在IEEE Transactions on Systems, Man, and Cybernetics: Systems(第55卷第10期)上的一项原创性研究。该研究隶属于管理科学与系统工程领域,聚焦于群体决策(Group Decision-Making, GDM)中的共识达成过程(Consensus Reaching Process, CRP)。

一、 研究背景与目的 群体决策是整合多方知识经验、提升决策科学性与可接受性的关键手段,广泛应用于管理、经济及社会科学领域。然而,在共识达成过程中,决策参与者(Decision-Makers, DMs)出于自利动机的策略性操纵行为(Strategic Manipulative Behaviors)——主要包括意见操纵(Opinion Manipulation)和权重操纵(Weight Manipulation)——严重损害了决策过程的公平性与结果的有效性,导致结果偏离预期。尽管已有大量研究关注共识模型的理论构建,但在有效预防此类操纵行为方面仍存在显著不足。同时,现有的共识模型(如最小调整共识模型,Minimum Adjustment Consensus Model, MACM)大多侧重于群体层面的成本优化(如总调整量最小),而忽视了反馈建议对个体决策者的可接受性,且未能充分考虑决策者在调整过程中的心理行为差异(如风险规避、损失敏感性)。这些局限不仅可能引发决策者对“被操纵”的不满,也使得模型在实践中的灵活性和适用性受限。

为此,本研究旨在解决三个核心问题:1)如何有效预防群体决策中的策略性操纵行为?2)如何刻画决策者在共识达成过程中的心理行为?3)如何设计高效且公平的共识机制?为实现这些目标,研究创新性地将博弈论中的纳什议价(Nash Bargaining, NB)解与合作博弈思想,与行为决策理论中的遗憾理论(Regret Theory)相结合,提出了一套全新的群体决策框架与优化方法。

二、 研究流程与方法详述 本研究构建了一个包含操纵行为预防、共识调整分配和最终选择的三阶段框架。其核心流程与方法详述如下:

第一阶段:策略性操纵行为的分析与预防 本阶段首先对两类操纵行为进行了精确定义与建模分析,并提出了相应的预防机制。 1. 意见操纵的分析与管理:研究指出,传统的MACM可能推荐超出决策者初始意见与群体意见之间范围的调整建议,这将被感知为操纵(定义5)。为防止此情况,研究在MACM中引入了约束条件(c),将建议调整意见 p̄k_ij 限制在[min(pk_ij, pc_ij), max(pk_ij, pc_ij)]区间内,从而构建了能防止不合理意见修改的最优共识调整模型(模型(11))。 2. 权重操纵的分析与管理:这是本研究的重点创新。权重操纵指决策者通过策略性调整自身权重(影响力)来使最终排序结果更接近个人偏好。 * 操纵权重计算:研究构建了一个线性规划模型(模型(15))。该模型为每个决策者ek求解其能实现个人偏好排序与群体排序一致所需的最小“操纵权重” wk*_k。此权重是其在非合作情境下为实现私利所需的最小影响力阈值。 * 风险系数定义:基于操纵权重与初始权重的差距,定义了决策者的操纵风险系数 ηk(公式(16))。差距越小,说明该决策者越容易通过小幅权重调整操纵结果,其风险系数越高。 * 权重修正机制:为抑制操纵风险,研究没有直接采用基于一致性的初始权重,而是提出了一种基于纳什议价的权重修正方法。通过构建一个不对称纳什乘积模型(模型(17)),将风险系数 ηk 的倒数转化为议价能力。在此模型中,决策者在一个扩展的议价空间内(初始权重 w0_k + b)进行谈判,目标是最大化所有决策者“让步量”(w0_k + b - wk)的加权乘积。模型约束确保了修正后权重顺序与初始一致性权重顺序一致(保持相对重要性),且调整幅度与操纵风险正相关(高风险者权重被削减更多)。求解此模型得到的修正权重向量 w,能有效拉开与操纵权重的距离,从根源上降低权重操纵的可行性。

第二阶段:基于遗憾理论与纳什议价的最优共识调整分配机制 在获得修正权重和防止意见操纵的MACM框架(模型(18),由模型(11)结合修正权重w得到)后,研究解决了MACM中常见的“解不唯一”问题(即存在多个总调整量相同但个体调整分配不同的方案)。研究从合作博弈视角,将总调整量的分配视为一个谈判问题。 1. 心理效用建模(遗憾理论的应用):研究引入遗憾理论来刻画决策者在谈判中的风险态度。首先,定义了一个基于与群体意见距离的效用函数 v(pk)(定义6)。然后,构建了一个“遗憾-欣喜”值函数 r(pk, p)(定义7),其中参考点 p 设定为群体偏好矩阵 pc。该函数衡量了决策者选择当前意见 pk 而非理想群体意见 pc 时的心理感受(遗憾或欣喜)。调整前的遗憾值 r(pk, pc) 被设定为谈判的“威胁点”(disagreement point)。 2. 纳什议价共识模型构建:研究构建了基于遗憾理论的纳什议价共识模型(模型(23)及其不对称扩展形式模型(25))。该模型的目标是最大化所有决策者“遗憾减少量”(即调整后遗憾值 r(p̄k, p̄c) 与威胁点遗憾值 r(pk, pc) 之差)的乘积(纳什乘积)。其中,每个决策者的议价能力 τk 由其自身的一致性水平 cik 和共识水平 clk 共同决定(公式(24)),使得表现更好的决策者在谈判中拥有更大话语权。模型在约束条件中固定了第一阶段求得的最小总调整量 ta,确保了群体最优性。通过求解此模型,可以得到一组在固定总成本下,综合考虑了心理公平性和个体差异性的最优个体共识调整量分配方案 ∗_k。 3. 优化目标补充(三种新方法):由于固定个体调整量 ∗_k 后,在偏好矩阵元素层面仍可能存在多个调整方案,研究进一步提出了三种优化方法供决策者根据实际需求选择: * 目标1(模型(27)):最大化最小共识水平(Max-min consensus level),旨在提升群体中最薄弱环节的共识度。 * 目标2(模型(28)):最大化最小一致性水平(Max-min consistency level),旨在确保所有决策者调整后的意见表达具有更高的内在逻辑一致性。 * 目标3(模型(29)):最小化总调整元素数量(Minimize the total number of adjusted elements),旨在以最少的改动(即最大的意见稳定性)达成共识,适用于资源或时间受限的场景。

第三阶段:案例研究与对比分析 研究通过一个医疗养老服务评价的数值算例(4位决策者,5个备选方案),完整演示了所提算法(算法1)的实施流程:从计算初始权重、修正权重、预防操纵,到运用遗憾理论与NB模型分配调整量,再到应用三种方法之一生成具体反馈建议,最后进行方案排序。此外,研究还进行了系统的参数分析与模型对比。 1. 参数分析:包括议价空间参数b的选择策略(建议基于最大与最小操纵风险差距自适应确定)、以及遗憾理论参数(风险厌恶系数σ和遗憾规避系数δ)的灵敏度分析。通过设定“冒险型”(σ=0.88, δ=0.19)、“平衡型”(σ=0.92, δ=0.37)和“谨慎型”(σ=0.96, δ=0.45)三组参数,验证了模型能够有效刻画不同人格特质决策者在谈判中的风险偏好差异。 2. 模型对比:通过定性(比较研究目标、操纵行为处理、共识机制设计等)和定量(比较不同共识模型在总调整量、共识水平、一致性水平等指标上的表现)两方面的对比,凸显了本研究方法的综合优势:既能有效抑制操纵、保证公平,又在各项性能指标上表现优异,且提供了针对不同决策需求的灵活性。

三、 主要研究结果 1. 操纵预防有效性:权重修正机制的结果显示,初始基于一致性的权重分配下,部分决策者(如e2, e3)仅需微小增幅即可实现排序操纵,证实了初始方法存在高风险。修正后的权重显著降低了高风险决策者的权重,且修正后权重与其对应的(重新计算的)操纵权重之间保持了显著的“安全距离”,证明了该方法抑制权重操纵的有效性与鲁棒性。 2. 共识调整分配的公平性与合理性:在算例中,应用新框架后,每位决策者的遗憾水平在共识调整后均有所降低。虽然由于解空间的离散性,遗憾减少量并不严格与议价能力成比例,但该方案在保证群体最小总调整量的前提下,提供了一种相对公平的个体调整分配。 3. 模型性能优越性:对比实验表明,本研究提出的三种新方法(模型(27)-(29))在各自的目标上(最大化最低共识/一致性、最小化调整元素数)表现突出。与现有主流共识模型相比,本研究的综合框架不仅在防止操纵和刻画心理行为方面具有独特性,在总调整成本、达成共识的效率等方面也具备竞争力或可根据需求进行优化。

四、 研究结论与价值 本研究成功构建了一个集成纳什议价博弈与遗憾理论的群体决策新框架。其主要结论与价值在于: * 理论贡献: * 提出了首个从排序视角分析并抑制权重操纵行为的方法,通过计算操纵权重、定义风险系数,并利用不对称纳什议价模型进行权重修正,为防范此类操纵提供了新颖且有效的理论工具。 * 创新地将遗憾理论引入共识调整的效用描述,构建了基于“遗憾-欣喜”值的议价支付函数,使模型能够更真实地反映决策者在调整过程中的风险规避与损失敏感心理。 * 针对MACM解不唯一和分配公平性问题,提出了一个基于合作博弈(NB解)的共识调整分配机制,该机制得到的方案同时满足个体理性、群体最优性、公平性和帕累托最优性。 * 设计了三种具有不同优化侧重点的共识调整方案确定方法,增强了模型在实际应用中的灵活性与适应性。 * 应用价值:所提出的完整算法流程(算法1)为实际中复杂的群体决策场景(如项目评审、资源分配、绩效评估等)提供了可操作的工具。它不仅能帮助协调者( moderator )以更公平、更易被接受的方式引导共识形成,还能通过机制设计主动降低参与者策略性博弈的空间,提升决策过程的公正性和结果的质量。

五、 研究亮点与创新 1. 研究视角新颖:首次系统地将权重操纵行为量化为“实现个人排序所需的最小权重增量”,并以此为基础构建抑制机制,突破了以往研究主要关注提供客观权重计算方法而未能根治操纵诱因的局限。 2. 多理论深度融合:创造性地将合作博弈论(纳什议价)与行为决策理论(遗憾理论)有机结合,用于解决共识调整分配问题。这种融合不仅考虑了利益分配的博弈均衡,还深入刻画了决策者的有限理性心理,使模型更贴近现实。 3. 方法体系的系统性与灵活性:研究并非提出单一模型,而是构建了一个从操纵预防、心理刻画、公平分配到多目标优化的完整方法体系。提供的三种备选优化方法允许根据实际决策的侧重点(如追求高度一致、保持意见可靠性或最小化改动)进行定制,展示了强大的可扩展性。 4. 严谨的实验验证:除了常规的算例演示,研究还包含了深入的参数敏感性分析(如议价空间b、遗憾理论参数)和全面的对比实验,从多个维度验证了所提方法的优越性、鲁棒性和实用性。

六、 其他有价值内容 研究在附录中提供了相关定理的证明、模型解释以及示例,增强了论文的理论严谨性和可读性。同时,文章在讨论部分也坦诚指出了当前框架的局限,例如尚未探索如何自动识别决策者的人格类型以更精准地设定遗憾理论参数,这为未来的研究指明了方向,包括继续探索NB方法在GDM中的应用、开发决策者特质识别方法以及构建可解释性更强的群体谈判模型等。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com