分享自:

基于大语言模型的政治角色代理立法系统模拟与投票预测研究

期刊:association for the advancement of artificial intelligence

类型a:这篇文档报告了一项原创研究,以下是基于该研究的学术报告。


主要作者与机构及发表信息
本研究的主要作者包括Hao Li、Ruoyuan Gong和Hao Jiang(通讯作者),他们均来自武汉大学(Wuhan University, Wuhan, 430072 China)。这项研究预计于2025年在人工智能促进协会(Association for the Advancement of Artificial Intelligence, AAAI)的相关出版物中发表。

研究背景
本研究属于定量政治学与计算机科学交叉领域,旨在通过建模政治行为者(political actors)来预测立法投票(roll call votes)。近年来,随着大数据和机器学习技术的发展,预测立法投票已成为政治科学研究的重要方向之一。目前广泛使用的嵌入式方法(embedding-based methods)通过对立法者和法案进行向量化表示,从而预测立法行为。然而,这些方法存在以下局限性:
1. 预定义特征的限制:模型训练依赖于手动预定义的特征,难以自然扩展到新的、未训练的关系。
2. 对大规模训练数据的需求:大多数模型需要大量数据才能达到最佳性能,但在现实场景中(如新当选立法者的投票预测)难以满足这一需求。
3. 预测结果的可解释性不足:基于嵌入的预测缺乏人类可理解的解释能力。

为了解决上述问题,本研究引入了基于大型语言模型(large language models, LLMs)的政治行为者代理框架(Political Actor Agent, PAA)。通过角色扮演架构(role-playing architecture)和立法系统的模拟,PAA提供了一个可扩展且可解释的范式,用于预测立法投票并揭示决策背后的逻辑。

研究工作流程
本研究的工作流程主要包括以下几个步骤:

  1. 数据收集与处理
    研究团队从维基百科和美国国会立法记录中收集了相关数据,包括立法者的个人信息、选区详情、法案发起与投票记录等。此外,还整合了外部知识图谱(heterogeneous information graphs)以丰富数据来源。

  2. 代理配置模块(Profile Construction Module)
    在此模块中,每个立法者被赋予一个可扩展的个人档案(profile)。该档案包含以下内容:

    • 个人信息(Personal Information):如党派归属、委员会成员身份、教育背景等。
    • 选区详情(Constituency Details):如选区家庭收入中位数、城乡人口分布等。
    • 法案发起活动(Sponsorship Activity):历史法案发起记录。
    • 投票记录(Voting Records):立法者的过往投票行为。
  3. 多视角规划模块(Multi-View Planning Module)
    受政治学理论启发,研究团队将投票决策分解为三种主要视角:

    • 受托人视角(Trustee View):立法者基于专业知识和政策判断做出决策。
    • 委托人视角(Delegate View):立法者根据选民意愿行事。
    • 跟随者视角(Follower View):立法者追随党派领导的意见。

每种视角都设计了相应的提示(prompts),通过LLMs生成决策推理。

  1. 模拟立法行动模块(Simulated Legislative Action Module)
    在此模块中,研究团队设计了一种“影响力机制”(influence mechanism),以模拟真实立法过程中的领导者与跟随者之间的互动。具体而言:

    • 领导者代理(Leader Agents):包括议长(Speaker of the House)、多数党领袖(Republican/Democratic Leader)、委员会主席(Committee Chair)等。
    • 影响力传递:领导者代理首先投票,其他代理根据领导者的决策调整自己的选择。
  2. 实验设计与数据分析
    研究团队使用第117至118届美国众议院的投票记录进行了全面实验。数据集按时间顺序分为训练集、验证集和测试集,比例分别为20%-40%-40%、40%-30%-30%和60%-20%-20%。实验对比了PAA与五种基线方法(baseline methods),包括理想点模型(Ideal-Vector)、基于图神经网络的方法(LSTM+GCN、Vote+MTL、PAR、UPPAM)等。评估指标包括准确率(Accuracy)和宏平均F1分数(Macro-Averaged F1 Score)。

主要结果
实验结果表明,PAA在所有数据集划分上均显著优于现有方法。具体而言:

  1. 整体性能
    PAA在split244、split433和split622数据集上的准确率分别达到了91.8%、91.3%和92.1%,宏平均F1分数分别为92.2%、91.7%和93.0%。相比之下,传统嵌入式方法的性能随训练数据减少而迅速下降,而PAA则保持稳定。

  2. 模块贡献分析
    通过消融实验(ablation studies),研究团队发现各模块对PAA性能的影响程度不同:

    • 代理配置模块对性能影响最大,尤其是投票记录和个人信息部分。
    • 多视角规划模块和模拟立法行动模块也对性能有显著贡献,但影响相对较小。
  3. 可解释性分析
    PAA能够从多个视角解释其投票预测结果。例如,在一个案例中,代理从受托人视角、委托人视角和跟随者视角分别阐述了支持某军事纪念币法案的理由,并结合事实证据说明了决策逻辑。

  4. 一致性分析
    研究团队随机选择了50个立法者-法案对进行重复实验,结果显示PAA具有较高的预测一致性。尽管大型语言模型可能存在幻觉现象(hallucination),但PAA通过多次实验有效缓解了这一问题。

结论与价值
本研究的主要结论如下:
1. 科学价值
PAA提出了一种基于代理的新型框架,克服了传统嵌入式方法的局限性,为政治行为者建模提供了更准确和可解释的解决方案。

  1. 应用价值
    PAA不仅适用于美国立法者的投票预测,还可扩展到其他国家的政治行为者建模。此外,该框架为社会科学研究中复杂决策行为的模拟提供了新思路。

研究亮点
1. 创新性方法
PAA首次将大型语言模型应用于政治行为者建模,结合角色扮演架构和影响力机制,实现了高精度和高可解释性的投票预测。

  1. 模块化设计
    PAA的模块化设计使其能够灵活适应不同的数据条件和任务需求,为未来研究提供了良好的扩展性。

  2. 跨学科意义
    本研究结合了政治学、计算机科学和人工智能领域的前沿技术,展示了跨学科合作的巨大潜力。

其他有价值内容
研究团队指出,PAA仍存在一些局限性,例如对社交媒体评论和新闻等多样化数据源的支持不足,以及在任务多样性方面的扩展空间有限。未来研究计划进一步整合实时社交媒体分析和全球新闻事件,以增强PAA的预测能力,并设计更多通用机制以支持不同的下游任务。


以上是基于文档内容生成的学术报告。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com