基于大语言模型的政治角色代理立法系统模拟与投票预测研究

分享自：
基于大语言模型的政治角色代理立法系统模拟与投票预测研究

期刊:association for the advancement of artificial intelligence
类型a：这篇文档报告了一项原创研究，以下是基于该研究的学术报告。
主要作者与机构及发表信息
 本研究的主要作者包括Hao Li、Ruoyuan Gong和Hao Jiang（通讯作者），他们均来自武汉大学（Wuhan University, Wuhan, 430072 China）。这项研究预计于2025年在人工智能促进协会（Association for the Advancement of Artificial Intelligence, AAAI）的相关出版物中发表。
研究背景
 本研究属于定量政治学与计算机科学交叉领域，旨在通过建模政治行为者（political actors）来预测立法投票（roll call votes）。近年来，随着大数据和机器学习技术的发展，预测立法投票已成为政治科学研究的重要方向之一。目前广泛使用的嵌入式方法（embedding-based methods）通过对立法者和法案进行向量化表示，从而预测立法行为。然而，这些方法存在以下局限性：
 1. 预定义特征的限制：模型训练依赖于手动预定义的特征，难以自然扩展到新的、未训练的关系。
 2. 对大规模训练数据的需求：大多数模型需要大量数据才能达到最佳性能，但在现实场景中（如新当选立法者的投票预测）难以满足这一需求。
 3. 预测结果的可解释性不足：基于嵌入的预测缺乏人类可理解的解释能力。
为了解决上述问题，本研究引入了基于大型语言模型（large language models, LLMs）的政治行为者代理框架（Political Actor Agent, PAA）。通过角色扮演架构（role-playing architecture）和立法系统的模拟，PAA提供了一个可扩展且可解释的范式，用于预测立法投票并揭示决策背后的逻辑。
研究工作流程
 本研究的工作流程主要包括以下几个步骤：
数据收集与处理
 研究团队从维基百科和美国国会立法记录中收集了相关数据，包括立法者的个人信息、选区详情、法案发起与投票记录等。此外，还整合了外部知识图谱（heterogeneous information graphs）以丰富数据来源。
代理配置模块（Profile Construction Module）
 在此模块中，每个立法者被赋予一个可扩展的个人档案（profile）。该档案包含以下内容：
个人信息（Personal Information）：如党派归属、委员会成员身份、教育背景等。
 
选区详情（Constituency Details）：如选区家庭收入中位数、城乡人口分布等。
 
法案发起活动（Sponsorship Activity）：历史法案发起记录。
 
投票记录（Voting Records）：立法者的过往投票行为。
 
多视角规划模块（Multi-View Planning Module）
 受政治学理论启发，研究团队将投票决策分解为三种主要视角：
受托人视角（Trustee View）：立法者基于专业知识和政策判断做出决策。
 
委托人视角（Delegate View）：立法者根据选民意愿行事。
 
跟随者视角（Follower View）：立法者追随党派领导的意见。
 
每种视角都设计了相应的提示（prompts），通过LLMs生成决策推理。
模拟立法行动模块（Simulated Legislative Action Module）
 在此模块中，研究团队设计了一种“影响力机制”（influence mechanism），以模拟真实立法过程中的领导者与跟随者之间的互动。具体而言：
领导者代理（Leader Agents）：包括议长（Speaker of the House）、多数党领袖（Republican/Democratic Leader）、委员会主席（Committee Chair）等。
 
影响力传递：领导者代理首先投票，其他代理根据领导者的决策调整自己的选择。
 
实验设计与数据分析
 研究团队使用第117至118届美国众议院的投票记录进行了全面实验。数据集按时间顺序分为训练集、验证集和测试集，比例分别为20%-40%-40%、40%-30%-30%和60%-20%-20%。实验对比了PAA与五种基线方法（baseline methods），包括理想点模型（Ideal-Vector）、基于图神经网络的方法（LSTM+GCN、Vote+MTL、PAR、UPPAM）等。评估指标包括准确率（Accuracy）和宏平均F1分数（Macro-Averaged F1 Score）。
主要结果
 实验结果表明，PAA在所有数据集划分上均显著优于现有方法。具体而言：
整体性能
 PAA在split244、split433和split622数据集上的准确率分别达到了91.8%、91.3%和92.1%，宏平均F1分数分别为92.2%、91.7%和93.0%。相比之下，传统嵌入式方法的性能随训练数据减少而迅速下降，而PAA则保持稳定。
模块贡献分析
 通过消融实验（ablation studies），研究团队发现各模块对PAA性能的影响程度不同：
代理配置模块对性能影响最大，尤其是投票记录和个人信息部分。
 
多视角规划模块和模拟立法行动模块也对性能有显著贡献，但影响相对较小。
 
可解释性分析
 PAA能够从多个视角解释其投票预测结果。例如，在一个案例中，代理从受托人视角、委托人视角和跟随者视角分别阐述了支持某军事纪念币法案的理由，并结合事实证据说明了决策逻辑。
一致性分析
 研究团队随机选择了50个立法者-法案对进行重复实验，结果显示PAA具有较高的预测一致性。尽管大型语言模型可能存在幻觉现象（hallucination），但PAA通过多次实验有效缓解了这一问题。
结论与价值
 本研究的主要结论如下：
 1. 科学价值
 PAA提出了一种基于代理的新型框架，克服了传统嵌入式方法的局限性，为政治行为者建模提供了更准确和可解释的解决方案。
应用价值
 PAA不仅适用于美国立法者的投票预测，还可扩展到其他国家的政治行为者建模。此外，该框架为社会科学研究中复杂决策行为的模拟提供了新思路。
 
研究亮点
 1. 创新性方法
 PAA首次将大型语言模型应用于政治行为者建模，结合角色扮演架构和影响力机制，实现了高精度和高可解释性的投票预测。
模块化设计
 PAA的模块化设计使其能够灵活适应不同的数据条件和任务需求，为未来研究提供了良好的扩展性。
跨学科意义
 本研究结合了政治学、计算机科学和人工智能领域的前沿技术，展示了跨学科合作的巨大潜力。
其他有价值内容
 研究团队指出，PAA仍存在一些局限性，例如对社交媒体评论和新闻等多样化数据源的支持不足，以及在任务多样性方面的扩展空间有限。未来研究计划进一步整合实时社交媒体分析和全球新闻事件，以增强PAA的预测能力，并设计更多通用机制以支持不同的下游任务。
以上是基于文档内容生成的学术报告。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问