本文档系Wolfgang Alschner(渥太华大学)、Joost Pauwelyn(日内瓦高级国际关系及发展学院/乔治城大学法学院)和Sergio Puig(亚利桑那大学法学院)三位学者为《国际经济法杂志》(Journal of International Economic Law)2017年第20期组织的一期关于“实证法律研究新前沿”的特刊所撰写的导言。该特刊获得了瑞士国家科学基金的资助,其导言文章题为“数据驱动的国际经济法未来”,旨在系统阐述数据驱动研究方法为国际经济学领域带来的范式变革,界定其核心特征,展示其应用前景,并审慎讨论其面临的挑战与局限。
该导言的核心论点在于,信息技术的进步(包括数据的可获得性、计算能力的指数级增长以及数据分析工具的发展)正在开创国际经济法实证研究的一个新前沿,即“数据驱动”的研究。这种研究方法与传统路径有根本区别,并有望深刻改变学者理解法律现象的方式,甚至影响法律实践本身。
作者们首先梳理了国际经济法领域实证研究的现状。他们指出,传统的实证研究主要由两条主线构成:一是将国际法作为“自变量”,研究条约或司法裁决对行为(如贸易流量、政府政策)的影响;二是将国际法作为“因变量”,探究导致条约产生或裁决结果差异的原因。这些研究多由政治学、经济学等学科的学者主导,运用回归分析等方法,通过构建变量来检验假设。然而,此类方法可能忽略了法律在现实中的复杂性,并且很大程度上忽视了近年来在数字人文、计算社会科学等领域兴起的、以“大数据”为标志的新研究策略。
在此基础上,作者们详细阐述了“数据驱动”研究区别于传统实证研究的三大特征: 1. 数据优先的态度:传统研究通常从理论假设出发进行演绎推理,而数据驱动研究更强调从数据本身出发进行归纳探索,即“让数据自己说话”。这在理论薄弱或未充分发展的领域具有巨大潜力,能够帮助研究者发现意想不到的模式。例如,通过分析近600份美国与土著部落的条约文本,Spirling的研究发现,条约内容随时间推移变得更为严苛,这主要归因于美国议价能力的增强,而非此前学界猜测的制度变更。 2. 研究全部可用数据,而非样本:过去由于人工编码和分析的限制,研究者不得不依赖样本或替代品(如示范条约)进行推断,这可能导致选择偏差或错误概括。如今,借助现代计算技术,研究者能够分析所有可获得的投资条约、世贸组织报告中的所有交叉引用,或所有投资仲裁员之间的联系。使用“全体数据”能更准确地描绘法律图景,并揭示仅在聚合层面才能显现的细节与模式。网络分析和文本即数据(text-as-data)正是用于揭示这些潜在模式的利器。 3. 依赖计算而非阅读或计数:数据驱动研究极大地依赖计算机和计算机科学。这带来了两个转变:一是将许多过去由研究助理完成的计数、分类任务自动化,从而更快、更廉价地处理海量信息,甚至完成人类难以完成的任务(如比较数百份优惠贸易协定与WTO协议的文本相似性)。二是计算机在整个研究周期(从网络爬取收集数据,到使用编程语言分析,再到通过专用网站和可视化呈现结果)中的作用日益核心。当然,人类研究者的角色并未被取代,特别是在决定研究方向、选择方法、解读结果等方面。对于某些模糊或无法自动化的任务,传统的人工编码方法仍有其价值。
随后,文章重点展示了数据驱动研究在国际经济法领域的三大应用前景: 1. 探索性与描述性研究:这包括揭露隐藏模式、破除固有迷思和量化抽象议题。 * 揭露模式:例如,Alschner和Skougarevskiy利用文本相似性度量,追踪了投资条约网络中法律一致性、创新与扩散的趋势,发现《跨太平洋伙伴关系协定》投资章节的81%内容复制自美国之前的贸易协定。Puig的网络分析则揭示了ICSID仲裁员形成了一个由少数精英和重复仲裁员主导的紧密职业网络。 * 破除迷思:例如,Pelc利用WTO裁决的引用网络分析,证明那些公开反对判例约束力的国家,其申诉行为恰恰是为了建立有利的先例。Alschner通过自动特征编码发现,与惯常看法相反,仲裁案件和巨额索赔并未直接导致投资条约设计的根本改变,国家更多地是在根据仲裁案例法的趋势对条约进行渐进式调整。本期特刊中,Elsig等人通过文本相似性分析,指出优惠贸易协定中对WTO协议的引用和纳入实际上在增加,挑战了PTAs与WTO是相互竞争之规范制定场所的流行观点。 * 量化抽象现象:例如,Creamer和Godzimirska利用WTO成员在争端解决机构会议上的发言,来量化衡量成员对WTO司法机构合法性的看法。本期特刊中,Derlén和Lindholm则探讨了如何利用案件在引用网络中的位置(网络分析指标)来衡量司法裁决的重要性。 2. 因果推断与预测:大数据和新的分析方法为因果研究提供了新变量,并为预测打开了大门。 * 因果推断:例如,本期特刊中,Daku和Pelc将当事方提交材料与上诉机构报告之间的文本相似性作为衡量前者对司法规则制定影响力的代理变量,发现法律能力较弱的WTO成员对案例法的影响也较小。Broude等人则创建了一个新的指数来衡量国际投资协定中东道国的监管空间,并将其作为因变量来探究条约设计相似性的驱动因素。 * 预测与法律科技应用:作者预测,人工智能算法未来可能被用于预测贸易和投资争端的结果,甚至自动生成条约文本。Alschner和Skougarevskiy已尝试训练递归神经网络来基于用户定义的标准自动生成投资条约草案,这可能有助于在谈判中平衡双方力量,或为多边谈判创建整合了数千份现有条约的基线文件。 3. 推动理论视角的转变:当数据揭示出前所未有的复杂模式时,就需要新的理论框架来解释它们。例如,本期特刊中,Morin等人借鉴进化生物学和复杂性理论,将全球贸易治理体系视为一个“复杂适应系统”,其演化方式类似于自然界或其他社会现象,能够产生非线性的机会,在规范探索(创新)与规范利用(稳定)之间实现平衡,而不仅仅是受外生压力和危机的影响。数据驱动分析为检验和发展此类新理论提供了沃土。
尽管前景广阔,作者们也清醒地指出了数据驱动研究面临的挑战与局限: * 挑战: 1. 数据获取与共享:数据可能无法获取、非机器可读或受版权限制。构建高质量、可复用、可持续且兼容的数据库需要大量前期投入和跨学科协作。数据的长期管理和共享机制也需要建立。 2. 技能与能力:多数法律学者缺乏数据科学、网络爬取、编程和机器学习等方面的训练。法律专业知识与计算技能的融合至关重要,法律学者需具备基础的数据科学素养,以识别问题、跨学科交流并参与分析。 3. 发表渠道与评估:传统法律期刊可能对描述性或证实性(而非挑战性)的实证研究接受度有限。基于概率模型的计算机工具的不完美性可能令习惯于精确推理的法律界感到不适。此外,期刊需要建立评估数据驱动研究质量、并要求公开底层数据以供复现的机制。 * 局限: 1. 模式与噪声的混淆风险:大数据分析中发现的“模式”可能是随机噪声。因此,理论指导、严谨的统计分析和基于具体情境的定性三角验证至关重要。归纳性的数据探索不能替代批判性反思和理论构建。 2. 数据偏差导致错误结论:网络分析对数据完整性高度敏感,遗漏少数关键节点可能彻底改变网络结构图景。文本即数据分析则可能因语言障碍(多数工具为语言特定)而偏向分析英文文本,从而忽视其他语言的法律文献,造成系统性偏见。
最后,作者们总结道,鉴于数据可用性的极大提升、条约与案件数量的爆炸式增长、以及国际经济法体系本身日益复杂和受到挑战的现状,现在是认真投身于这一数据驱动研究新前沿的成熟时机。这种方法不仅能为学者提供激动人心的新机遇,也能通过开放获取的交互式网站、法律科技初创企业、跨国法律诊所等形式,为全球的法律实践者提供切实帮助。因此,这篇导言及其所引领的特刊,旨在向更广泛的法律学者和从业者介绍这一新兴领域及其不断壮大的、精通计算机的研究群体,推动国际经济法实证研究进入一个新的时代。
(文章结尾处还附有一个关于国际经济法相关数据库的非详尽列表,以促进进一步研究和合作。)