关于生成式人工智能对人类创作者挤出效应的研究:来自Pixiv平台的证据
一、 研究作者与发表信息
本研究由Sueyoul Kim(韩国开发研究院,Korea Development Institute)、Ginger Zhe Jin(马里兰大学帕克分校经济系及美国国家经济研究局,NBER)和Eungik Lee(纽约联邦储备银行)合作完成。研究成果以工作论文(Working Paper)形式于2026年1月发表于美国国家经济研究局(NBER),编号为34733,标题为《Does Generative AI Crowd Out Human Creators? Evidence from Pixiv》。
二、 学术背景与研究目标
本研究属于数字经济、劳动经济学和创新经济学交叉领域,具体关注生成式人工智能(Generative AI)对创意产业劳动力市场的影响。随着以NovelAI图像生成器为代表的文本转图像AI工具在2022年底的推出,其在动漫、漫画风格(Anime/Manga-style)艺术创作领域展现出强大能力,引发了关于AI是否会“挤出”人类创作者的广泛担忧。一方面,AI可能通过替代效应和训练数据版权问题损害现有创作者的利益;另一方面,AI也可能通过降低创作门槛、吸引平台流量产生积极溢出效应。然而,关于AI对非使用者(即未采纳AI作为主要工具的人类创作者)影响的因果证据仍然有限。
本研究旨在利用日本最大的动漫风格艺术作品分享平台Pixiv的全面数据,实证检验生成式AI(以NovelAI图像生成器的发布为处理事件)的推出对人类创作者生产力(以作品上传量为衡量)的影响。研究目标具体包括:1)量化AI发布对主流非AI使用创作者的平均影响;2)探究影响背后的机制,包括需求侧(观众注意力流失)和供给侧(AI生成内容直接竞争)的作用;3)分析创作者面对AI竞争时的策略性反应(如回避或多元化);4)考察影响在不同类型创作者(如商业创作者、高生产力创作者)间的异质性。
三、 详细研究流程与方法
本研究采用严谨的计量经济学方法,核心是利用AI对插画(Illustrations)和漫画(Comics)两类内容影响的天然差异,构建双重差分(Difference-in-Differences,DID)模型。
1. 数据来源与处理: 研究收集了Pixiv平台从2020年4月至2023年6月期间的全部帖子级数据,包含超过1000万个帖子。每个帖子的数据包括:唯一ID、创作者用户ID、上传时间戳、浏览量、收藏量(Bookmarks)、标题、创作者评论和描述内容的标签(Tags)。关键优势在于数据包含了详细的收藏历史记录,可以精确追踪每个帖子每月新增的收藏数,从而衡量“注意力流”而非存量。此外,数据还包含帖子是否被标记为AI生成(AI flag)以及内容分类(插画或漫画)的信息。
2. 样本构建与变量定义: * 面板数据构建: 基于原始数据构建了两个面板数据集。一是“帖子-月度”面板,用于分析每个帖子每月获得的收藏量动态。二是“创作者-月度”面板,用于分析创作者的上传行为,样本聚焦于在AI发布(2022年10月)前至少上传过一个帖子的“现有创作者”(Incumbent Creators),并排除了AI采纳率极低(插画师约0.49%,漫画师约0.27%)的AI使用者,专注于研究AI对非AI使用创作者的影响。 * 关键变量: * 处理组与对照组: 根据创作者在AI发布前上传作品的类别,将其划分为插画师(处理组)和漫画师(对照组)。这一划分基于一个关键事实:AI发布后,插画帖子中AI生成内容的占比(22%)远高于漫画帖子(4%)。这源于技术限制——基于Stable Diffusion等概率性模型的AI难以生成风格一致的连续图像序列,因此更适用于单幅插画而非多格漫画。 * 因变量: 主要因变量为创作者月度上传帖子总数(Post Uploads)以及非AI帖子月度上传数(Non-AI Post Uploads)。在机制分析中,使用帖子月度收藏量(Bookmarks)作为观众注意力的代理变量。 * 异质性变量: 包括创作者是否为商业创作者(帖子中是否包含商业网站链接)、创作者在AI发布前的生产力水平(平均月度上传量,划分为不同百分位组)。 * AI入侵指数(AI Invasion Index): 为探究直接竞争机制,研究构建了知识产权(Intellectual Property, IP)层面和标签(Tag)层面的AI入侵指数。IP入侵指数定义为:AI发布后,特定IP下月度AI生成插画帖子数 / AI发布前,该IP下月度总插画帖子数。标签入侵指数定义类似。创作者个人层面的入侵指数则根据其AI发布前使用的IP或标签的流行度进行加权平均计算。
3. 实证分析流程: * 步骤一:平均处理效应估计。 采用泊松双重差分模型,比较AI发布前后,插画师(处理组)与漫画师(对照组)在上传行为上的差异。模型控制了创作者固定效应和创作者主要IP-时间固定效应,以排除个体异质性和特定IP随时间流行度变化的影响。事件研究法(Event Study)用于检验处理前平行趋势假设。 * 步骤二:异质性分析。 在DID框架中加入交互项,分别考察AI发布的影响在商业创作者与非商业创作者之间、以及在不同生产力水平(如前1%、1-5%等)创作者之间的差异。 * 步骤三:需求侧机制检验——注意力流失。 使用“帖子-月度”面板数据,将插画帖子作为处理组,漫画帖子作为对照组,再次运用DID模型,分析AI发布后非AI插画帖子所获收藏量的变化。 * 步骤四:供给侧机制检验——直接竞争。 利用IP层面的变异,构建三重差分(Triple-Differences)模型。将创作者按其主力创作IP分组,检验在AI入侵程度更高的IP领域进行创作的插画师,其上传量和所获收藏量的下降是否更为显著。即研究交互项(插画师 × AI发布后 × 高AI入侵IP)的系数。 * 步骤五:创作者反应分析。 根据计算得到的创作者个人层面AI入侵指数(分为基于IP和基于标签),将插画师分为高暴露组(前15%)和低暴露组(后85%)。通过DID模型分析这两组创作者在AI发布后的行为变化:1)是否减少使用受AI“入侵”严重的标签(避免竞争);2)是否增加创作所涉及的IP数量(投资组合多元化以对冲风险)。
四、 主要研究结果
1. 平均效应与异质性: * AI发布导致插画师(处理组)的月度帖子上传量平均显著下降了约10.1%。非AI帖子上传量也下降了约11.3%,证实了“挤出”或“抑制”(Chilling Effect)效应。 * 商业创作者 受到的抑制效应更大,其总上传量下降约14.3%。 * 生产力异质性分析 揭示了一个关键发现:抑制效应高度集中在高生产力创作者中。生产力排名前1%的插画师上传量下降幅度最大(约15%),而排名后50%的插画师上传量反而有所增加(约7%)。这表明,先前一些聚焦于头部、高生产力创作者的研究可能高估了AI的平均抑制效应。
2. 机制检验结果: * 需求侧(注意力流失): AI发布后,与非AI漫画帖子相比,非AI插画帖子每月获得的收藏量平均下降了28.5%至32.4%。事件研究图显示,发布后注意力立即显著下降。由于收藏量直接关联创作者的曝光度和潜在商业变现(如付费订阅),注意力的流失降低了创作者上传新作品的预期回报,从而解释了上传行为减少的原因。 * 供给侧(直接竞争): 三重差分分析显示,在AI入侵程度更高的IP领域(如《原神》、《Fate》系列)进行创作的插画师,其上传量和所获收藏量的下降幅度显著更大。IP入侵指数与DID估计系数呈显著负相关(对于上传量,斜率=-0.146,p=0.075;对于收藏量,斜率=-1.204,p=0.000)。这为“AI生成内容直接竞争导致人类创作者产出减少”提供了实证证据,而不仅仅是心理上的“AI恐惧”。
3. 创作者反应策略: * 避免受侵标签: 基于标签入侵指数划分的高暴露组(前15%)插画师,在AI发布后显著减少了使用受AI青睐(即AI生成帖子高频使用)的标签,其使用比例下降了约2个百分点。低暴露组则无此现象,甚至略有增加。 * IP多元化: 基于IP入侵指数划分的高暴露组插画师,在AI发布后显著增加了其月度创作所涉及的IP数量。例如,一个以前只创作《宝可梦》相关作品的画师,开始同时创作《宝可梦》和《火影忍者》作品。这被解释为一种风险对冲策略,以降低其所有创作领域同时被AI入侵的风险。
五、 研究结论与价值
本研究的核心结论是:生成式AI的推出对未采纳该技术的人类创作者产生了显著的抑制效应,平均降低了约10%的创作产出。这种效应主要通过两个渠道实现:一是需求侧观众注意力的流失,二是供给侧与AI生成内容的直接竞争。然而,这种影响并非均匀分布,商业创作者和顶级高生产力创作者受到的冲击更为严重,而低生产力创作者甚至可能因AI的辅助工具属性而受益。
科学价值与应用意义: 1. 提供了因果证据: 通过巧妙的双重差分设计,首次在大型创意平台上为“AI挤出人类创作者”提供了可靠的因果推断证据,超越了相关性分析。 2. 揭示了异质性影响: 强调了评估AI影响时必须考虑创作者群体的异质性,政策讨论不应基于对头部创作者的观察而推及全体。 3. 阐明了具体作用机制: 明确区分并实证检验了注意力流失和直接竞争两条渠道,深化了对AI如何影响创意市场的理解。 4. 展示了创作者适应性行为: 发现了创作者通过调整标签使用和多元化IP组合来应对AI竞争的策略,这为理解劳动力市场动态调整提供了新见解。 5. 为平台与政策制定者提供启示: 研究指出,平台管理者可以考虑通过设立人类创作作品专区、限制大规模AI内容上传等设计,来缓解注意力分流和竞争压力。政策制定者在权衡创作者激励与AI创新收益时,需充分考虑影响的异质性和具体作用渠道。
六、 研究亮点
七、 其他有价值内容
研究还简要讨论了AI采纳模式,发现现有创作者的AI采纳率极低(<0.5%),绝大多数AI生成内容由AI发布后的新进入者(Entrants)贡献。这暗示从AI中受益最多的可能是新型市场进入者,而非传统创作者。此外,论文也坦诚了研究的局限性,如观测期较短(仅6个月)、AI标识可能无法捕捉AI辅助创作、无法观测创作者跨平台总收入等,为未来研究指明了方向。这些讨论增强了研究的严谨性和开放性。