本研究由广州城市理工学院管理学院的侯家俊、陆红菊、王宝军三位学者合作完成。研究论文《Driving Mechanisms of User Engagement with AI-Generated Content on Social Media Platforms: A Multimethod Analysis Combining LDA and FSQCA》已于2025年7月15日在期刊IEEE Access上正式发表。
该研究属于信息科学与管理科学交叉领域,聚焦于人工智能生成内容在社交媒体环境下的用户行为机制。随着以ChatGPT、文生图模型等为代表的人工智能生成内容技术的快速发展,社交媒体平台上的AIGC内容数量激增。世界经济论坛甚至预测,到2026年,90%的在线内容可能由人工智能生成。AIGC以其强大的生成能力和推荐算法,深刻改变了社交媒体的内容生态。然而,尽管AIGC在内容生产效率上具有优势,但相较于用户生成内容,其用户的接受度和参与度仍处于发展阶段。用户仍然倾向于感知更真实的UGC内容。AIGC在带来效率的同时,也产生了虚假内容、争议、情感深度缺失和过度技术依赖等问题,对社交媒体平台构成了重大挑战。因此,探究驱动用户在社交媒体上与AIGC互动、参与的核心机制,对于平台管理者优化AIGC内容策略、提升用户活跃度和平台品牌价值具有重要的理论与现实意义。本研究旨在填补现有研究的空白:一方面,已有研究多关注用户对AIGC的识别与感知,而对其交互行为的研究相对缺乏;另一方面,在方法论上,将隐狄利克雷分布主题模型与模糊集定性比较分析相结合的跨方法研究尚处于起步阶段。本研究整合LDA主题模型与FSQCA方法,试图揭示社交媒体平台上AIGC用户参与度的驱动因素及其组态关系,为AIGC时代的用户行为研究提供一个新的分析范式。
研究的详细工作流程主要包含数据获取与文本挖掘、驱动因素识别、以及基于FSQCA的组态路径分析三个核心环节。
第一环节:文本挖掘与主题发现。 本研究选择了微博和小红书这两个国内具有代表性的社交媒体平台作为研究对象。使用Python工具,以“AIGC”、“人工智能生成内容”等为关键词,爬取了平台上的相关帖子、评论等文本信息,初始获得16,000条文本。经过预处理(去除无关字符、短文本等)后,最终保留了12,000条有效文本。随后,研究采用隐狄利克雷分布主题模型这一无监督机器学习方法对文本进行主题建模。首先利用Jieba库进行中文分词,并加载哈工大停用词表进行去噪。通过计算主题一致性指标,确定了最佳主题数量为4个。接下来,研究结合技术接受与使用统一理论和社会认知理论,构建了一个系统化的主题命名框架。为确保科学性,邀请了三位信息管理与文本挖掘领域的专家对提取的主题进行评审与验证。最终,从社交媒体AIGC文本中提取并命名了四大主题:AIGC技术特性、用户对AIGC的感知、AIGC商业经济和平台AIGC政策与文化。这四个主题分别对应UTAUT模型中的绩效期望、努力期望、促成条件和社会影响,以及SCT理论中的行为、个人和环境因素,系统地从技术、用户、商业和平台四个维度构建了研究框架。
第二环节:变量确定与问卷设计。 基于LDA提取的四大主题及其关键词,并参考现有文献,研究进一步细化了七个条件变量:AIGC技术成熟度、用户对AIGC真实性的感知、用户对AIGC有用性的感知、用户对AIGC娱乐性的感知、AIGC商业化水平、平台AIGC个性化推荐水平、平台AIGC生态管理与互动氛围。将“社交媒体用户参与度”作为结果变量。为了获取各变量的数据以进行后续的组态分析,研究设计并发放了调查问卷。问卷测量项共计24个,均采用五点李克特量表。研究对象定位于在社交媒体上活跃且对AIGC有一定了解的人群。问卷发放于2025年2月,最终回收有效问卷270份。样本在年龄、性别、教育背景和职业上分布较为均衡。研究对问卷数据进行了信度效度检验,结果显示:问卷总体Cronbach’s α值为0.83,各变量Cronbach’s α值在0.800至0.823之间;KMO值为0.896,Bartlett球形检验显著;因子分析提取的7个因子累计解释方差82.027%;各变量组合信度值均高于0.7,平均方差抽取量均高于0.5,且方差膨胀因子均小于5。这些数据充分表明,量表具有良好的信度、效度,且变量间不存在多重共线性问题。
第三环节:模糊集定性比较分析。 本研究采用模糊集定性比较分析方法,旨在探索多个前因条件的复杂组合如何共同影响结果。首先,将问卷数据使用直接校准法转化为0-1之间的模糊集隶属度分数(以95%、50%、5%分位数作为全隶属、交叉点和全非隶属点)。接着,进行必要性分析,结果显示所有单个条件的一致性均低于0.9,表明不存在单一必要条件,用户参与度是多个条件组合作用的结果,这印证了采用FSQCA方法的合理性。随后,使用FSQCA 4.1软件进行组态分析。设置原始一致性阈值为0.8,PRI一致性阈值为0.75,案例频数为2。通过分析简约解和中间解,最终识别出七条能够导致高用户参与度的驱动路径。为保证结果的稳健性,研究将PRI阈值提高至0.8,案例频数增加至3进行检验,发现核心路径仍然存在,证明了研究结论的可靠性。
研究的主要结果详实且具有层次性。在文本挖掘阶段,LDA模型成功提取了四大主题及一系列高频关键词,如“个性化”、“影响力”、“真实性”、“商业化”等,初步揭示了AIGC在社交媒体中关注度的焦点所在。主题命名与分类结果如表1所示,为后续构建变量体系提供了直接的理论和实证依据。在组态分析阶段,FSQCA分析产生了七条具体的驱动路径(如表7所示)。整体解的一致性为0.943,覆盖度为0.644,表明这七条路径对高用户参与度具有高解释力和较高的案例覆盖度。分析结果的关键发现包括:用户对AIGC有用性的感知是所有七条路径中都出现的核心条件,被确定为驱动用户参与的首要因素。平台AIGC个性化推荐水平和平台AIGC生态管理与互动氛围也频繁出现,是重要驱动因素。而用户对AIGC真实性的感知和AIGC商业化水平则作为辅助因素出现,其影响依赖于与其他条件的特定组合。AIGC技术成熟度则作为基础性驱动因素提供支持。
通过深入整合分析这七条路径,研究进一步提炼出三条经典的、具有代表性的组态驱动路径:1. 用户感知-平台推荐驱动路径:该路径由原始路径2和5构成,强调当用户认为AIGC内容可信、有用且有趣时,辅以平台精准的个性化推荐算法,能有效驱动用户参与。这突出了用户主观认知与平台客观技术推送的协同作用。2. 用户感知-平台氛围驱动路径:该路径由原始路径1、7和3构成,在用户重视AIGC有用性和娱乐性的同时,特别强调平台良好的生态系统管理(如内容审核、标签)和积极的AI互动创作氛围的催化作用。在此路径下,用户不排斥商业化内容,甚至可能因商业推广满足需求而产生互动行为。3. 技术特性-用户感知-平台推荐-平台氛围驱动路径:该路径由原始路径4和6构成,是最为综合的路径。它强调AIGC技术本身的成熟度是基础,但其效能的发挥必须以用户感知到有用性为前提。同时,平台的推荐机制和氛围管理在此起到了关键的“连接器”和“放大器”作用,将高质量的技术内容与广泛的用户需求有效匹配,从而最大程度地提升用户参与度。这三条经典路径清晰地揭示了驱动AIGC用户参与的不同机制模式,以及技术、用户、平台、商业等多维度因素之间复杂的协同互动关系。
本研究得出以下主要结论:首先,基于LDA和UTAUT、SCT理论,从技术、用户、商业、平台四个维度识别了AIGC用户参与的驱动因素主题。其次,FSQCA分析表明,用户对AIGC有用性的感知是首要驱动因素,平台推荐和平台氛围是重要驱动因素,真实性和商业化是辅助因素,技术成熟度是基础因素。第三,七条具体驱动路径可归纳为上述三条经典路径,揭示了不同条件变量间的协同作用及其对用户参与的综合影响机制。
本研究的价值体现在多个层面。在科学价值上,它创新性地将LDA主题模型与FSQCA方法相结合,应用于AIGC用户行为研究领域,提供了一种处理文本大数据与探索复杂因果组态的新研究范式。研究整合了UTAUT和SCT理论,构建了一个更为全面的分析框架,深化了对AIGC技术接受与社交互动行为的理论理解。在应用价值上,研究结论为社交媒体平台运营者提供了极具操作性的策略建议。例如:1. 聚焦内容价值导向:引导用户创作具有实用价值和情感共鸣的AIGC,而非仅仅追求技术炫技,避免内容同质化。2. 构建多模态推荐算法:利用图神经网络等技术,分析用户跨模态兴趣和社交关系,实现更精准、多样化的AIGC推荐,并动态调整AIGC与UGC的推荐比例。3. 加强平台生态治理:采用“AI技术+人工审核”结合的方式,快速识别和标注虚假信息,维护平台可信度。4. 实施差异化驱动策略:针对电商社交、短视频、社交网络、知识社区等不同类型平台,适配不同的经典驱动路径。例如,短视频平台应侧重“用户感知-平台推荐”路径,强化个性化算法;知识社区平台则应侧重综合路径,同时强调技术专业性、内容价值、平台推荐和社区氛围。5. 优化跨文化适应:研究指出驱动机制具有普遍性,但在不同文化背景下,各因素的影响强度和路径组合可能不同,为平台的全球化运营提供了战略思考方向。
本研究的亮点突出。在研究发现上,明确指出的“用户对AIGC有用性的感知”是首要驱动因素这一核心结论,为理解AIGC用户行为提供了关键洞察。提炼出的三条经典驱动路径,系统性地概括了复杂的驱动机制,具有很强的理论概括力和实践指导意义。在研究方法上,开创性地将用于无监督文本主题发现的LDA模型与用于探索因果复杂性的FSQCA方法深度整合,克服了传统定量模型依赖预设理论框架、难以处理非线性和组态效应的局限,实现了从数据出发、理论引导、再到组态验证的完整研究闭环,方法新颖且严谨。在研究对象上,紧跟人工智能与社会化媒体融合的前沿趋势,针对AIGC这一新兴且影响深远的研究对象,聚焦于其用户参与行为这一具体而关键的议题,研究选题具有很强的前瞻性和现实意义。
此外,研究也坦诚指出了自身的局限性,包括样本主要来源于国内社交媒体平台,可能使结论存在一定地域偏向性;未充分考虑用户情绪、时间动态因素以及AIGC本身伦理风险(如虚假信息传播、算法偏见)对用户信任和参与的量化影响等。这些为未来的研究指明了方向,例如开展跨文化比较研究、纳入时间序列和情感分析、以及深入探讨AIGC伦理风险与用户行为的关系等。