分享自:

生成式AI聊天机器人对社交焦虑支持的态度和信任研究

期刊:CHI Conference on Human Factors in Computing SystemsDOI:10.1145/3706598.3714286

该文档属于类型a(原始研究论文),以下是针对该研究的综合学术报告:


作者及机构信息
本研究的通讯作者为Yimeng Wang(威廉玛丽学院,美国弗吉尼亚州威廉斯堡)与Yinzhou Wang(同院校计算机科学系),合作者包括Kelly Crace(弗吉尼亚大学冥想科学中心)和Yixuan Zhang(威廉玛丽学院)。论文发表于2025年CHI Conference on Human Factors in Computing Systems (CHI ‘25),会议日期为2025年4月26日至5月1日,日本横滨。全文共21页,采用知识共享署名4.0国际许可协议。


学术背景

研究领域与动机
本研究属于人机交互(Human-Computer Interaction, HCI)与社会心理学交叉领域,聚焦于生成式AI聊天机器人(Generative AI Chatbots, GenAI)社交焦虑(Social Anxiety, SA)支持中的应用。传统心理健康服务面临可及性不足的挑战(如专业人员短缺、经济门槛等),而GenAI凭借其非评判性和对话能力,成为潜在替代工具。然而,用户对GenAI的信任和态度尚不明确,尤其缺乏针对社交焦虑人群的实证研究。

核心科学问题
研究旨在回答:
1. 用户对GenAI聊天机器人在SA支持中的感知、信任及使用意愿(RQ1);
2. 影响使用意愿的因素(RQ2);
3. SA症状严重程度与既往GenAI使用经验如何塑造信任(RQ3)。


研究流程与方法

混合方法设计
研究采用问卷调查(n=159)半结构化访谈(n=17)结合的混合方法:

1. 问卷调查

  • 样本筛选:通过雪球抽样和机构广告招募18岁以上参与者,要求包含不同SA严重程度(从轻度不适到重度症状)及对GenAI的兴趣。最终筛选159份有效问卷。
  • 测量工具
    • 社交焦虑:结合自评诊断、临床诊断记录和标准化社交恐惧量表(SPIN)评分,确保一致性。
    • 信任维度:基于六项Likert量表(1-5分)评估能力、诚实、经验、善意、可靠性和未来预期。
    • 使用模式:记录GenAI使用时长、频率及SA支持的既往使用情况。
  • 数据分析:采用Cronbach’s α(0.831)验证量表信度;通过EFA(探索性因子分析)确认单因子结构;使用Kruskal-Wallis检验、线性回归和Spearman相关分析信任与使用意愿的关系。

2. 访谈研究

  • 参与者选择:按SA症状严重程度、GenAI使用时长和频率分层抽样,最终访谈17人。
  • 访谈内容:深入探讨GenAI的情感支持体验、技术局限性及与人类心理治疗师的对比。
  • 数据分析:采用归纳主题分析法,由团队共同编码以降低偏倚风险。

技术创新点
- 信任量表开发:首次将情感信任(Emotional Trust)与认知信任(Cognitive Trust)分离,验证其在SA场景下的适用性。
- 高斯混合模型(GMM)聚类:用于解析“未决定”用户群的异质性,识别三类细分人群(长期使用者、轻度症状者、高频使用者)。


主要结果

1. 信任与使用意愿的强关联

  • 定量分析显示,信任评分每增加1分,使用意愿提升30%(β=0.73, p<0.01)。
  • “愿意使用”组的中位信任分(3.42)显著高于“不愿使用”组(2.83)。

2. SA症状严重程度的关键影响

  • 重度SA用户更依赖GenAI的情感支持(如非评判性回应),其使用意愿是轻度用户的2.3倍(OR=1.23, p<0.05)。
  • 轻度SA用户则关注技术可靠性(如回答准确性),对情感互动需求较低。

3. 使用经验的调节作用

  • 长期使用者(>1年)对GenAI的信任更稳定,63%愿意将其用于SA管理;高频使用者(每周多次)的意愿达66.7%。
  • 访谈揭示:既往负面心理治疗经历者(如被误解)更倾向将GenAI视为“劣质治疗师的替代品”(P6原话)。

4. 情感信任的发现

  • 最小化共情设计(如“思考中”旋转图标、柔和文本语气)即能显著提升重度SA用户的依从性(P16:“像姐妹般的回应”)。
  • 技术缺陷(如幻觉、记忆缺失)对情感信任的损害弱于认知信任。

结论与价值

理论贡献
- 提出情境化信任模型,阐明SA症状严重程度如何动态调节用户对GenAI的信任机制(情感vs认知优先)。
- 验证情感信任的可测量性,为HCI领域提供新评估维度。

应用意义
- 设计指南:针对重度SA用户需强化情感共鸣设计(如动态共情反馈),而轻度用户需透明化技术逻辑(如错误提示机制)。
- 伦理警示:GenAI可能加剧社交退缩(如替代真人互动),需嵌入心理教育内容以平衡依赖性。

政策建议
- 呼吁建立GenAI心理健康工具的认证标准,要求披露模型更新风险与数据使用边界。


研究亮点

  1. 首创性:首个探究GenAI在SA支持中信任动态的研究,填补心理健康与AI交叉领域的空白。
  2. 方法创新:混合方法结合GMM聚类,精准捕获用户群体异质性。
  3. 实践启示:为个性化GenAI设计提供证据支持,例如区分“情感优先”与“功能优先”交互模式。

局限与未来方向
- 样本偏年轻(74%为18-24岁),需扩展至更广泛年龄段;
- 建议纵向研究追踪长期使用对SA症状的潜在影响。


(报告全文约2400字,涵盖研究全流程与核心发现)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com