分享自:

生成式人工智能话题下公众认知的“关注度—满意度”量化分析——以微博平台为例

期刊:数字图书馆论坛DOI:10.3772/j.issn.1673-2286.2024.10.002

这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:

作者及机构
该研究由山东科技大学计算机科学与工程学院的李冠、孙灵芝、何明祥合作完成,发表于《数字图书馆论坛》2024年第20卷第10期。

学术背景
研究聚焦生成式人工智能(Generative Artificial Intelligence, GAI)的公众认知,属于人工智能与社会计算交叉领域。随着ChatGPT等工具的普及,GAI对社会各领域的影响日益显著,但公众对其的认知特征尚缺乏系统性量化分析。现有研究存在样本量小、主题聚类模型局限性(如LDA模型忽视词汇位置信息)、情感分析方法对长文本处理不足等问题。因此,本研究旨在通过大规模微博数据,构建“关注度—满意度”量化框架,为政策制定、企业技术优化和公众信息素养提升提供依据。

研究流程与方法
1. 数据采集与预处理
- 数据来源:以ChatGPT、文心一言等GAI工具名称为关键词,爬取2022年12月至2024年2月的微博数据120,569条,清洗后保留95,669条有效数据。
- 预处理:包括去重、分词、去停用词等,并提取发布时间、转发量、评论量等字段。

  1. 主题聚类与关注度量化

    • 模型开发:提出创新性模型Zero-Shot_M3E_BERTopic,结合零样本提示(Zero-Shot)技术和BERTopic模型,解决传统主题模型语义模糊性问题。具体步骤包括:
      • 输入层:通过LDA初步聚类生成先验知识集,筛选14个主题并构建提示词集。
      • 文档嵌入:采用M3E模型(基于RoBERTa架构)将文本转换为768维向量,保留中英文混合文本的语义特征。
      • 文档聚类:计算文档与提示词的余弦相似度(阈值0.7),未匹配文档通过UMAP降维和HDBSCAN聚类。
      • 主题表征:整合聚类结果,通过C-TF-IDF算法提取前20个关键词描述主题。
    • 对比实验:与LDA、Top2Vec等模型对比,Zero-Shot_M3E_BERTopic的主题连贯性(-2.711 vs. LDA的-15.955)和一致性(0.835 vs. LDA的0.607)显著更优。
    • 关注度计算:基于微博数量、评论量、转发量、点赞量,通过Min-Max归一化和加权(权重α=0.5, β=0.2, γ=0.2, δ=0.1)量化主题关注度。
  2. 情感分析与满意度量化

    • 模型选择:采用ERNIE 3.0模型(知识增强预训练,Transfomer-XL架构)进行情感分类,输出积极/消极概率值(阈值0.5)。
    • 满意度计算:以主题内微博情感值均值作为满意度指标。
  3. “关注度—满意度”框架构建

    • IPA模型应用:以关注度为纵轴、满意度为横轴,划分四个象限:高关注—高满意(优势区)、高关注—低满意(劣势区)、低关注—低满意(改进区)、低关注—高满意(保持区)。
    • 关键词共现网络:提取高/低满意度区域的高频词,分析公众认知细粒度特征。

主要结果
1. 主题聚类结果
- 识别出17个主题,归纳为4个维度:用户反馈(如问答质量、情感洞察)、未来趋势(如技术展望、金融行情)、应用场景(如教学辅助、科研支持)、风险感知(如知识产权、就业市场)。
- 关注度演化:用户反馈维度初期聚焦问答质量(T0),后期转向情感洞察(T3);风险感知维度关注度整体偏低但呈上升趋势(如网络安全T12从0.1升至0.4)。

  1. 满意度分析

    • 劣势区主题:问答质量(T0满意度0.469)、情感洞察(T3满意度0.512)和教学辅助(T4满意度0.581)表现最差,反映GAI在逻辑性、情感理解和教育滥用问题上的不足。
    • 优势区主题:使用体验(T5满意度0.802)、创作启迪(T6满意度0.784)等技术应用类主题满意度最高。
  2. IPA框架结论

    • 需优先改进领域:问答质量、情感洞察等劣势区主题;知识产权、就业市场等改进区主题需长期关注。
    • 保持领域:智能驾驶(T16满意度0.901)等专业场景表现良好但关注度低。

研究价值与亮点
1. 学术价值
- 提出融合Zero-Shot与BERTopic的混合模型,解决传统主题模型在语义模糊性和可解释性上的缺陷。
- 构建首个GAI公众认知的“关注度—满意度”量化框架,为技术接受度研究提供新范式。

  1. 应用价值
    • 政策建议:政府需加强GAI伦理监管(如网络安全风险治理)和公众教育(如提问技巧培训)。
    • 企业优化:提升中文语境下的情感理解能力,开发垂直领域专业工具(如医疗诊断GAI)。

创新点
- 方法创新:Zero-Shot_M3E_BERTopic模型实现高精度主题聚类;ERNIE 3.0情感分析适配社交媒体语言风格。
- 视角创新:首次从动态演化角度揭示公众认知的阶段性特征(如风险感知滞后性)。

其他发现
- 公众对GAI的期望存在两极分化:技术展望(T1)关注度达0.836,但满意度波动剧烈(0.6~0.9),反映对技术前景的乐观与对现实落地的质疑并存。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com