这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:
作者及机构
该研究由山东科技大学计算机科学与工程学院的李冠、孙灵芝、何明祥合作完成,发表于《数字图书馆论坛》2024年第20卷第10期。
学术背景
研究聚焦生成式人工智能(Generative Artificial Intelligence, GAI)的公众认知,属于人工智能与社会计算交叉领域。随着ChatGPT等工具的普及,GAI对社会各领域的影响日益显著,但公众对其的认知特征尚缺乏系统性量化分析。现有研究存在样本量小、主题聚类模型局限性(如LDA模型忽视词汇位置信息)、情感分析方法对长文本处理不足等问题。因此,本研究旨在通过大规模微博数据,构建“关注度—满意度”量化框架,为政策制定、企业技术优化和公众信息素养提升提供依据。
研究流程与方法
1. 数据采集与预处理
- 数据来源:以ChatGPT、文心一言等GAI工具名称为关键词,爬取2022年12月至2024年2月的微博数据120,569条,清洗后保留95,669条有效数据。
- 预处理:包括去重、分词、去停用词等,并提取发布时间、转发量、评论量等字段。
主题聚类与关注度量化
情感分析与满意度量化
“关注度—满意度”框架构建
主要结果
1. 主题聚类结果
- 识别出17个主题,归纳为4个维度:用户反馈(如问答质量、情感洞察)、未来趋势(如技术展望、金融行情)、应用场景(如教学辅助、科研支持)、风险感知(如知识产权、就业市场)。
- 关注度演化:用户反馈维度初期聚焦问答质量(T0),后期转向情感洞察(T3);风险感知维度关注度整体偏低但呈上升趋势(如网络安全T12从0.1升至0.4)。
满意度分析
IPA框架结论
研究价值与亮点
1. 学术价值
- 提出融合Zero-Shot与BERTopic的混合模型,解决传统主题模型在语义模糊性和可解释性上的缺陷。
- 构建首个GAI公众认知的“关注度—满意度”量化框架,为技术接受度研究提供新范式。
创新点
- 方法创新:Zero-Shot_M3E_BERTopic模型实现高精度主题聚类;ERNIE 3.0情感分析适配社交媒体语言风格。
- 视角创新:首次从动态演化角度揭示公众认知的阶段性特征(如风险感知滞后性)。
其他发现
- 公众对GAI的期望存在两极分化:技术展望(T1)关注度达0.836,但满意度波动剧烈(0.6~0.9),反映对技术前景的乐观与对现实落地的质疑并存。