这篇文档属于类型c(其他类型文档),是LIWC2015(Linguistic Inquiry and Word Count 2015)的开发与心理测量学属性的技术手册,主要介绍LIWC2015词典的构建方法、软件功能、更新内容及验证数据。以下是其核心内容的系统梳理:
作者团队:James W. Pennebaker、Ryan L. Boyd、Kayla Jordan、Kate Blackburn(美国德克萨斯大学奥斯汀分校心理学系)
联系与版权:LIWC2015由Pennebaker Conglomerates(研究用途)和Receptiviti, Inc.(商业用途)分发,研究版收益捐赠给德克萨斯大学心理学系。
LIWC(语言查询与词频统计)是一种文本分析工具,旨在通过量化语言中的情感、认知、社会关系等维度揭示心理状态。早期版本(LIWC2001、LIWC2007)受限于计算机技术和词典规模,而LIWC2015在词典内容、软件兼容性及分析维度上进行了全面革新,目标包括:
- 高效性:支持多格式文本(如PDF、Word、Excel)及跨平台(PC/Mac)分析。
- 透明性:用户可自定义分析维度,词典结构公开可调。
- 适应性:新增对网络语言(如表情符号、缩写词“btw”“lol”)的支持。
通过7个步骤构建词典,强调心理测量学严谨性:
1. 词库收集:基于LIWC2007词典,结合心理学量表(如PANAS)、词典与语料库扩展。
2. 评委评分:4-8名评委对词汇的类别适用性投票,多数同意方可保留。
3. 词频验证:通过Meaning Extraction Helper(MEH)工具筛选高频词,剔除罕见词。
4. 候选词扩展:利用自然语言工具包(NLTK)识别未覆盖的高频词,评委二次审核。
5. 心理测量评估:基于18.1万份文本(2.31亿词)计算内部一致性(Cronbach’s α),剔除降低信度的词。
6. 迭代优化:重复上述步骤以修正错误。
7. 新增汇总变量:如“分析性思维”“影响力(Clout)”“真实性”等复合维度。
此手册为研究者提供了LIWC2015的完整技术蓝图,兼具理论深度与实践指导价值。