夏翠娟的论文《数字人文的理论沿革和范式转向:从“人文研究的数字方法”到“后数字时代的人文研究”》发表在2024年9月的《Journal of Library Science》上。该研究旨在探讨数字人文领域从人文计算(humanities computing)到数字人文(digital humanities)再到后数字时代(post-digital era)的理论演变与范式转型,尤其关注元宇宙和生成式人工智能(GenAI)技术对人文研究带来的潜在变革。
夏翠娟指出,国外数字人文的范式转向体现在两个层面:
- 方法层面:从数据建模(data modeling)转向界面批判(interface criticism)。早期人文计算侧重于通过数据库、语料库等技术对人文资料进行结构化处理(如TEI文本编码),而数字人文更强调通过人机交互界面进行批判性分析,如可视化、多模态叙事等。
- 方法论层面:从计算思维(computing thinking)转向计算思维与批判思维(critical thinking)并重,且后者渐成主导。例如,斯坦福文学实验室的“远读”(distance reading)方法结合量化分析与理论驱动,体现了批判性思考在数字人文中的核心地位。
支持证据:
- 引用麦卡蒂(McCarty)的“建模”理论,说明人文计算如何通过数据模拟研究对象,但需结合批判性评估。
- 以莫莱蒂(Moretti)的“远读”为例,展示数据驱动与理论驱动的结合。
论文指出,中国数字人文尚未完全完成从人文计算到数字人文的范式转向:
- 实践层面:仍以数据建模为主(如古籍数字化、数据库建设),界面批判的实践较少。
- 方法论层面:计算思维占主导,批判思维运用不足,例如CBDB(中国历代人物传记资料库)等项目虽开放数据,但缺乏对数据建模过程本身的反思。
支持证据:
- 列举中国数字人文的分期(2000年前零星散发、2000-2009年数字化奠基、2010-2016年先锋探索、2016年后融合勃发),显示其发展路径与国外不同。
- 指出国内代表性项目(如《全唐诗分析系统》)多侧重技术应用,而非理论创新。
作者认为,生成式人工智能可能推动数字人文进入“第四范式”(数据驱动)之后的“AI驱动”阶段:
- 潜力:GenAI可解决数据建模的局限性(如信息损失问题),通过大规模语料训练生成更接近真实的“世界模型”(world modeling)。
- 挑战:需满足数据量、算法透明度、人文批判性介入等条件。例如,OpenAI的Sora工具已展现多模态建模能力,但其人文适用性仍需验证。
支持证据:
- 以“数字敦煌”和“数字家谱”为例,说明现有数据驱动模式的瓶颈。
- 引用库恩的“范式革命”理论,分析GenAI可能带来的研究模式变革。
论文提出后数字时代的研究框架:
- 批判思维的强化:技术不仅是工具,更应成为研究对象,例如反思AI生成内容的文化偏见。
- 跨学科方法论共同体:需融合计算科学、人文理论、批判性媒介研究(如界面批判理论)。
- 人文问题的重新定义:关注技术衍生的新问题,如数字记忆(digital memory)、虚拟身份伦理等。
支持证据:
- 引用斯文森(Svensson)的观点,强调数字人文需包容“非文本与天生数字形态”的研究对象。
- 以“数字叙事”(digital storytelling)为例,说明沉浸式技术如何改变人文阐释方式。
该论文对数字人文研究者、人文学科转型实践者及技术开发者均具有重要参考价值,尤其在AI技术高速发展的当下,为平衡技术创新与人文批判提供了理论依据。