用于痴呆症监测和诊断的纵向多模态数据集

分享自：
用于痴呆症监测和诊断的纵向多模态数据集

生物医学工程
医学
期刊:Springer Nature
学术报告：一项关于痴呆症监测与诊断的多模态纵向数据集研究作者与发表信息本研究由Dimitris Gkoumas（伦敦玛丽皇后大学电子工程与计算机科学学院）、Bo Wang（美国马萨诸塞州总医院精准精神病学中心）、Adam Tsakalidis（伦敦玛丽皇后大学 & 艾伦·图灵研究所）、Maria Wolters（爱丁堡大学信息学院）、Matthew Purver（伦敦玛丽皇后大学 & 艾伦·图灵研究所）、Arkaitz Zubiaga（伦敦玛丽皇后大学）以及Maria Liakata（伦敦玛丽皇后大学 & 艾伦·图灵研究所）共同完成。该研究作为预印本发布于arXiv，版本标识为arXiv:2109.01537v2，提交日期为2023年12月23日，采用了Springer Nature 2023 LaTeX模板。
学术背景研究领域：本研究属于计算语言学（Computational Linguistics）与医学信息学（Medical Informatics）的交叉领域，聚焦于痴呆症（Dementia）的早期诊断与长期监测。
研究动机：全球约有5000万痴呆症患者，且每年新增1000万病例（WHO, 2019）。当前诊断主要依赖昂贵的生物标志物（如MRI、PET扫描）或人工实施的神经心理测试（如MMSE、ACE-III），但这些方法存在成本高、敏感性不足等问题。语言和语音分析作为一种非侵入性、低成本的替代方案，展现出巨大潜力。然而，现有数据集多局限于单模态（如仅语音）、短时间跨度的临床环境采集，且忽略多模态交互与自然语境下的语言变化。
研究目标：
 1. 建立一个多模态（语音、文本、书写、键盘/笔触交互数据）、高时间分辨率（每日采集）的纵向痴呆症语料库。
 2. 通过自然情境下的对话与书写任务，捕捉痴呆症患者与健康对照组的语言退化模式差异。
 3. 为未来研究提供基础模型和任务基准，推动基于语言特征的自动化痴呆症筛查工具开发。
研究流程与方法1. 语料库设计与采集研究对象：
 - 22名参与者（12名痴呆症患者，10名健康对照），年龄65-80岁，均在英国成长以匹配怀旧素材文化背景。
 - 痴呆症亚型包括阿尔茨海默病（AD）、血管性痴呆（VD）、额颞叶痴呆（FTD）及轻度认知障碍（MCI）。
数据采集规程：
 - 双阶段设计：每阶段持续4周（28次会话），间隔14周（实际因外部因素延长）。
 - 多模态采集：
 - 语音：15分钟与护理人员的自然对话（通过定制Android平板应用录制）。
 - 书写：手写或键盘输入的日常思考记录（同步捕获笔压、删除动作等副语言信息）。
 - 刺激材料：67个怀旧主题图片（如1950-70年代的收音机、学校生活），辅以引导问题以激发自发语言。
特色方法：
 - 定制化平板应用：由临床合作方Clinvivo开发，支持加密数据传输与远程监控。
 - 认知评估：每阶段前后进行MMSE和ACE-III测试，作为认知状态基准。
2. 数据处理与分析语音转录：
 - 84段会话（79段来自痴呆患者）由专业转录员手动标注，遵循CHAT协议，涵盖非言语事件（停顿、笑、咳嗽等）及语言不流畅性（如自我修正）。
特征提取：
 - 语言模态：使用Sentence-BERT生成句子级嵌入，量化词汇、句法和语义变化。
 - 语音模态：基于TRILL网络的声学嵌入，捕捉语速、语调等非语义特征。
 - 书写模态：分析键入间隔、删除频率等动力学指标。
纵向任务设计：
 - 连续性任务：计算相邻会话的余弦距离，评估短期语言波动。
 - 非连续性任务：比较初始与末期会话差异，揭示长期退化趋势。
主要结果1. 多模态差异性语音：痴呆组在非连续会话中的语言变化显著高于对照组（均值距离0.13 vs. 0.07，p<0.05），表明其语言退化随时间加速。
 
转录文本：痴呆组的语义连贯性下降更明显（距离0.16 vs. 0.07），尤其在跨阶段对比中（0.12 vs. 0.06）。
 
书写：对照组键入速度更快（2647字符/20.9分钟 vs. 1752字符/35.9分钟），但笔压无显著差异，提示痴呆患者可能面临表达效率下降。
 
2. 纵向模式痴呆患者的语言变异在时间跨度大的会话间更显著（如阶段间语音距离0.09 vs. 对照组0.02），支持高频监测对早期诊断的价值。
 
结论与价值科学意义首个融合语音、书写、交互动力学的高分辨率纵向痴呆症数据集，填补了自然语境多模态数据空白。
 
证明自发语言分析可敏感捕捉痴呆相关认知退化，为替代传统神经心理测试提供实证基础。
 
应用前景支持开发低成本家庭监测工具，通过日常对话或书写追踪认知状态。
 
为基于AI的个性化干预（如语言训练）提供量化指标。
 
研究亮点创新数据设计：自然怀旧任务激发真实语言表达，避免实验室环境的“学习效应”。
 
多模态深度整合：首次同步分析语言内容（what）与生成过程（how）的痴呆相关性。
 
方法学贡献：提出基于预训练模型的纵向语言变化度量框架，可扩展至其他神经退行性疾病研究。
 
局限性样本量较小（尤其第二阶段仅9人完成），主因GDPR法规更新与COVID-19中断。未来计划通过合作记忆诊所扩大数据收集。
 
当前分析未充分挖掘副语言特征（如笔触动力学）与认知状态的潜在关联，需进一步探索自修复行为建模。
 
伦理与数据共享遵循NHS伦理审查（REC 16/WS/0226），数据经匿名化处理，研究人员需签署保密协议（NDA）访问。未来拟公开预训练嵌入模型以促进社区研究。
（报告字数：约2100字）
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问