长期哀伤障碍：针对DSM-V和ICD-11所提标准的心理测量学验证

分享自：
长期哀伤障碍：针对DSM-V和ICD-11所提标准的心理测量学验证

期刊:PLOS MedicineDOI:10.1371/journal.pmed.1000121
关于延长哀伤障碍诊断标准的心理测量学验证研究报告
本研究由Holly G. Prigerson（第一作者，来自美国布莱根妇女医院精神病学系、丹娜-法伯癌症研究所心理肿瘤学与姑息治疗研究中心、哈佛医学院姑息治疗中心）、Mardi J. Horowitz、Selby C. Jacobs、Colin M. Parkes 等来自美国、英国、澳大利亚、荷兰、瑞士多所知名大学和研究机构的二十余位学者共同完成。该研究论文《Prolonged Grief Disorder: Psychometric Validation of Criteria Proposed for DSM-V and ICD-11》于2009年8月4日发表在学术期刊 PLoS Medicine 上。
一、 学术背景 该研究属于临床心理学与精神病学领域，具体聚焦于丧亲后心理障碍的诊断标准制定。尽管丧亲是普遍经历，但多数人能逐步适应。然而，有少数丧亲者会经历一种强烈、持久、令人痛苦且导致功能损害的哀伤反应，这被称为“延长哀伤障碍”（Prolonged Grief Disorder, PGD）或“复杂性哀伤”（Complicated Grief）。在论文发表时，无论是美国的《精神疾病诊断与统计手册》第四版（DSM-IV）还是世界卫生组织的《国际疾病分类》第十版（ICD-10），均未将此类哀伤反应单独列为一种精神障碍，而是将其归为可能需要临床关注的“其他状况”。
大量前期研究表明，PGD的症状群（如强烈的思念、对死亡事实的难以接受、生活无意义感等）在现象学、病因学、病程、治疗反应及不良预后方面，均与重性抑郁障碍（Major Depressive Disorder, MDD）、创伤后应激障碍（PTSD）和广泛性焦虑障碍（GAD）等既有诊断存在显著区别。例如，对逝者的“渴念”（yearning）是PGD的核心特征，但在抑郁或焦虑因子中负荷不高。此外，PGD症状与自杀风险增加、免疫功能紊乱、心血管事件、生活质量下降等独立相关，且针对抑郁的常规治疗（如三环类抗抑郁药）对缓解PGD症状效果有限，而专门针对PGD设计的心理治疗则显示出疗效。
因此，建立一个标准化、经过心理测量学验证的PGD诊断标准，对于提高临床识别率、促进针对性治疗、推动相关研究（如流行病学、神经生物学、预防干预）以及可能影响医疗保险支付至关重要。本研究的目标正是对之前专家共识提出的PGD诊断标准进行心理测量学验证，以确定其能否有效识别出那些面临持续痛苦和功能损害高风险的丧亲个体，并为其纳入DSM-V和ICD-11提供实证依据。
二、 研究流程详述 本研究是一项纵向的、基于访谈的现场试验（field trial），数据来源于“耶鲁丧亲研究”（Yale Bereavement Study, YBS）。研究流程分为六个阶段，旨在逐步筛选、优化并验证PGD的诊断算法。
第一阶段：研究对象与数据收集。 研究对象为317名社区居住的丧亲者，主要通过美国退休人员协会（AARP）的“丧偶者服务”项目以及教牧关怀办公室招募。基线访谈在丧亲后平均6.3个月进行，随后进行了两次随访。最终分析样本为291名在丧亲后12个月内至少接受过一次评估并提供完整信息的参与者。样本主要为白人（95.3%）、女性（73.7%）、平均年龄61.8岁、且大多数为逝者配偶（83.9%）。研究使用修订版复杂性哀伤量表-访谈者版（Inventory of Complicated Grief—Revised, ICG-R）评估PGD症状，使用DSM-IV定式临床访谈（SCID）评估其他精神障碍（如MDD, PTSD, GAD），并评估了自杀意念、日常活动功能和生活质量等结局指标。
第二阶段：筛选信息量大且无偏的症状条目。 研究采用项目反应理论（Item Response Theory, IRT） 对丧亲后0-12个月内评估的22个候选PGD症状进行分析。首先，通过项目信息函数（Item Information Function, IIF）分析，评估每个症状对潜在“延长哀伤”特质的测量精确度。有6个症状因信息量过低（峰值信息量低于最有效症状的20%）被排除。其次，对剩余的16个信息量较高的症状进行差异项目功能（Differential Item Functioning, DIF）分析，检验这些症状在不同年龄、性别、教育程度、与逝者关系（配偶 vs. 非配偶）及丧亲时间（0-6月 vs. 6-12月）群体中是否存在测量偏差。结果发现4个症状存在偏差（例如，“因死亡而感到孤独”在不同亲属关系中功能不同），因此被排除。最终，保留了12个信息量大且无测量偏差的症状，构成后续分析的基础症状池，其内部一致性信度（Cronbach‘s α）为0.82。
第三阶段：建立PGD“病例”的客观标准。 由于缺乏PGD诊断的“金标准”，研究需要建立一个客观、可靠的参照标准来评估不同的诊断算法。研究者结合了临床访谈员的总体判断和基于IRT的潜在特质分数。他们使用包含12个症状的IRT模型计算出每个参与者的“延长哀伤”特质分数，然后通过调整分数阈值，使基于此阈值的分类与访谈员的临床判断达到最高一致性（Kappa = 0.68）。最终确定，IRT特质分数高于约1.0的个体被定义为PGD“病例”，以此作为评估不同症状算法的效标。
第四阶段：寻找最优的症状诊断算法。 基于专家共识，“渴念”（yearning）被设定为诊断的强制性症状（mandatory symptom）。研究目标是从剩余的11个症状中，找出与“渴念”组合后能最有效（即最佳平衡敏感性与特异性）区分上述IRT效标“病例”与“非病例”的算法。研究者运用组合数学（Combinatorics） 方法，枚举了4785种可能的算法组合（即要求“渴念”加上从11个症状中选出的n个症状里，至少出现k个症状）。通过计算每个算法相对于IRT效标的敏感性和特异性，确定了最优算法。该算法要求个体必须满足：强制性症状“渴念” + 至少出现以下9个症状中的5个：回避逝者相关提醒物；难以接受死亡；感到生活空虚无意义；对死亡感到痛苦或愤怒；情感麻木；对死亡感到震惊、恍惚或目瞪口呆；感觉自我的一部分随逝者而去；难以信任他人；难以继续生活。
第五阶段：确定病程标准和功能损害标准，形成完整诊断提案。 为了减少假阳性诊断，研究进一步分析了不同时间亚型（急性、延迟性、持续性）的预测效度。结果发现，仅在丧亲早期（0-6个月）满足症状标准（急性亚型）并不能有效预测长期功能损害；而在6-12个月时满足症状标准（延迟性或持续性亚型）则能显著预测后续（12-24个月）的精神障碍共病、自杀意念、功能残疾和低生活质量。因此，研究提议增加病程标准：诊断必须在丧亲事件发生至少6个月后才能做出。同时，为了确保诊断的临床意义，增加了功能损害标准：症状必须导致社交、职业或其他重要功能领域的临床显著损害。最终，提出了包含事件（丧亲）、分离痛苦（渴念）、认知/情感/行为症状（9选5）、病程（≥6个月）、功能损害以及排除其他精神障碍更好解释等六个类别的完整PGD诊断标准提案。
第六阶段：验证最终诊断标准的预测效度。 研究检验了依据最终标准（在丧亲后6-12个月间做出诊断）的预测能力。在排除了同时患有MDD、PTSD或GAD的个体后，满足PGD诊断的个体在未来（12-24个月）出现精神障碍、自杀意念、功能残疾和低生活质量的风险显著增高（相对风险RR在1.99到8.49之间，p<0.01）。即使在已患有其他精神障碍的个体中，共病PGD也预示着未来精神障碍的持续风险更高（RR=2.38, p=0.043）。
三、 主要结果 1. 症状筛选结果：通过IRT分析，从22个候选症状中确定了12个信息量大且无群体偏差的核心PGD症状，确保了诊断工具的心理测量学质量。 2. 最优算法结果：确定了以“渴念”为核心，附加9个症状中至少出现5个的最优诊断算法。该算法对IRT效标的敏感性为1.00，特异性为0.99，与访谈员诊断的一致性良好（Kappa=0.68），且与MDD、PTSD、GAD等诊断区分效度良好（Phi系数分别为0.36, 0.31, 0.17），证明了PGD是一个独立的症状群。 3. 病程标准验证结果：数据分析支持将诊断时间点设定在丧亲6个月后，因为早期（6个月内）的高哀伤反应可能代表正常的急性哀伤过程，而6个月后持续存在的症状才更可能预示着病理性的、长期的功能损害。 4. 预测效度结果：最终提出的PGD诊断标准（包含6个月病程和功能损害要求）显示出良好的预测效度。它能有效识别出那些在未来面临更高精神健康风险和功能损害的丧亲者，即使排除了其他常见精神障碍的影响，其预测作用依然显著。
四、 研究结论与价值 本研究通过系统的心理测量学分析，验证并完善了一套用于诊断延长哀伤障碍（PGD）的标准。结论表明，这套标准能够有效识别出那些在丧亲后面临持续痛苦和功能损害高风险的个人。研究结果为将PGD作为一个独立的精神障碍纳入DSM-V和ICD-11分类系统提供了强有力的实证支持。
科学价值： 1. 推动诊断标准化：首次通过大规模现场试验和先进的统计方法（IRT、组合分析）为PGD制定了操作化、可量化的诊断算法，填补了该领域缺乏公认诊断标准的空白。 2. 证实障碍的独立性：通过区分效度和预测效度的分析，进一步证实了PGD在症状表现、风险因素和预后方面与重性抑郁、焦虑障碍等存在本质区别，为其作为独立诊断实体提供了关键证据。 3. 明确病程阈值：通过纵向数据明确了“6个月”作为区分正常哀伤与病理性哀伤的关键时间点，为临床实践提供了重要参考。
应用价值： 1. 临床识别与干预：标准化的诊断工具有助于临床医生早期、准确地识别出需要干预的PGD患者，避免将其症状误判为抑郁症或简单归为“正常”哀伤而延误治疗。 2. 指导治疗与研发：明确的诊断标准是开展针对性心理治疗（如已证明有效的复杂性哀伤治疗）和未来药物研发的基础，并能促进相关治疗获得保险支付。 3. 流行病学研究：为在不同人群中调查PGD的患病率、风险因素和疾病负担提供了统一工具。 4. 减少疾病负担：通过早期识别和有效治疗，有望降低PGD导致的个人痛苦、社会功能丧失以及相关的公共卫生成本（如医疗资源使用增加、生产力下降）。
五、 研究亮点 1. 方法学严谨创新：研究采用了项目反应理论（IRT） 和差异项目功能（DIF）分析 来筛选症状，确保了诊断条目在不同人群中的公平性和测量精度；运用组合数学方法 穷举并优化诊断算法，使标准的确立基于数据驱动而非单纯专家意见。 2. 纵向设计验证预测效度：研究并非横断面相关分析，而是通过长达两年的纵向随访，实证检验了所提诊断标准对远期不良结局的预测能力，增强了结论的说服力。 3. 聚焦社区样本：研究对象主要来自社区而非临床机构，提高了研究结果在普通丧亲人群中的外推性，尽管样本在种族和年龄上存在一定局限性。 4. 排除共病影响：在分析预测效度时，特意控制了其他常见精神障碍（MDD, PTSD, GAD）的影响，凸显了PGD症状本身独特的致病风险。
六、 其他有价值内容 研究在讨论部分坦诚指出了局限性：样本主要为年长的白人丧偶者，未来需要在更年轻、更多元化（种族、文化）、经历非自然死亡或丧失非配偶亲属的人群中验证标准的普适性。此外，样本中精神疾病患病率低于某些其他丧亲研究，且部分因“过于痛苦”而拒绝参与的人可能未被纳入，可能导致PGD患病率被低估，也使得对功能损害效应的估计可能偏保守。这些都为后续研究指明了方向。
这项研究是PGD研究领域的一个里程碑，它通过科学严谨的方法，将一种长期被忽视的、具有明确临床意义的痛苦状态，系统地转化为了一个可操作、可验证的诊断实体，对临床实践和学术研究均具有深远影响。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问