本研究由 Judy E. Stern(达特茅斯盖泽尔医学院)、Alexander C. McLain(南卡罗来纳大学阿诺德公共卫生学院)、Germaine M. Buck Louis(美国国家儿童健康与人类发展研究所)、Barbara Luke(密歇根州立大学)和 Edwina H. Yeung(美国国家儿童健康与人类发展研究所)共同完成。论文《Accuracy of self-reported survey data on assisted reproductive technology treatment parameters and reproductive history》于 2016年8月 发表于妇产科领域权威期刊 《American Journal of Obstetrics and Gynecology》(Am J Obstet Gynecol)。
本研究属于生殖流行病学与公共卫生研究交叉领域。随着全球范围内通过辅助生殖技术(Assisted Reproductive Technology, ART)出生的婴儿数量超过五百万,且大量研究表明ART妊娠可能带来不良妊娠结局(如低出生体重、早产、出生缺陷等)风险的增加,对ART子代及其母亲进行长期健康随访研究的需求日益迫切。此类研究通常依赖于临床数据、出生证明或自我报告调查数据。其中,基于问卷调查的自我报告数据因其成本效益和可行性,在大规模人群研究中被广泛应用。
然而,使用自我报告数据的前提是信息的准确性。尽管研究团队先前已在“纽约州北部儿童研究”中发现母亲对是否接受过IVF(体外受精)治疗的报告基本准确,但关于治疗具体参数(如是否使用了卵胞浆内单精子注射、辅助孵化等技术)的报告准确性尚未在大人群中得到充分验证。临床诊疗中的许多环节,特别是实验室操作,患者可能并不完全了解或准确记忆。
因此,本研究的主要目的是系统评估母亲自我报告的ART治疗具体参数和生育史的准确性。具体目标包括: 1. 以临床登记系统(SART CORS)数据为金标准,评估母亲对本次分娩(索引分娩)所用ART治疗类型(如新鲜胚胎移植、冻融胚胎移植)、是否使用供体配子、以及是否应用卵胞浆内单精子注射和辅助孵化等具体技术的报告准确性。 2. 评估母亲对本次分娩前接受过的生育治疗(如既往ART周期、促排卵药物使用)的报告准确性。 3. 探索可能影响报告准确性的因素,如母亲年龄、调查间隔时间、是否有男性因素不孕诊断、以及既往是否有ART治疗史。
本研究是一项基于人群的回顾性队列验证研究,核心方法是将两份独立来源的数据进行链接与比对。
1. 数据来源: * 自我报告数据源: 来自“纽约州北部儿童研究”的母亲问卷。该研究通过纽约州围产期数据系统,识别了2008年至2010年间纽约州北部(除纽约市五个区外)57个县的所有活产婴儿。研究旨在构建一个基于人群的、包含ART受孕和非ART受孕婴儿的队列,以评估儿童生长发育。研究人员向符合条件(出生证上标记为不孕治疗受孕、或为多胎)的母亲邮寄了自填式问卷,在分娩后约4-6个月(中位时间147天)完成回收,问卷回复率高达93%。问卷内容涵盖本次分娩的ART治疗细节以及既往生育治疗史。 * 临床金标准数据源: 来自“辅助生殖技术协会临床结局报告系统”(Society for Assisted Reproductive Technology Clinic Outcome Reporting System, SART CORS)数据库。该数据库依据美国联邦法律建立,收集了全美超过90%的ART诊所、覆盖超过95%的ART周期的临床数据。数据包括患者人口学信息、生殖史、周期特异性治疗数据(如新鲜/冷冻周期、供体卵子/精子使用、ICSI、辅助孵化、胚胎移植数量与质量)和妊娠结局。SART和美国疾病控制与预防中心每年会对数据进行验证,包括随机抽查诊所进行现场审计,确保了数据的完整性与准确性。
2. 研究对象与链接: 研究人群为“纽约州北部儿童研究”中那些通过链接算法成功匹配到SART CORS数据库中有活产结局的ART周期的分娩事件。最终成功链接的索引分娩(index delivery)数量为 617例。这些母亲的人口学特征显示:多数年龄在35岁或以上(59%)、白人非西班牙裔(90%)、拥有学士或更高学历(78%)、享有私人医疗保险(97%)。
3. 数据比对与统计分析流程: * 定义比对参数: 研究人员从两个数据库中提取了针对同一批母亲-婴儿对的特定治疗参数进行比对。针对索引分娩,比对的参数包括:治疗类型(冻融胚胎移植)、供体卵子或精子使用、卵胞浆内单精子注射(ICSI)和辅助孵化(AH)的使用。此外,还比对了促排卵药物(注射用药)的使用、阴道超声检查,以及本次分娩前是否有过IVF或冻融胚胎移植治疗。 * 确定金标准: * 对于索引分娩的治疗参数,以SART CORS数据为金标准,因为它代表经过验证的临床记录。 * 对于既往治疗史,则以母亲自我报告为更准确的标准。这是因为研究作者(Luke和Stern)基于对SART CORS全国性链接数据的观察发现,其中关于“既往ART周期数”的字段与同一患者纵向链接的周期记录存在不一致,可能不够可靠。 * 计算一致性指标: * 一致性(Agreement): 计算两个数据源对某一参数回答“是”或“否”完全一致的个案占总体的百分比。 * 灵敏度(Sensitivity): 在金标准(SART CORS)为“是”的个案中,母亲问卷也正确报告为“是”的比例。这衡量了母亲正确识别出某项治疗已发生的能力。 * 使用卡方检验判断自我报告与临床数据之间的差异是否具有统计学显著性(p<0.05)。 * 探索影响因素: 使用逻辑回归模型,计算未调整的比值比,以评估母亲年龄、调查间隔时间、是否存在男性因素不孕诊断、以及是否有既往ART治疗史等因素,是否与那些一致性不完美的参数的报告灵敏度存在关联。 * 敏感性分析: 考虑到队列中多胎婴儿被过度抽样,研究人员还对分析结果进行了加权处理,以评估其对结论的影响。
研究结果清晰地揭示了母亲自我报告在不同类型ART信息上的准确性存在显著差异。
1. 索引分娩治疗参数的准确性(表2结果): * 高准确性参数: * 治疗类型(冻融胚胎移植,FET): 一致性高达96%,灵敏度为93%。表明母亲能非常准确地回忆并报告本次怀孕使用的是新鲜还是冷冻胚胎。 * 供体配子使用: 使用供体卵子的一致性和灵敏度分别为97%和82%;使用供体精子的一致性和灵敏度分别为98%和82%。一致性极高,但灵敏度略低,意味着有少数使用了供体配子的母亲未在问卷中报告。 * 药物治疗: 一致性为83%,灵敏度高达92%。说明母亲对是否使用过注射类药物有很好的回忆。 * 低准确性参数: * 实验室显微操作技术: * 卵胞浆内单精子注射(ICSI): 一致性为78%,灵敏度为78%。意味着约有22%实际接受了ICSI治疗的母亲未能正确报告。 * 辅助孵化(AH): 一致性仅为57%,灵敏度低至38%。这是所有参数中准确性最差的。超过60%实际接受了辅助孵化的母亲未能报告,同时也有部分未接受的母亲错误报告为接受。 * 其他参数: 阴道超声检查的报告一致性为80%,但值得注意的是,在SART CORS中所有ART周期都必然包含阴道超声,而20%的母亲在问卷中报告为“未使用”,这可能是对问题的理解偏差(认为其是独立项目而非IVF常规环节)。
2. 既往治疗史报告的准确性(表3结果): 当以母亲自我报告为金标准时,SART CORS中记录的既往治疗史信息与母亲报告的一致性较差。对于既往是否接受过IVF、冻融胚胎移植或使用过促性腺激素,SART CORS数据的灵敏度仅在75%至82%之间,进一步证实了使用SART CORS的“既往治疗”字段进行研究可能存在局限。
3. 影响报告准确性的因素: * 既往ART经验: 有既往ART治疗史的母亲,能更准确地报告本次治疗中的药物使用(OR=3.73)、ICSI使用(OR=1.93)和辅助孵化使用(OR=1.66)。这表明治疗经验提升了患者对流程和术语的理解。 * 不孕病因: 诊断为男性因素不孕的母亲,正确报告ICSI使用的几率更高(OR=1.81),这与ICSI常用于解决男性不育的临床实践相符,患者可能因此对该技术印象更深。 * 无影响的因素: 母亲年龄和分娩后到完成问卷的时间间隔(本次研究中位数为147天),未发现对任何参数的报告准确性有显著影响。
本研究得出的核心结论是:母亲能够相对准确地自我报告ART治疗的宏观层面信息(如是否进行IVF、是否使用冷冻胚胎或供体配子),但对于发生在实验室内部、技术性更强的具体操作(如ICSI和辅助孵化),其自我报告的准确性显著下降。
这一结论具有多重重要价值: * 科学价值: 为生殖流行病学研究提供了关键的方法学参考。它明确了在利用问卷调查数据时,哪些ART变量可以较可靠地使用,哪些需要格外谨慎甚至避免使用。例如,研究中辅助孵化的报告灵敏度(38%)远低于文献中建议的用于统计校正的最低可接受水平(60%),因此不建议在研究中依赖自我报告的辅助孵化数据。而对于ICSI等参数,尽管不完美,但其灵敏度(78%)提示在必要时可尝试进行测量误差校正。 * 临床应用价值: 研究结果指向了医患沟通改进的重要方向。数据表明,患者对发生在“幕后”的实验室程序了解不足。因此,临床医生和胚胎实验室有必要加强与患者的沟通,用更清晰、非专业术语的方式解释ICSI、辅助孵化等技术的原理、必要性和潜在风险,确保患者在知情同意过程中真正理解其所接受的治疗。 * 研究方法建议: 对于未来设计涉及ART的治疗史问卷,研究者应考虑提供更详细的程序描述而非仅仅列出专业术语。例如,不仅问“是否使用了卵胞浆内单精子注射(ICSI)”,还可以附加说明“即由胚胎学家将单个精子直接注入卵子中的过程”。这有助于提高患者对问题的理解度和回答的准确性。
研究也讨论了自身的一些局限性,例如:数据链接可能存在微小误差;问卷因篇幅限制未能对ICSI、AH等术语提供详细解释;研究样本主要来自纽约州且参与者可能具有更高的健康素养(self-selection bias),这些因素可能高估了普通人群的自我报告准确性。然而,这些局限性的坦诚讨论增强了研究的透明度,并指明了未来研究可以改进的方向,例如设计包含更详尽解释的问卷或在更广泛的人群中进行验证。