本研究由Alaina H. Shreves(第一作者,通讯作者,单位:牛津大学纳菲尔德人口健康系、牛津大学大数据研究所、美国国立卫生研究院国家癌症研究所癌症流行病学和遗传学学部)、Scott R. Small、Rosemary Walmsley、Shing Chan、Pedro F. Saint-Maurice、Steven C. Moore、Keren Papier、Kezia Gaitskell、Ruth C. Travis、Charles E. Matthews、Aiden Doherty等研究人员合作完成。该研究论文发表于《British Journal of Sports Medicine》,最终编辑版本于2024年发表,卷号为59,期号为12,页码范围839-847,数字对象标识符(DOI)为10.1136/bjsports-2024-109360。
本研究属于流行病学与预防医学领域,具体聚焦于身体活动与癌症风险的前瞻性队列研究。研究背景基于一个重要的公共卫生认知:在高收入国家,超过一半的新发癌症可能通过改变生活方式因素(包括解决身体活动不足问题)来避免。大量基于问卷的流行病学研究已经表明,身体活动(Physical Activity, PA)与多种癌症(如膀胱癌、乳腺癌、结肠癌、子宫内膜癌、食管腺癌、肾癌、胃癌等)的风险呈负相关。然而,这些研究大多依赖于自我报告,且主要关注闲暇时间的中高强度身体活动(Moderate-Vigorous-Intensity Physical Activity, MVPA)。事实上,个体在清醒时间的大部分活动是久坐行为(Sedentary Behaviour, SB)或低强度身体活动(Light-Intensity Physical Activity, LIPA),如随意行走、家务和购物。因此,了解低强度或中等强度活动是否也与较低的癌症风险相关至关重要。此外,可穿戴加速计设备能够客观、全面地测量日常总活动量、不同强度活动及步数,为更精确地描述身体活动与癌症风险之间的剂量-反应关系提供了可能。世界卫生组织等指南制定机构也呼吁开展更多使用加速计的前瞻性研究。基于此,本研究旨在利用英国生物银行(UK Biobank)的大型前瞻性队列和腕戴式加速计数据,深入探究每日总身体活动量、活动强度(包括SB、LIPA、MVPA)以及每日步数与13种先前被证明与低身体活动相关的癌症(复合结局)发病风险之间的关联。
本研究的工作流程系统而严谨,主要包括以下几个步骤: 首先,确定研究人群与数据来源。研究基于英国生物银行前瞻性队列,该队列在2006-2010年间招募了超过50万名英国成年人。在2013-2015年间,其中106,053名拥有有效电子邮箱的参与者被邀请参加一项加速计子研究。参与者通过邮件收到Axivity AX3腕戴式加速计,并被要求在其非优势手腕上连续佩戴7天。最终,研究团队获得了103,712名参与者的有效加速计数据。
其次,进行加速计数据处理与变量提取。这是本研究方法学的核心。研究人员使用专门为英国生物银行数据开发的流程(“accelerometer”, v7.1.0)处理原始加速计数据。通过计算每日矢量幅度(以毫重力单位,mg表示)的平均值得出总身体活动量,该指标综合反映了24小时内活动的强度和持续时间,并已通过双标水法(能量消耗测量的金标准)进行了外部验证。更重要的是,研究采用随机森林和隐马尔可夫模型等机器学习方法,基于自由生活条件下的可穿戴摄像头和时间使用日记数据进行训练,将每日时间分类为睡眠、久坐行为(SB)、低强度身体活动(LIPA)和中高强度身体活动(MVPA)。这些模型的平均分类准确率达到88%。对于步数,研究使用一种基于自监督学习的混合模型(“stepcount”, v3.1.1)从加速度数据中推导,该模型在自由生活数据上的平均百分比误差为12.5%。步数报告为有效天数内的中位数。此外,研究还计算了步速强度指标,即峰值30分钟步频(peak 30-minute cadence),作为步行强度的代理指标,计算方法是取每天最高的30个一分钟步频的平均值(这些分钟不一定连续)。
第三,确定研究结局与构建分析样本。研究的主要结局是首次诊断出13种与低身体活动相关的癌症(膀胱癌、乳腺癌、结肠癌、子宫内膜癌、食管腺癌、胃贲门癌、头颈癌、肾癌、肝癌、肺癌、髓系白血病、多发性骨髓瘤、直肠癌)中的任何一种,构成一个复合癌症结局。癌症诊断信息通过链接英国国民医疗服务体系(NHS)的登记数据获得。在构建最终分析样本时,研究排除了设备校准或读数错误、佩戴时间不足72小时、平均加速度异常高、步数数据缺失的参与者,以及在佩戴加速计前已患癌症(非黑色素瘤皮肤癌除外)、缺少医疗记录链接或协变量数据缺失的个体。最终分析样本包含85,394名参与者。
第四,开展详细的统计分析。研究采用Cox比例风险回归模型来估计风险比(Hazard Ratio, HR)及其95%置信区间(CI)。以达到年龄为时间尺度。分析策略是多方面的:1)总身体活动分析:按总身体活动量的五分位数进行分析,并使用限制性立方样条回归探索非线性关系。2)久坐时间与活动强度分析:采用三种模型:a) 单因素模型,分别评估SB、LIPA、MVPA每增加1小时/天与癌症风险的关系;b) 分区模型,在相互调整其他清醒行为时间的前提下,评估每种行为的独立关联;c) 等时替代模型,估计在总清醒时间不变的情况下,将1小时/天的SB重新分配给LIPA或MVPA所带来的癌症风险变化。此外,还应用了成分数据分析方法来考虑睡眠时间的影响。3)步数与步速强度分析:分析步数五分位数与癌症风险的关系,并使用限制性立方样条探索剂量-反应曲线。同时,在调整和不调整每日总步数的情况下,分析峰值30分钟步频与癌症风险的关联。所有模型均针对人口统计学特征、健康状况和生活方式因素(如性别、种族、吸烟状况、饮酒、教育、地区剥夺指数、自评健康、水果蔬菜摄入、红肉加工肉摄入等)进行了调整,女性特异性模型还额外调整了口服避孕药、激素替代疗法和生育史。
第五,进行广泛的敏感性分析以检验结果的稳健性。这包括:分别拟合13种特定部位癌症的模型;评估总身体活动量和步数每增加1个标准差(SD)与癌症风险的关联;分析所有恶性癌症(非黑色素瘤皮肤癌除外)的发病风险;从复合结局中排除肺癌后进行分析;按吸烟状况、年龄、性别、残疾、糖尿病史、心血管病史和体重指数(BMI)进行分层分析;通过排除随访前两年和四年的数据来探讨反向因果关系的可能性;以及使用E值评估未测量混杂因素需要达到多强的关联才能解释观察到的结果。
本研究获得了丰富且具有启示性的主要结果。 关于总身体活动量,研究发现其与复合癌症结局风险呈显著负相关。与总身体活动量最低五分位(<21.6 mg)的个体相比,处于第二五分位(21.6–25.4 mg)的个体癌症风险降低16%(HR=0.84),而处于最高五分位(≥34.3 mg)的个体风险降低26%(HR=0.74)。男性和女性均观察到类似的趋势。剂量-反应关系在男性中呈线性,在女性中呈非线性。在针对所有恶性癌症(非黑色素瘤皮肤癌除外)的分析中,也观察到了类似的负相关关系,但关联强度稍弱。对特定癌症部位的分析显示,有六种癌症(如结肠癌、肺癌等)存在显著负相关,另外三种有提示性关联(10%风险降低)。值得注意的是,子宫内膜癌的风险降低关联在调整BMI后减弱。在排除肺癌或按不同亚组(如吸烟状况)进行分层分析后,总身体活动量与复合癌症风险的负相关关系基本保持一致。调整BMI后,风险比仅轻微衰减(从HR=0.87变为HR=0.89),且在不同BMI亚组中关联相似。
关于久坐时间与活动强度,在单因素模型中,SB每增加1小时/天与癌症风险增加相关(HR=1.06),而LIPA(HR=0.93)和MVPA(HR=0.85)则与风险降低相关。然而,在相互调整了其他行为时间的分区模型中,LIPA(HR=0.94)和MVPA(HR=0.87)每增加1小时/天仍与较低的癌症风险独立相关,而SB则不再显示出独立关联(HR=1.00)。等时替代模型的结果更具公共卫生指导意义:在总清醒时间不变的前提下,将每天1小时的SB替换为LIPA,与癌症风险降低7%相关(HR=0.93);替换为MVPA,则与风险降低14%相关(HR=0.86)。性别分层分析显示,男性中,用MVPA替代SB(HR=0.81)或用LIPA替代SB(HR=0.94)均与风险降低相关,用MVPA替代LIPA也相关(HR=0.86)。而在女性中,仅观察到用LIPA替代SB与风险降低相关(HR=0.93),用MVPA替代SB或LIPA的关联未达到统计学显著性。成分数据分析的结果与等时替代模型基本一致。
关于步数与步速强度,每日步数与癌症风险呈显著负相关,且存在剂量-反应关系。以每日5000步为参照,每日走7000步的风险降低11%(HR=0.89),走9000步的风险降低16%(HR=0.84),走13000步的风险降低20%(HR=0.80)。剂量-反应曲线在每日约9000步左右开始趋于平缓。性别分层显示,男性的关联呈非线性,而女性呈线性。在调整每日总步数之前,更高的峰值30分钟步频(步速强度)与更低的癌症风险相关。然而,在调整了每日总步数后,步速强度与癌症风险的关联不再具有统计学显著性。这表明,对于癌症风险而言,每日累积的步数总量比步行的强度更为重要。敏感性分析显示,在排除肺癌或按不同因素分层后,步数与癌症风险的负相关关系仍然稳健。调整BMI后,关联略有减弱(HR从0.90变为0.92),且在最低(≤24.9 kg/m²)和最高(≥30 kg/m²)BMI组中,步数与风险的关联更接近无效值。
基于以上结果,本研究得出结论:更高的总身体活动量、低强度身体活动(LIPA)、中高强度身体活动(MVPA)以及每日步数,均与较低的癌症发病风险相关。久坐行为(SB)本身与癌症风险无独立关联,但用LIPA或MVPA替代SB时间可以降低风险。每日步数比步速强度更能预测癌症风险,且风险降低在每日约9000步左右达到平台期。这些发现表明,任何强度的身体活动和步行都可能与降低癌症风险有关。
本研究的科学价值在于,它首次在大规模前瞻性队列中,综合使用客观测量的加速计数据、先进的机器学习活动分类方法以及多种统计模型(包括等时替代模型),系统性地揭示了不同强度日常身体活动、久坐行为、步数与多种癌症风险的关联。其应用价值显著:研究结果支持将低强度和高强度活动融入日常生活,特别是在中年时期,并支持将步行作为公共卫生倡议的基本组成部分,以有效降低特定癌症的风险。这为未来制定更精细、更具操作性的身体活动指南提供了重要的实证依据。
本研究的亮点突出体现在以下几个方面:1)方法学创新与客观性:大规模使用腕戴式加速计客观测量自由生活状态下的身体活动,避免了传统问卷回忆偏倚;应用经自由生活数据验证的机器学习模型精确区分活动强度;采用等时替代模型和成分数据分析等先进统计方法,深入解析不同行为时间重新分配的健康效应。2)研究发现的公共卫生意义:明确证实了低强度日常活动(如家务、随意走动)的独立健康益处,而不仅仅是中高强度锻炼;量化了步数与癌症风险的剂量-反应关系,并找到了风险降低开始趋于平缓的步数阈值(约9000步/天),为公众提供了清晰、易行的目标;揭示了对于癌症预防而言,“多动”可能比“剧烈动”更重要,因为步数总量比步速强度更具预测性。3)分析的深度与稳健性:研究不仅分析了复合结局,还探索了特定癌症部位;进行了广泛的分层分析和敏感性分析,以评估混杂、效应修饰和反向因果关系的可能性,增强了结果的可信度。
此外,研究也坦诚地指出了其局限性:UK Biobank参与者主要为中年人群,且比英国一般人群更健康、社会经济地位更高,可能限制结果的普遍性;加速计仅测量了中年时期一周的活动,可能无法完全代表长期行为模式;作为观察性研究,不能完全排除未测量混杂因素的影响;无法评估较少见癌症的关联。这些为未来研究指明了方向,例如需要对特定癌症类型进行更深入的纵向研究,并在更广泛、更多样化的人群中验证这些发现。
这项研究为“身体活动有益健康、可防癌”提供了强有力的、基于客观测量证据的支持,并将关注点从传统的“锻炼”扩展到了全天的“活动”模式,强调了即使是低强度的日常活动和简单的增加步行,也可能成为降低癌症风险的有效策略。