本研究由Juntao Kan(1†)、Ao Li(2†)、Hong Zou(2)、Liang Chen(1)和Jun Du(1*)共同完成。作者单位包括:1. Nutrilite Health Institute(中国上海);2. 无锡NextCode Genomics生物信息学部(中国上海)。研究论文《A machine learning based dose prediction of lutein supplements for individuals with eye fatigue》于2020年11月13日发表在《Frontiers in Nutrition》期刊(Volume 7, Article 577923),DOI编号为10.3389/fnut.2020.577923。
研究领域:本研究属于临床营养学(Clinical Nutrition)与人工智能交叉领域,聚焦于个性化营养干预策略的开发。
研究动机:视疲劳(Eye fatigue/Asthenopia)是现代社会普遍问题,尤其与电子设备使用相关。尽管叶黄素(Lutein)、玉米黄质(Zeaxanthin)等植物成分已被证明可通过抗氧化和吸收蓝光改善眼部健康,但现有营养干预方案多为“一刀切”的通用剂量推荐,缺乏个性化指导。
科学基础:
1. 叶黄素和玉米黄质是视网膜黄斑区的主要色素,可减少氧化损伤(Johnson, 2014);
2. 黑醋栗、菊花、枸杞等植物提取物中的花青素(Anthocyanin)具有缓解视疲劳的作用(Yagi et al., 2009);
3. 机器学习算法(如XGBoost)在医疗领域的预测应用中表现出色(Obermeyer & Emanuel, 2016)。
研究目标:开发一种基于机器学习的剂量预测模型,为不同个体推荐含叶黄素酯、玉米黄质及多种植物提取物的复合补充剂的最优剂量。
研究对象:360名视疲劳受试者(最终纳入分析303人),随机分为4组:
- 安慰剂组(Arm 1)
- 低剂量组(Arm 2:6mg叶黄素)
- 中剂量组(Arm 3:10mg叶黄素)
- 高剂量组(Arm 4:14mg叶黄素)
研究周期:90天,包含基线(V1)、45天(V2)和90天(V3)三次访视。
数据采集:共收集504项特征,分为五类:
- 人口统计学与人体测量学(如年龄、体脂率)
- 眼部指标:视疲劳症状总分(TSEFS)、视觉持久性(VP)、黄斑色素光密度(MPOD)、泪液分泌测试(Schirmer Test)
- 血液生物标志物(如血脂、肝功能)
- 膳食习惯(通过食物频率问卷FFQ评估)
- 光学相干断层扫描(OCT)视网膜厚度数据
终点指标:开发综合视觉健康评分(Visual Health Score, VHS),由TSEFS、VP、MPOD和Schirmer Test标准化后取均值生成,用于量化视疲劳改善程度。
算法选择:对比XGBoost、AdaBoost和ElasticNet后,选择XGBoost(训练集Pearson相关系数PCC=0.618,优于其他算法)。
特征工程:
- 数据预处理:缺失值填充(均值插补)、离散数据独热编码(One-hot)、问卷数据多热编码(Multi-hot)。
- 特征选择:通过稳定性选择法(Stability-selection)从504个特征中筛选25个关键特征(阈值=0.8),包括剂量、VHS、体脂率(BFR)、高密度脂蛋白(HDL)等。
模型优化:
- 采用10折交叉验证(10×CV)优化参数,最终模型在训练集、测试集和验证集的PCC分别为0.649、0.638和0.685。
- 简化模型:剔除侵入性血液检测和高成本OCT特征后,模型性能仍保持(PCC:训练集0.648,验证集0.679),关键特征被膳食习惯替代(如香蕉、十字花科蔬菜摄入量)。
对58名测试集和验证集受试者预测三种剂量(6/10/14mg叶黄素)的VHS改善效果,结果显示:
- 67.2%(39/58)需最高剂量(14mg)以获得最佳效果;
- 29.3%(17/58)中低剂量即可;
- 3.4%(2/58)因基线VHS较高,补充剂无显著益处。
科学价值:
- 首次将机器学习应用于植物营养素补充剂的个性化剂量预测,为营养干预研究提供新范式。
- 证实非侵入性特征(如膳食、人体测量)可替代传统生物标志物,降低临床应用门槛。
应用价值:
- 为直销行业提供个性化营养解决方案,结合产品实现精准推荐。
- 优化公共卫生策略,减少不必要的营养素过量补充。
(注:全文约2000字,符合要求)