本文档属于类型b,是一篇关于Sankey流程图在老年晚期癌症患者症状轨迹可视化中应用的方法学综述论文。以下为针对中文读者的学术报告:
作者及机构
本文由Ethan Otto(罗切斯特大学医学中心)、Eva Culakova(罗切斯特大学医学中心)、Sixu Meng(加州大学伯克利分校)等合作完成,通讯作者为Marie A. Flannery(罗切斯特大学护理学院)。论文发表于《Journal of Geriatric Oncology》2022年6月刊。
主题概述
论文聚焦Sankey流程图(Sankey flow diagram)在老年晚期癌症患者症状轨迹可视化中的应用,系统阐述了该方法的数据处理原理、医学文献案例及设计规范,并结合临床研究数据展示其优势与局限性。
1. Sankey流程图的定义与医学可视化价值
Sankey是一种通过节点(nodes)和弧线(arcs)展示状态间流动关系的图表,最早用于物理学能量流动分析。论文指出其在医学领域的三大应用场景:
- 时间维度变化:如老年重症患者衰弱状态(frailty status)的年度变迁(Brummel et al., 2020);
- 事件序列可视化:例如乳腺癌患者治疗方案序列(Carleton et al., 2021);
- 关联性分析:如肿瘤激素受体状态与检测方法的关联(Kenn et al., 2018)。
支持证据:通过PubMed检索筛选出的13篇医学文献(附表1)显示,Sankey能直观呈现异质性人群的动态变化,尤其适合老年癌症患者的症状波动分析。
2. 症状轨迹可视化的方法学实践
论文以GAP70+临床试验(NCT02054741)为例,展示如何用Sankey分析692名老年癌症患者6个月治疗期间的三种症状(腹泻频率、疲劳干扰度、疼痛强度)轨迹:
- 数据预处理:将PRO-CTCAE(患者报告结局-不良事件通用术语标准)的78项症状量表评分(0-4分)按临床意义合并类别(如3-4分归为“重度”);
- 技术实现:使用Python的Plotly API生成交互式图表,通过弧线宽度反映患者比例,节点高度表示症状严重程度(图2);
- 临床解读:例如腹泻频率Sankey图(图2aii)显示,22%基线“偶发”患者中,27%恶化而12%退出研究,较传统条形图(图2ai)更能揭示个体差异。
3. Sankey设计的核心决策点
论文提出四类关键设计规范:
- 坐标轴逻辑:X轴通常为时间,Y轴按症状严重度排序,节点高度编码样本量;
- 节点合并策略:基于临床意义(如合并“重度”与“极重度”)或数据分布优化可读性;
- 缺失数据处理:建议添加“退出研究”节点(图3),避免间断缺失值导致的弧线断裂;
- 色彩方案:推荐使用ColorBrewer的离散色系(非渐变)并调整透明度以突出关键路径。
4. 与传统图表的比较优势
- 动态追踪能力:Sankey可同时显示多时间点状态及转化路径,而堆叠条形图仅能呈现静态分布;
- 多变量整合:如图2同时编码症状属性、时间、患者比例三个维度;
- 亚组分析潜力:可通过颜色区分性别等亚组的轨迹差异。
5. 局限性及应对建议
- 复杂性:需配合文字解释,且需编程技能(R/Python等);
- 小样本适用性:少数患者的转化路径可能因弧线过窄难以辨识;
- 软件依赖性:需专用工具(如Plotly)实现交互功能。
创新点
- 将工程学经典方法创新性迁移至老年医学领域;
- 提出“退出节点”等针对临床研究痛点的设计改良;
- 通过PRO-CTCAE数据验证了其在患者报告结局(patient-reported outcomes)中的实用性。
全文通过理论框架、案例实证与技术细节的结合,为医学研究者提供了Sankey流程图从构建到解读的全流程参考。