RD-Net:通过视神经头的结构特征预测青光眼的残差-密集网络

使用残差密集网络 (RD-Net) 进行基于视神经头结构特征的青光眼预测

背景与研究目的

青光眼是全球范围内导致失明的主要原因之一,被称为“视力的无声窃贼”。其主要特征是视神经(Optic Nerve Head, ONH)的进行性损伤,可能在患者察觉到其视力受损之前已经造成不可逆转的视觉丧失。据统计,青光眼是继白内障之后的第二大致盲原因。早期对青光眼的筛查与准确诊断,对管理疾病进展及维持患者的视觉功能至关重要。

临床上,青光眼的诊断主要基于以下结构和功能性测试:眼内压(Intraocular Pressure, IOP)测量、视神经头的结构评估,以及视野检测。然而,视野检测通常需要昂贵的设备,难以普及到基层医疗机构。因此,通过分析视神经头的结构特征,例如杯盘比(Cup-to-Disc Ratio, CDR)、盘损伤可能性量表(Disc Damage Likelihood Scale, DDLS)以及视神经边缘宽度的ISNT规则(Inferior, Superior, Nasal, Temporal区域的宽度关系),可以在疾病的早期阶段进行快速有效的筛查。

尽管已有多种算法尝试通过自动方法检测视神经头损伤,但这些方法往往仅依赖于CDR这一单一指标,忽视了其他重要的解剖特征。此外,手动评估视神经头不仅耗时且昂贵,还容易受到主观因素的影响。基于以上背景,研究者旨在开发一种基于深度学习的混合模型,称为残差密集网络(Residual Dense Network, RD-Net),用于精准分割视神经盘(Optic Disc, OD)和视杯(Optic Cup, OC),并在此基础上进行青光眼预测。

论文来源

该研究由Preity、Ashish Kumar Bhandari、Akanksha Jha和Syed Shahnawazuddin等学者完成,他们均来自印度国家技术学院(National Institute of Technology Patna)的电子与通信工程系。该研究发表在IEEE Transactions on Artificial Intelligence的第6卷第1期(2025年1月)。该论文通过对四个基准数据集(Drishti, RIMONE, ORIGA和REFUGE)进行实验,展示了所提出模型的有效性。

研究方法与流程

全体流程概述

研究分为以下三个主要阶段: 1. 图像预处理:包括数据增强和样本标签编码。 2. RD-Net模型的构建与训练:利用额外的深度学习模块对传统U-Net进行改进。 3. 特征提取与青光眼预测:基于RD-Net分割的结果,计算CDR、DDLS和ISNT值实现预测。

1. 图像预处理

由于青光眼相关的视网膜图像数据集相对稀缺,为了增加训练样本的多样性,研究引入了Albumentation库对图像进行多种增强操作,包括随机旋转、翻转、弹性变换、光学畸变、网格扭曲以及统一尺度调整至256×256像素。数据增强产生了六种不同版本的图像,这显著扩展了训练数据集的大小(例如,Drishti数据集从30张训练图像扩展到300张)。

2. RD-Net网络架构

RD-Net是一种基于U-Net的混合深度网络,采用残差密集块(Dense Residual Block)和压缩激励块(Squeeze-Excitation Block, SE Block)加以改进。模型的细节包括18层卷积层、4个最大池化层,以及在编码器和解码器之间的跳跃连接(Skip Connection)。总体架构分为编码器和解码器两部分:

  • 编码器部分:包括五级卷积模块,每级包含卷积运算、批量归一化(Batch Normalization)、非线性激活(ReLU)和密集残差块。每级卷积后的最大池化层用于提取重要特征,同时减少空间维度。
  • 解码器部分:包括四级上采样(Upsampling),通过跳跃连接,整合当前解码器层的输出与对应编码器层的输出,逐步恢复原始分辨率。最后一层加入SE块和1×1卷积层,生成精确的分割图。

模型采用Adam优化器优化损失函数,初始学习率为0.001,并引入He Initialization用于权重初始化。此外,通过丢弃率为0.2的Dropout层实现正则化,避免模型过拟合。

3. 特征提取与预测

从RD-Net输出的视盘与视杯分割图中提取三个关键结构特征: - CDR计算:通过计算视杯垂直长度与视盘垂直长度的比例(通常视为早期青光眼的重要指标)。 - DDLS计算:定义为视盘的最小边缘宽度与视盘直径的比例,值小于0.3被认为是青光眼相关损害。 - ISNT规则:健康眼的边缘宽度顺序为Inferior < Superior < Nasal < Temporal,偏离此顺序可能暗示病变。

通过分析这些特征,进一步进行青光眼风险分级。

数据集与实验设置

研究使用了四个公开基准数据集: - Drishti:包含101张视网膜图像,已标注视盘及视杯的分割真值。 - RIMONE-DL:总计485张图像,由专家标注。 - ORIGA:包含650张图像,提供视盘与视杯联合分割的真值。 - REFUGE:一个青光眼检测挑战赛的数据集,总计400张图像。

模型训练及测试使用NVIDIA Tesla T4 GPU,搭载TensorFlow框架实现。

实验结果与分析

定性分析

通过在上述四个数据集上的实验,RD-Net生成的分割结果展现了清晰的边缘和较少的伪影。从Drishti等数据集的视觉结果对比来看,RD-Net的分割质量优于传统U-Net和U-Net++等模型。即使面对复杂场景(如完整视网膜图像与裁剪区域的对比),RD-Net稳定地提供清晰的分割图。

此外,当对ORIGA和REFUGE数据集同时进行视盘与视杯联合分割时,RD-Net同样表现出一致的高精度分割。

定量分析

研究使用Dice系数(DC)、交并比(IoU)、准确率(Accuracy)等7个标准量化模型性能。相比现有的代表性算法(如U-Net、ResUNet、K-means聚类等),RD-Net在四个数据集上的分割准确率达到了OC和OD分割的98.94%与99.40%。跨数据集测试同样显示了RD-Net的强鲁棒性。

消融实验与复杂性分析

研究者通过去除模块或调整超参数,验证了残差块和SE块的有效性。例如,去除SE块会显著降低分割质量(DRISHTI数据集的Dice系数下降至0.91)。尽管模型复杂度略高,但其卓越性能显著提升了青光眼预测的准确性。

青光眼评估

通过RD-Net分割的结果,提取多角度特征,如ISNT规则偏离、异常的DDLS及CDR值,为青光眼预测提供了可靠依据。例如,对于一例具有垂直CDR=0.45的病例,根据ISNT规则和相应的DDLS值诊断为非青光眼。

研究意义与价值

本研究提出的RD-Net模型不仅实现了高精度的视盘与视杯分割,还结合多种结构指标,提高了青光眼诊断的准确性和早期筛查能力。尤其在资源匮乏的基层医疗环境,自动化分割与预测技术能够显著节省人工成本,提高诊断效率。

该研究的未来工作方向包括: 1. 进一步开发青光眼严重程度分级系统; 2. 将模型扩展到其他视网膜疾病(如糖尿病视网膜病变)环境。

RD-Net通过融合先进的深度学习模块,为眼科影像分析提供了强大的工具,在公共健康和眼科领域具备广阔的应用潜力。