分享自:

一种用于色彩恒常性与色彩同化幻觉的传统方法及其在低光照图像增强中的应用

期刊:international journal of computer visionDOI:10.1007/s11263-025-02595-0

学术研究报告:一种整合色彩恒常性、色彩同化错觉与低光照图像增强的统一框架

本报告旨在向学界同仁介绍一项发表于《International Journal of Computer Vision》2026年134卷的重要研究。该研究由德国格赖夫斯瓦尔德大学(University of Greifswald)计算机科学系的Oguzhan Ulucan、Diclehan Ulucan和Marc Ebner共同完成。论文于2025年4月4日收到,同年11月28日被接受,并于2026年1月6日在线发表。

一、 研究背景与目标

本研究横跨计算机视觉与计算神经科学两个领域,核心关注点在于人类视觉系统中两个看似矛盾却又紧密相关的现象:色彩恒常性(Color Constancy)与色彩同化错觉(Color Assimilation Illusions)。

色彩恒常性是指人类视觉系统在不同光照条件下(如白炽灯下的黄色光或阴天的蓝色光)仍能相对准确地感知物体固有颜色的能力。这是计算机视觉中“白平衡”算法的核心目标,旨在从受光源颜色影响的图像中恢复物体的真实反射率。色彩同化错觉则是一种视错觉现象,指一个目标区域的感知颜色会向其周围邻近区域(诱导区)的颜色偏移,例如,在特定图案背景下,一个物理颜色为红色的区域可能被感知为橙色或紫色。

尽管计算神经科学领域的研究早已指出这两种现象之间存在深刻联系,并可能共享某些视觉处理机制,但在计算机视觉领域,它们却极少被放在同一个框架下进行研究。传统上,色彩恒常性算法致力于消除光照影响以获取“真实”颜色,而视错觉研究则关注如何模拟人类的“错误”感知,两者目标在计算上似乎是相悖的。

因此,本研究旨在弥合这一鸿沟。其核心目标是:开发一个单一的、无需学习的计算框架,使其能够同时处理色彩恒常性和色彩同化错觉,并进一步展示该框架在低光照图像增强任务上的应用潜力。 研究者希望证明,一个受人类视觉系统启发的、可解释的简单模型,能够在多个计算机视觉任务上取得与先进数据驱动模型相媲美的性能。

二、 研究方法与工作流程

本研究提出了一种名为 “多分辨率色彩恒常性” 的新方法。该方法不依赖于任何数据训练,完全基于低层次图像处理,其灵感来源于计算神经科学中关于尺度空间和空间平均颜色在颜色感知中作用的关键观察。

核心工作流程可分为以下几个详细步骤:

  1. 理论基础与算法核心:局部空间平均颜色 方法建立在改进的局部空间平均颜色算法之上。该算法基于一个假设:场景的平均颜色(空间平均颜色)在色彩恒常性中起着关键作用,类似于经典的“灰度世界”假设,但以局部而非全局方式进行。算法通过高斯卷积来高效计算每个像素点的局部空间平均颜色,该平均值被视为对该点光照的估计。为了在估计光照时更好地保持边缘信息(这对于处理多光源场景和阴影至关重要),研究者引入了引导滤波来平滑局部估计图,利用输入图像的梯度信息来引导平滑过程,从而在均匀区域平滑估计值,在边缘处保持锐利过渡。

  2. 多分辨率色彩恒常性策略 这是实现“一法多用”的关键创新。直接使用上述局部估计进行白平衡(即用输入图像除以局部估计)虽能实现色彩恒常,但无法模拟同化错觉。为解决此矛盾,研究者提出了尺度空间嵌套计算的策略:

    • 构建图像金字塔:首先,根据输入图像分辨率自适应地确定金字塔层数,生成输入图像在不同尺度(分辨率)下的表示。
    • 分层独立估计:对于金字塔中的每一层图像,都独立地使用上述改进的局部空间平均颜色算法计算其对应的像素级光照估计图。这一步至关重要,因为如果仅在最高分辨率层计算估计然后简单下采样到其他层,会导致局部信息在粗尺度上严重退化(见图4),从而损害后续处理效果。
    • 尺度空间内的白平衡:对于每一个金字塔层 l,将其输入图像 I_l 和对应的局部估计图 a_l 分别构建拉普拉斯金字塔和高斯金字塔。然后,在每一个尺度 s 上,执行类似白平衡的操作:P{O_l}_s = L{I_l}_s / G{a_l}_s。这里,除法操作在多个尺度上进行。
    • 金字塔重建:首先,将每个尺度 s 上得到的结果金字塔 P{O_l} 进行坍缩,得到该层 l 的输出。然后,将所有层 l 的输出再次组合成一个金字塔,并最终坍缩,生成单一的(带阴影的)反射率图 O。这种多尺度处理机制允许算法在不同尺度上整合信息:细尺度保留细节,粗尺度则更易捕获同化错觉所需的整体上下文信息(见图7)。
  3. 亮度增强模块 为了进一步模拟人类视觉系统对周围亮度的适应能力(即扩大动态范围),研究者增加了一个后处理步骤。首先对输入图像应用灰度世界假设进行初步白平衡,然后转换到CIELab颜色空间。对其中的明度通道 L* 进行直方图均衡化以增强对比度。最后,将这个增强后的明度通道与之前得到的反射率图 O 的色度通道 a*b* 合并,转换回RGB空间,得到最终的输出图像。在应用于低光照增强任务时,此步骤中的直方图均衡化被替换为基于百分比的对比度拉伸,以取得更好的效果。

  4. 实验设计与评估流程 研究通过三个系列的实验全面验证方法的有效性:

    • 色彩同化错觉实验:研究者构建了一个包含不同形状、颜色、诱导线频率和厚度的同化错觉图像集。由于该领域缺乏标准的定量评估指标和带真实值的数据集(因人类感知存在个体差异),评估主要基于视觉检查,即观察算法输出的目标区域颜色是否发生了与人类感知相似的偏移(见图7)。
    • 色彩恒常性实验:在五个公开基准数据集上进行了定量评估,涵盖单光源和多光源场景。
      • 多光源数据集:MIMO数据集(包含真实世界和实验室场景)、Rendered Mixed-Illumination测试集(合成图像)。
      • 单光源数据集:ColorChecker Recommended数据集(Gehler数据集的修正版)、Intel-TAU数据集、Rendered WB (Set 2)数据集。
      • 评估指标:主要使用角度误差(估计光照与真实光照向量之间的夹角)的均值、中位数、最佳25%分位数和最差25%分位数。部分数据集还补充了基于感知的 ΔE2000 色差指标。研究者将提出的方法与多种传统方法(如灰度世界、White-Patch Retinex、1st-order Gray-Edge等)和先进的基于学习的方法(如C5、SIIE、FC4等)进行了对比。
    • 低光照图像增强实验:为了展示方法的泛化能力,将其应用于低光照图像增强任务。在LOL-v1和LOL-v2两个主流低光照数据集上,使用峰值信噪比结构相似性指数作为指标,与22种基于学习的最新方法进行了比较。
    • 消融实验:为了验证“在每个尺度独立计算光照估计”这一设计选择的重要性,研究者在子数据集上对比了三种策略:单尺度版本、从最细尺度传播估计的版本、以及本文提出的独立估计版本。结果证实,传播策略会导致性能显著下降,而独立估计策略效果最佳。

三、 主要研究结果

  1. 色彩同化错觉模拟:视觉结果表明,所提出的方法能够成功模拟多种色彩同化错觉。如图7所示,对于不同的错觉图案,算法输出的目标区域颜色发生了与人类感知一致的偏移(例如,物理颜色为蓝色的圆盘被感知为紫色和绿色)。更重要的是,研究者观察到,错觉效应在更粗的尺度(低分辨率)上更为明显,这暗示了色彩恒常性与错觉感知之间的内在联系——两者可能都依赖于在刺激的“适当尺度”上提取信息。

  2. 色彩恒常性性能

    • 多光源场景:在MIMO真实世界数据集上,该方法取得了最佳的平均角度误差(3.2°)和中位数误差(2.6°),优于包括先进学习模型在内的众多方法。在实验室集和合成混合光照测试集上也表现出极具竞争力的性能(见表1、表2)。
    • 单光源场景:在ColorChecker Recommended和Intel-TAU这两个大型单光源数据集上,尽管评估条件并非最优(缺乏像素级真实值),该方法仍取得了平均角度误差第三佳的成绩(分别为2.32°和2.67°),并且在最差情况(Q3)下的误差控制得很好,这是一个非常实用的优势(见表3)。
    • 与单尺度版本对比:在所有色彩恒常性实验中,完整的多分辨率版本均优于其单尺度版本(后者无法模拟错觉)。这为“模拟错觉的能力与提升色彩恒常性性能相关”这一核心观点提供了实证支持,从计算机视觉角度证实了两种现象之间的联系。
  3. 低光照图像增强性能:该方法在LOL-v1和LOL-v2数据集上分别取得了22.28 dB和21.58 dB的PSNR,以及0.80和0.81的SSIM,在众多对比方法中平均排名第三(见表5)。视觉对比(图10)显示,该方法能有效提升亮度、增强细节,并同时校正低光照图像中常见的色偏,而许多专门的低光照增强方法在处理有色偏的图像时可能会产生不自然的颜色。

  4. 消融实验结果:实验数据(表4)明确显示,在单光源数据集子集上,“独立估计”策略的性能显著优于“从最细尺度传播估计”的策略。这验证了在每一尺度独立计算局部估计对于保持局部一致性、进而提升色彩恒常性精度的必要性,同时也与模拟错觉的需求相一致。

四、 研究结论与意义

本研究成功开发并验证了第一个能够在单一、可解释的框架内同时处理色彩恒常性、色彩同化错觉和低光照图像增强的计算机视觉方法。该方法完全无需学习,仅依赖于尺度空间计算和局部空间平均颜色等低层次处理。

其科学价值在于: 1. 桥梁作用:它有力地证明了在计算机视觉中整合研究色彩恒常性与色彩错觉的可行性与价值,为两个长期分离的研究方向搭建了桥梁。 2. 机理启示:通过展示模拟错觉的能力与色彩恒常性性能提升之间的正相关关系,为理解人类视觉系统中这两种现象共享的潜在计算机制提供了新的计算模型和线索。 3. 模型优势:展示了受神经科学启发、基于原理的简单模型,在面对复杂视觉任务时,可以不依赖大规模数据训练而达到与先进数据驱动模型相竞争的性能,强调了可解释性在算法设计中的重要性。

其应用价值在于: 1. 多功能性:同一个算法可应用于白平衡、视觉现象分析和低光照增强等多个任务,提高了算法的通用性和实用性。 2. 鲁棒性与效率:作为无参数优化、无需训练的方法,它避免了深度学习模型可能存在的域适应问题和对训练数据分布的依赖,计算效率高,且更易于理解和部署。

五、 研究亮点

  1. 首创性:这是首个明确提出并实现用单一算法框架同时解决色彩恒常性(恢复真实颜色)和色彩同化错觉(模拟错误感知)这一对计算目标相反任务的研究。
  2. 方法论创新:提出的“多分辨率色彩恒常性”策略,特别是“尺度空间内的尺度空间”计算流程,是方法的核心创新点,是实现多功能统一处理的关键。
  3. 跨学科融合:成功地将计算神经科学中关于尺度、空间平均颜色在颜色感知中作用的洞见,与计算机视觉中经典的色彩恒常性算法(如局部空间平均颜色)相结合。
  4. 卓越的性能与泛化能力:在多个标准数据集上,这个简单的无学习模型在色彩恒常性任务上达到了先进水平,并成功泛化至低光照图像增强任务,展现了强大的适应性和实用性。
  5. 深入的实证分析:通过系统的实验(包括在多个数据集上的测试、与大量基线对比、消融实验)和视觉分析,全面验证了方法的有效性和设计选择的合理性,并为色彩恒常性与错觉之间的联系提供了计算证据。

六、 其他有价值的内容

研究者在讨论中也指出了当前领域的挑战,例如在色彩错觉研究中缺乏标准的定量评估指标和带真实值的数据集,这主要是由于人类颜色感知存在个体差异。他们建议未来的工作可以探索基于学习的策略来分析颜色错觉,并专注于创建相应的评估技术。此外,论文也坦诚了方法的局限性,例如在处理某些低光照场景时可能比最先进的基于网络的方法更容易受到噪声影响。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com