本研究的作者团队来自中国顶尖科研机构:Yuandong Li(北京航空航天大学自动化科学与电气工程学院)、Qinglei Hu(北京航空航天大学自动化科学与电气工程学院/天目山实验室/中法航空研究院,通讯作者)、Zhenchao Ouyang(北京航空航天大学中法航空研究院)以及Shuhan Shen(中国科学院自动化研究所/中国科学院大学人工智能学院)。该研究成果发表于IEEE Transactions on Circuits and Systems for Video Technology期刊2024年4月第34卷第4期,文章标题为”Neural Reflectance Decomposition under Dynamic Point Light”。
在计算机视觉与图形学领域,将场景分解为3D几何、表面材质纹理和光照是一个基础而具有挑战性的问题。近年来,基于神经隐式表示(neural implicit representation)的方法因其灵活性和紧凑性获得了广泛关注,如NeRF(Neural Radiance Fields)和NeuS(Neural Surface)等。然而,现有方法无法有效处理由单个动态点光源(dynamic point light)照射的图像,这在空间碎片监测等实际应用中十分常见。
传统方法如IRON虽然能够处理相机与光源共位的场景,但当光源、目标和相机存在相对运动时,其基于光线重合的假设不再成立,导致非朗伯表面材质纹理估计错误。此外,对于隐式表示的对象,动态点光源位置的估计仍是一个开放性问题。针对这些挑战,本研究提出了一种全新的自监督端到端神经反射分解算法。
研究团队设计了一个分阶段的训练框架,通过体积渲染(volume rendering)、自阴影逆向渲染(self-shadow inverse rendering)和基于物理模型的表面渲染(surface rendering)分别估计几何、光源位置和表面材质纹理。
第一阶段:3D几何重建 采用神经符号距离函数(SDF, Signed Distance Function)表示几何形状,通过体积辐射场进行训练。具体流程包括: 1. 构建映射函数:(x, d)→(s, g, c),其中x为空间点,d为相机方向,s为SDF值,g为几何特征描述符,c为颜色值 2. 使用改进的NeuS方法,将体积密度σ表示为SDF的函数 3. 通过alpha合成计算渲染像素颜色,并与真实像素比较计算损失
第二阶段:点光源位置估计 提出了一种创新的自阴影逆向渲染方案: 1. 粗估计:通过镜面反射区域计算光源初始位置 - 提取高亮度像素区域(阈值δ=0.8时误差最小) - 利用光线追踪算法获取高亮区域3D位置集 - 通过SDF导数估计表面法线 - 根据入射与反射光对称性计算平均光源方向 2. 精估计:基于自阴影一致性优化 - 通过光线追踪获取真实阴影图像(物体掩模减去图像掩模) - 给定假设光源位置,渲染预测阴影图像 - 使用粒子群优化(PSO)算法最小化阴影损失函数
第三阶段:表面材质纹理重建 扩展了IRON的BRDF(Bidirectional Reflectance Distribution Function)渲染方程: 1. 建立映射:(x, g)→(β, α, κ),分别对应漫反射反照率、粗糙度和镜面反射反照率 2. 采用GGX模型模拟镜面反射分量 3. 结合Smith项描述微表面相互遮蔽的衰减效应 4. 使用包含高斯金字塔、结构相似性(SSIM)和Eikonal项的多目标损失函数
研究团队开发了多项创新技术: 1. 动态光源位置估计算法:首次实现了对神经隐式表示对象的无标记动态光源估计 2. 分层解耦训练策略:有效解决了几何、光源和材质在渲染中的耦合问题 3. 自阴影逆向渲染方案:通过阴影一致性约束实现高精度光源定位 4. 改进的BRDF渲染管线:适应动态点光源条件下的材质分解需求
研究团队收集了新的合成与真实世界数据集: - 合成数据:使用Blender和Mitsuba渲染器生成100-150张照片级真实图像 - 真实数据:使用手机闪光灯作为点光源,拍摄200-300张多视角图像 - 包含NASA提供的航天器模型和常见物体,具有动态阴影特征
光源位置估计: - SR+SSIR组合方法平均误差最小(0.12m) - 仅使用SR或SSIR时误差增大35-50% - 显著优于基于朗伯定律的方法(LMM)
反射分解质量: - 在视图合成任务中,PSNR达到28.7dB,SSIM为0.91 - 镜面反射反照率重建的F1分数达0.89 - 重建几何的Chamfer距离小于0.05
对比实验: - 相比IRON,解决了动态阴影导致的纹理模糊问题 - 相比NeuS,保持了更多高频细节 - 在共位光源场景下与IRON性能相当
重建结果可部署到标准图形管线(如Blender)中实现: 1. 重光照(relighting):在不同光照条件下生成逼真渲染 2. 材质编辑(material editing):修改表面光学属性 3. 场景合成(scene composition):将对象融入新环境
方法创新性:
技术突破:
应用前瞻性:
作者指出了当前方法的三个主要限制: 1. 对相机位姿精度敏感,在阴影主导场景中表现下降 2. 基于灰度阈值的阴影分割难以区分纯黑物体与阴影 3. 将太阳建模为点光源而非平行光源的近似误差
未来工作将聚焦于: 1. 开发更鲁棒的相机位姿估计方法 2. 研究基于物理的阴影分割技术 3. 扩展至多光源和复杂光照环境 4. 优化太阳等远距离光源的建模方式
这项研究为动态光照条件下的神经反射分解建立了新范式,其技术路线和开源实现将为计算机视觉和图形学社区带来持续影响。