本研究由南开大学的Zuo-Liang Zhu、南京大学的Beibei Wang†以及南开大学的Jian Yang†共同完成,发表于ACM Trans. Graph.期刊2025年4月刊。论文标题为《gs-ror2: bidirectional-guided 3dgs and sdf for reflective object relighting and reconstruction》。
本研究属于计算机图形学与计算机视觉交叉领域,聚焦于多视角图像中反射物体的重光照与三维重建问题。传统神经辐射场(NeRF)方法虽然能实现高质量渲染,但存在训练和渲染速度慢、难以捕捉尖锐几何细节等局限。3D高斯泼溅(3D Gaussian Splatting, 3DGS)技术虽提升了渲染效率,但其离散表示方式导致几何约束困难,特别在处理反射物体时容易出现几何错误和浮点伪影。
研究团队旨在解决两个核心问题:(1) 如何利用有符号距离场(SDF)的几何稳健性与3DGS的高效渲染优势;(2) 如何实现反射物体高质量重光照与几何重建的平衡。该研究对虚拟现实、数字孪生等领域具有重要应用价值。
研究提出名为GS-ROR2的创新框架,包含两个核心模块:
SDF辅助的高斯泼溅系统: - 采用延迟着色(deferred shading)模式:先将高斯属性(法线、反照率、粗糙度等)混合到图像平面,再进行着色计算,避免前向着色导致的反射模糊问题 - 建立混合高斯与低分辨率SDF的”相互监督”机制:通过深度和法线的双向约束(公式8,10),在不进行SDF渲染的情况下实现几何正则化 - 开发SDF感知的修剪策略:基于概率密度函数自动调整阈值(公式11),剔除远离SDF定义表面的高斯异常值
高斯引导的SDF增强: - 采用分阶段优化策略:先固定高斯参数,利用其混合法线微调上采样后的TensoSDF - 设计分辨率自适应机制:TensoSDF初始分辨率设为400×400(节省40%内存),最终上采样至512×512捕捉细节 - 引入混合法线监督(公式12)解决传统TSDF融合中深度与法线不一致的问题
研究使用四个数据集进行评估: 1. 合成数据集:TensoIR synthetic(漫反射物体)、Glossy Blender(镜面材质) 2. 真实场景:NEILF++中的反射物体(如麒麟雕像)
样本处理包含三个阶段: 1. 粗几何获取:1,000次迭代训练无SDF监督的延迟高斯泼溅 2. SDF预热:冻结高斯参数,3,000次迭代用高斯几何初始化TensoSDF 3. 联合优化:24,000次迭代使用联合损失函数(公式13)优化整个系统
在Glossy Blender数据集上的定量评估显示: - PSNR达23.39,SSIM达0.914,超越所有高斯基方法 - 训练时间仅1.5小时(RTX 4090),是TensoSDF的25%,NeRO的13% - 实时渲染速度达208 FPS,较NeRF基方法提升三个数量级
镜面反射分解结果(图14-17)表明: - 法线估计平均角度误差(MAE)7.23°,较基线方法降低34% - BRDF参数(粗糙度、金属度)分解准确,无过度平滑现象
在TensoIR合成数据集上: - 漫反射物体PSNR达27.07,SSIM达0.938 - 验证了框架对非反射物体的适应性
该研究为反射物体逆向渲染设立了新基准,其开源代码将推动计算机图形学与视觉的协同发展。