分享自:

实时辐射场渲染的3D高斯溅射技术

期刊:ACM Trans. Graph.DOI:10.1145/3592433

这篇文档属于类型a,即报告了一项原创性研究。以下是基于文档内容生成的学术报告:


研究作者及机构

本研究由Bernhard Kerbl、Georgios Kopanas、Thomas Leimkühler和George Drettakis共同完成。Bernhard Kerbl和Georgios Kopanas来自法国Inria和Université Côte d’Azur,Thomas Leimkühler来自德国Max-Planck-Institut für Informatik,George Drettakis也来自法国Inria和Université Côte d’Azur。该研究于2023年8月发表在《ACM Transactions on Graphics》期刊上。

学术背景

本研究的主要科学领域是计算机图形学中的实时渲染(real-time rendering)和辐射场(radiance fields)合成。近年来,基于神经辐射场(Neural Radiance Fields, NeRF)的方法在多视角图像合成中取得了显著进展,但这些方法通常需要昂贵的训练和渲染成本,且难以在1080p分辨率下实现实时渲染。现有的快速方法往往在速度和质量之间进行权衡,无法同时满足高质量和实时渲染的需求。

本研究的目标是提出一种新的方法,能够在保持高质量的同时实现实时渲染。为此,研究者开发了一种基于3D高斯分布(3D Gaussians)的场景表示方法,并结合了实时可微分渲染器,显著提升了场景优化和新视角合成的速度。

研究流程

1. 场景表示与初始化

研究从相机校准过程中生成的稀疏点云出发,使用3D高斯分布来表示场景。这种表示方法保留了连续体积辐射场(continuous volumetric radiance fields)的优点,同时避免了在空域中进行不必要的计算。具体来说,每个3D高斯分布由其位置(均值)、协方差矩阵和不透明度(opacity)定义。研究还使用球谐函数(spherical harmonics, SH)来表示辐射场的颜色信息。

2. 优化与密度控制

研究者提出了一种交替优化和密度控制的方法。首先,通过优化3D高斯分布的位置、协方差、不透明度和SH系数来逐步改进场景表示。其次,通过自适应密度控制步骤动态增加或删除3D高斯分布,以更好地表示场景的几何结构。具体策略包括克隆(cloning)和分割(splitting)高斯分布,以覆盖未重建的区域或优化大高斯分布。

3. 实时渲染算法

研究者开发了一种基于分块(tile-based)的快速渲染算法,支持各向异性(anisotropic)高斯分布的可视性感知渲染。该算法通过GPU上的快速排序和分块渲染,实现了高效的渲染和反向传播。具体步骤包括将屏幕划分为16×16的分块,剔除与视锥体不相交的高斯分布,并通过深度排序进行近似α混合(alpha blending)。

4. 数据优化与训练

研究使用Python和PyTorch框架实现了该方法,并编写了自定义的CUDA内核用于渲染。优化过程从低分辨率图像开始,逐步提升分辨率以稳定训练。SH系数的优化也分阶段进行,逐步引入更高阶的SH分量以捕捉视图依赖的视觉效果。

主要结果

研究在多个公开数据集上进行了测试,包括Mip-NeRF360、Tanks&Temples和Deep Blending数据集。实验结果表明,该方法在保持高质量的同时实现了实时渲染(≥30 fps),且训练时间与现有最快方法相当。具体数据如下: - 在Mip-NeRF360数据集上,该方法在30k次迭代后达到了27.21的PSNR(峰值信噪比),优于Mip-NeRF360的24.3。 - 在Tanks&Temples数据集上,该方法在30k次迭代后达到了23.14的PSNR,与InstantNGP(21.92)相当。 - 在Deep Blending数据集上,该方法在30k次迭代后达到了29.41的PSNR,接近Mip-NeRF360的29.40。

研究还展示了该方法在合成数据集(如Blender数据集)上的表现,证明了其在随机初始化情况下的高效性和鲁棒性。

结论与意义

本研究首次实现了高质量辐射场的实时渲染,填补了现有方法在速度和质量之间的空白。通过引入3D高斯分布和高效的渲染算法,研究证明了在优化和渲染过程中,连续表示并非必需,为未来的研究提供了新的思路。该方法在计算机图形学、虚拟现实和增强现实等领域具有广泛的应用前景。

研究亮点

  1. 创新性场景表示:首次将3D高斯分布用于辐射场表示,结合了体积渲染的优点和高效的渲染能力。
  2. 实时渲染:在1080p分辨率下实现了≥30 fps的实时渲染,显著提升了用户体验。
  3. 高效优化:通过自适应密度控制和分块渲染算法,实现了与现有最快方法相当的训练时间。
  4. 广泛适用性:在多种数据集和场景中验证了方法的有效性和鲁棒性。

其他有价值的内容

研究还讨论了该方法的局限性,如在未充分观察的区域可能产生伪影,以及大高斯分布可能导致的“弹出”现象。未来的工作可以进一步优化这些方面,并探索将3D高斯分布用于网格重建的可能性。


这篇报告详细介绍了该研究的背景、方法、结果和意义,为相关领域的研究者提供了全面的参考。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com