一种用于实时渲染超大数据集的分层3D高斯表示方法

分享自：
一种用于实时渲染超大数据集的分层3D高斯表示方法

期刊:ACM Transactions on GraphicsDOI:10.1145/3658160
类型a
本研究的主要作者包括Bernhard Kerbl（来自Inria，法国蔚蓝海岸大学和奥地利维也纳工业大学）、Andreas Meuleman、Georgios Kopanas（均来自Inria，法国蔚蓝海岸大学）、Michael Wimmer（奥地利维也纳工业大学）、Alexandre Lanvin和George Drettakis（均来自Inria，法国蔚蓝海岸大学）。该研究于2024年7月发表在ACM Transactions on Graphics期刊上。
这项研究的学术背景属于计算机图形学领域，特别是实时渲染和大规模场景表示。近年来，基于神经辐射场的新视图合成技术取得了重大进展，但现有方法在处理非常大的场景时遇到了资源限制问题。传统的3D高斯点阵化方法虽然提供了高质量的视觉效果和快速训练，但对于超大场景的表示仍然存在局限性。因此，本研究旨在开发一种新的分层3D高斯表示方法，以实现超大数据集的实时渲染。
该研究的工作流程主要包括以下几个步骤：
首先，场景分割与粗略初始化。研究人员将整个场景划分为多个块（chunks），每个块的大小根据采集方式不同而有所差异：步行采集的场景为50×50米，车载采集的场景为100×100米。然后对整个数据集进行相机校准，并进行一个非常粗略的初始优化，创建一个包含所有3D高斯的基本框架。
其次，独立块优化。每个块独立进行优化，这包括改进3DGS优化过程以适应稀疏数据，以及为每个块创建一个新的3DGS层次结构。具体来说，研究人员开发了一种基于局部几何和体积特性的3DGS基元合并方法，定义了如何将候选3DGS基元合并到中间节点中。
第三，层次结构生成与优化。研究人员构建了一个基于树的层次结构，其中每个节点都与一个3D高斯相关联。对于中间节点，他们定义了具有所有3DGS基元属性的3D高斯，包括位置、协方差矩阵、球谐系数和不透明度。此外，还开发了一种插值方法来优化内部节点的属性，从而提高整体视觉质量。
第四，块整合与全局层次结构构建。优化后的各块层次结构被压缩并整合成整个场景的完整层次表示。在整合过程中，删除冗余的支架高斯以提高视觉质量，并创建一个包含整个场景根节点的全局层次结构。
第五，实时渲染。通过设置粒度阈值并找到相应的切割，可以进行基于LOD的实时渲染。每两帧更新一次切割以添加细节，并每100帧运行一次清理。
在实验结果方面，研究人员在四个捕获的场景（smallcity、bigcity、campus和wayve提供的场景）上展示了他们的方法。结果显示，该方法可以在这些大型场景中实现实时导航。对于每个场景，他们停止并展示了一个自由视角的环绕会话。特别是在摄像机密度较高的区域，如多次采集交叉的地方，效果尤为显著。
在定量评估中，研究人员比较了不同方法在同一块上的质量。结果显示，他们的方法在大多数情况下优于以前的方法。例如，在smallcity场景中，他们的方法在PSNR指标上达到了26.62，而之前的最佳方法仅为25.34。此外，优化后的层次结构在较粗粒度目标下显著提高了结果质量。
本研究的主要结论是提出了一种新颖的视图合成方法，可以处理跨越数公里距离的街景级场景，并使用数万张输入图像实现实时渲染。该系统允许实时渲染这些场景，使捕捉和导航非常大的环境的能力变得大众化。该研究的科学价值在于首次实现了超大规模场景的实时渲染，其应用价值体现在城市规模场景的实时可视化和交互。
本研究的亮点包括： 1. 提出了一种高效的3D高斯层次结构，允许对大规模场景进行平滑的细节层次机制 2. 开发了优化该层次结构的能力，改善了质量/速度权衡 3. 提出了基于分而治之的块状算法，用于优化分层表示，允许独立块的并行处理
其他值得注意的内容包括：研究人员计划发布源代码和大型捕获数据集；他们开发了一种新的插值方法来处理层次级别之间的平滑过渡；并且他们的方法可以适应可用资源，使用廉价的消费级设备进行捕获。这些特点使得该研究在计算机图形学领域具有重要意义，为未来的研究和应用开辟了新的可能性。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问