分享自:

非球形挡板上圆周轮廓麦克风阵列的声场球谐函数分解

期刊:IEEE/ACM Transactions on Audio, Speech, and Language ProcessingDOI:10.1109/TASLP.2022.3209940

本文档属于类型a,以下是基于文档内容生成的学术报告:


本研究的主要作者包括Jens Ahrens(IEEE高级会员)、Hannes Helmholz、David Lou Alon和Sebastià V. Amengual Garí。其中,Jens Ahrens和Hannes Helmholz来自瑞典查尔姆斯理工大学,David Lou Alon和Sebastià V. Amengual Garí则来自美国Reality Labs Research。该研究发表于2022年的IEEE/ACM Transactions on Audio, Speech, and Language Processing期刊,并于2022年9月27日正式发布。

研究的学术背景主要涉及声场处理领域,特别是球形谐波(Spherical Harmonic, SH)分解技术。传统上,声场的SH分解通常通过刚性球形挡板上的麦克风阵列实现,麦克风需均匀分布在球形表面。然而,这种方法的局限性在于挡板必须为完美球形,且需要大量麦克风以实现高空间分辨率。本研究旨在克服这一限制,提出了一种基于非球形挡板的麦克风阵列方法,麦克风只需沿挡板的圆周轮廓分布,从而显著减少了所需的麦克风数量。该方法的核心目标是通过SH分解实现声场的精确捕捉,并应用于增强现实(AR)和虚拟现实(VR)等场景中的双耳渲染(Binaural Rendering)。

研究的工作流程主要包括以下几个步骤:
1. 理论框架的构建:研究基于刚性球体赤道上麦克风阵列的SH分解方法,提出了一种适用于非球形挡板的扩展方案。该方法通过校准阶段将麦克风信号投影到虚拟刚性球体表面的SH分解上,校准数据通过最小二乘法拟合得到滤波器系数。
2. 模拟数据的生成与校准:研究使用边界元法(Boundary Element Method, BEM)模拟声场数据,并假设麦克风阵列围绕一个无躯干的刚性人头模型分布。校准过程中,使用平面波作为校准声场,通过最小二乘法拟合滤波器系数。
3. 实验验证:研究通过模拟数据和实际测量的原型数据验证了该方法的准确性和鲁棒性。模拟数据包括不同声源位置和距离的声场,实际测量数据则通过一个18个麦克风组成的原型阵列获取。
4. 双耳渲染的实现:研究将SH分解后的信号应用于双耳渲染,并通过与参考头相关传递函数(Head-Related Transfer Function, HRTF)的对比,评估了渲染结果的准确性。

在实验对象方面,研究主要使用了一个18个麦克风组成的阵列,麦克风沿人头模型的圆周均匀分布。模拟数据通过BEM生成,实际测量数据则在一个消声室中获取。校准过程中,研究使用了360个水平平面上的平面波作为校准声场。数据分析主要通过最小二乘法拟合滤波器系数,并对SH分解结果进行误差分析。

研究的主要结果包括:
1. 校准误差分析:研究通过归一化校准误差评估了方法的准确性。结果显示,在空间混叠频率(约5.5 kHz)以下,校准误差较小,而在高频区域误差显著增加。这一结果与SH分解的阶数限制相关。
2. 双耳传递函数(Binaural Transfer Function, BTF)的评估:研究通过对比原型阵列的BTF与参考HRTF,验证了方法的准确性。结果显示,在6 kHz以下,BTF与HRTF的差异在1-2 dB范围内,而在高频区域,由于SH阶数截断,BTF出现了显著的衰减。
3. 鲁棒性测试:研究通过模拟麦克风位置偏移和不同头部几何形状的变化,验证了方法的鲁棒性。结果显示,在空间混叠频率以下,方法对麦克风位置偏移和头部几何形状的变化具有较好的鲁棒性。

研究的结论表明,该方法能够有效实现非球形挡板上的SH分解,并在双耳渲染中表现出较高的准确性。其科学价值在于突破了传统球形挡板的限制,为AR和VR等应用提供了新的技术路径。此外,该方法的应用价值在于能够集成到AR头戴设备中,实现音频与视频的同步捕捉和渲染。

本研究的亮点包括:
1. 创新性方法:提出了基于非球形挡板的SH分解方法,显著减少了麦克风数量。
2. 高准确性:在双耳渲染中表现出与参考HRTF相近的准确性。
3. 鲁棒性强:对麦克风位置偏移和头部几何形状的变化具有较好的鲁棒性。

此外,研究还提出了一种基于模态均衡滤波器(Modal Equalization Filter)的SH分解信号均衡方法,进一步提高了双耳渲染的质量。这一方法为未来的声场处理研究提供了新的思路和工具。


上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com