分享自:

基于高阶Ambisonics的2.5维近场声源合成

期刊:电子学报DOI:10.3969/j.issn.0372-2112.2017.03.002

本文介绍一篇由周岭松、鲍长春、贾懋珅、步兵合作完成,发表于2017年3月《电子学报》(Acta Electronica Sinica)第45卷第3期的学术论文。该研究隶属于音频信号处理领域,具体聚焦于空间声场合成这一前沿方向。

一、 研究背景与动机

声场合成(Sound Field Synthesis)是音频信号处理领域的核心问题之一,其目标是通过扬声器阵列重放,精确地重建或模拟出目标声场,为听音者营造出具有高度临场感和沉浸感的听觉体验。目前广泛应用的商业环绕声系统(如 Dolby Surround)通常将扬声器布置在听音者所在的平面上,因此,针对平面(二维)声场合成的研究具有重要的实际意义。

然而,传统的二维声场合成方法在建模时通常假设声源为无限长的“线声源”,这与现实中作为“点声源”存在的真实声源(如人声、乐器)存在维度上的失配。为了解决这一问题,学术界提出了“2.5维”声场合成的概念,旨在用点声源模型来重建平面内的声场,从而更准确地匹配真实声源的物理特性。

与此同时,声场合成面临另一个重要挑战:近场声源的合成。心理声学研究指出,人耳对距离较近(约1米以内)的声源距离变化更为敏感。这类位于扬声器阵列内部的近场声源,其声场在物理上并不收敛,难以在整个区域实现完美重建,通常只能在特定“有效听音区”内进行近似合成。

针对2.5维近场声源合成这一难题,现有方法存在诸多局限。例如,频谱分割法(Spectral Division Method, SDM)仅适用于直线型扬声器阵列;基于波场合成(Wave Field Synthesis, WFS)的方法受限于空间采样定理;而基于多极子扬声器模型的方法则对硬件要求过高,难以实际应用。另一种主流技术——高阶 Ambisonics(Higher Order Ambisonics, HOA)虽能适用于任意布局的扬声器阵列且不受采样定理限制,但在处理近场声源时会产生严重的“近场失真”,且其传统的柱面谐波展开方式也存在维度失配问题。

基于此,本研究旨在解决两个关键问题:1)维度失配问题:将 HOA 的基础从二维的柱面谐波扩展到三维的球谐函数,以适配点声源模型,实现真正的2.5维声场描述;2)近场失真问题:提出一种新的补偿算法,以抑制 HOA 在合成近场声源时产生的高阶失真,从而实现高保真的2.5维近场声源合成。

二、 研究方法与工作流程

本研究主要包含四个核心步骤:理论建模、失真分析与补偿方法设计、扬声器激励信号求解、以及仿真实验验证。

第一步:建立2.5维声场的球谐函数数学模型。 研究者从声波在球坐标系下的波动方程出发,推导出自由场中一个位于xs = (rs, θs, φs)的独立点声源所辐射声压的通用球谐函数展开式。为了将其应用于二维平面合成,研究者设定所有声源和听音点的仰角φ均为π/2(即位于同一水平面),从而得到了“2.5维声场”的球谐函数表达式。该表达式表明,空间任意一点的声压可以表示为一系列球谐函数基Y_m^n与球贝塞尔函数j_m加权和的形式,权重系数与声源位置和频率相关。这一步骤的关键创新在于将适用于三维声场的球谐分析“降维”应用到二维平面,从理论上解决了声源模型维度不匹配的问题。

第二步:分析近场失真成因并提出改进的维纳滤波补偿方法。 研究者首先通过对比远场和近场声源球谐展开系数的空间频谱图,明确指出近场失真的根源:近场声源在高阶球谐分量上具有远场声源所没有的、异常巨大的能量增益。这些高阶分量在重建时极易受到干扰,导致合成声场在扬声器阵列半径以外的区域严重失真。 为了抑制这些有害的高阶分量,研究者批判性地回顾了两种现有方法:Daniel 提出的高通滤波法和 Ahrens 等人提出的余弦正则化法。前者虽简单,但会在截止频率处引入突变,且对高阶分量的抑制不够彻底;后者能有效抑制高阶分量,但过程“粗暴”,过度损失了声场中的有效信息,导致整体重建误差较大。 为此,本文提出了一种改进的维纳滤波(Modified Wiener Filter)补偿方法。其滤波器函数W_n(k)的设计包含三个可调参数λ1, λ2, λ3,通过约束λ3 = λ1 + λ2保证滤波器增益始终不大于1。该滤波器的核心思想是在抑制高能量噪声(即有害高阶分量)和保留有用信号(即低阶声场信息)之间取得更优的平衡。理论频谱分析显示,相比于高通滤波法和余弦正则化法,新方法能在平滑衰减高阶噪声的同时,更好地保留中低阶的声场信息。

第三步:基于连续扬声器阵列理论求解扬声器驱动信号。 声场合成的最终目标是通过物理扬声器阵列播放特定的驱动信号来重建目标声场。研究者采用了“连续扬声器阵列”的理想化模型进行理论推导。在该模型中,位于圆形边界上的扬声器被视作一个连续分布的声源面。目标声场(经步骤二补偿后的2.5维近场声场)与由连续扬声器阵列产生的合成声场在理论上应相等。 通过将扬声器的驱动信号表达为傅里叶级数形式,并将扬声器的空间传递函数(即格林函数)也用球谐函数展开,研究者建立了合成声场的表达式。令合成声场等于目标声场,通过比较球谐展开系数,最终推导出驱动信号的傅里叶系数解析解,进而得到连续扬声器驱动信号的闭合表达式。对于实际的离散扬声器阵列,只需满足扬声器数量L与球谐展开最高阶数N之间的约束条件L ≥ 2N + 1,即可用有限个扬声器逼近连续模型的效果。

第四步:进行声场合成仿真实验以验证方法有效性。 研究者设计了一个仿真实验来对比评估所提方法的性能。 * 实验设置:目标声源位于坐标(0, -1, 0)处,即距离阵列中心1米,位于负Y轴上,属于近场声源。有效听音区设定为以原点为中心、半径1米的圆形区域。扬声器阵列由56个扬声器均匀分布在半径1.5米的圆周上。为防止空间混叠,测试频率选取为800 Hz(低于阵列的奈奎斯特频率1 kHz)。根据约束条件,球谐展开最高阶数N设定为27。 * 对比方法:将本文提出的改进维纳滤波法高通滤波法余弦正则化法进行对比。 * 评价指标与结果: 1. 声场图对比:论文提供了目标声场以及三种方法合成声场的声压分布图(实部)及其绝对误差图。视觉上,在有效听音区内,本文方法合成的声场与目标声场最为接近,仅在声源点附近存在微小误差。高通滤波法在听音区内表现尚可,但在听音区外失真明显;余弦正则化法则在整个区域内都损失了较多声场细节。 2. 定量误差分析:采用相对误差作为核心评价指标,其定义为合成声场与目标声场在有效听音区内的能量误差归一化值。文献指出,相对误差小于0.04即可认为声场被有效重建。实验结果如下: * 本文方法(改进维纳滤波):相对误差为 0.031 * 高通滤波法:相对误差为 0.020 * 余弦正则化法:相对误差为 0.23 从数据看,高通滤波法的数值最低,但结合误差图可知,其低误差优势仅限于严格定义的有效听音区内,区域外失真严重,这些失真在实际环境中可能因干扰而被感知。余弦正则化法的误差远超0.04的阈值,重建失败。本文方法的误差不仅低于阈值,成功实现了有效重建,而且在听音区内外取得了更均衡、更稳健的性能,提供了“更大范围的有效听音区”。 3. 参数影响分析:研究者还额外分析了球谐展开阶数N与无量纲频率kr对合成相对误差的影响。结果表明,对于固定的N,当kr > N时误差开始显著上升,验证了经验法则N ≈ kr(向上取整)对于保证合成质量的重要性。同时,在相同kr下,更高的N(即使用更多阶球谐函数)能带来更低的合成误差。

三、 研究结论与价值

本研究成功提出并验证了一套完整的2.5维近场声源合成方案。主要结论如下: 1. 理论贡献:将高阶 Ambisonics 的数学基础从柱面谐波推广至球谐函数,有效解决了二维声场合成中点声源建模的维度失配问题,为2.5维声场分析提供了严谨的理论框架。 2. 算法创新:针对 HOA 合成近场声源时的固有缺陷,提出了一种改进的维纳滤波近场补偿方法。该方法相比现有技术,能在更有效地抑制导致近场失真的高阶球谐分量的同时,最大程度地保留重建声场所需的低频信息,实现了抑制失真与保持保真度之间的更好权衡。 3. 工程实现:基于连续扬声器阵列假设,推导出了驱动信号的通用解析表达式,为任意布局的扬声器阵列实现2.5维近场声场合成提供了明确的信号生成方案。

本研究的价值体现在: * 科学价值:深化了对近场声场合成中物理限制和失真机制的理解,提供了一种基于球谐分析和自适应滤波的、性能更优的解决方案,推动了空间音频理论的发展。 * 应用价值:所提方法不依赖于特殊扬声器硬件,对阵列布局要求宽松,且能有效扩展听音区域,为开发下一代高沉浸感音频系统(如虚拟现实、增强现实、高级汽车音响、专业录音回放等)提供了重要的技术参考。

四、 研究亮点

  1. 问题定位精准:同时瞄准了“维度失配”和“近场失真”这两个阻碍高精度声场合成的关键难题。
  2. 理论模型创新:创造性地将三维球谐函数展开应用于二维平面声场合成,建立了更贴合物理现实的2.5维声场数学模型。
  3. 补偿算法高效:提出的改进维纳滤波法并非简单套用现有滤波器,而是针对近场失真的频谱特性进行了针对性设计,在性能上超越了经典的高通滤波和正则化方法。
  4. 验证充分有力:通过详尽的仿真实验,不仅提供了直观的声场对比图,还进行了严格的定量误差分析和参数影响研究,结论扎实可信。

五、 其他有价值内容

论文在讨论部分指出,本工作集中于算法理论与仿真验证,后续研究方向包括:在实际离散扬声器阵列中进行扬声器精简优化(用更少的扬声器达到相近效果),以及开展主观听音实验以评估所合成声场的感知质量。这些指明了该技术走向实用化的关键后续步骤。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com