分享自:

机架感知存储系统的跨机架更新带宽

期刊:IEEE Transactions on CommunicationsDOI:10.1109/TCOMM.2026.3652494

本文介绍的研究发表于 IEEE Transactions on Communications, Vol. 74, 2026。作者是来自 清华大学的姜政祎、虞彬、黄忠毅,来自 香港城市大学的宋临祺,来自 华为技术有限公司的白波和张弓,以及来自 东莞理工学院香港中文大学的侯汉煦。

该研究属于分布式存储系统领域的编码理论研究。在机架感知存储系统(Rack-aware Storage Systems)中,存储节点被组织在多个机架内,机架间(cross-rack)通信成本远高于机架内(intra-rack)通信成本。为了提升系统效率,尤其是应对更新密集型工作负载(如数据库),研究人员致力于设计具有低更新带宽的纠删码。现有的最小更新带宽(Minimum Update Bandwidth, MUB)码虽然能在节点层面最小化更新成本,但在机架感知架构下,其跨机架更新带宽(Cross-rack Update Bandwidth)并非最优。此外,异构存储环境中,节点存储的数据符号数量可能不同,这催生了非规则阵列码(Irregular Array Codes) 的应用,其允许节点存储不同尺寸的符号并能以低冗余和低更新成本实现最大距离可分(Maximum Distance Separable, MDS)属性。然而,在此类系统和编码模型下,跨机架更新带宽的理论下限及其最优编码构造尚不完全清晰。因此,本研究旨在:1. 为机架感知系统中的非规则阵列码建立跨机架更新带宽模型;2. 推导跨机架更新带宽的紧致下界,并定义达到该下界的最小跨机架更新带宽(Minimum Cross-rack Update Bandwidth, MCUB)码;3. 推导MCUB码冗余(即奇偶校验符号总数)的紧致下界,并定义达到该下界的最小冗余MCUB(Minimum Redundancy-MCUB, MR-MCUB)码;4. 给出MR-MCUB码的明确构造,证明两个下界的紧致性;5. 进一步定义机架内更新带宽并推导其下界,证明所构造的MCUB码也能达到该下界。

本研究的详细工作流程可概括为理论建模、下界推导和编码构造三大阶段。

第一阶段:理论建模。 研究者首先形式化定义了机架感知存储系统和非规则阵列码的模型。系统包含 n = u * n̄ 个节点,平均分布在 个机架中,每个机架有 u 个节点。非规则阵列码中,每个节点 i 存储 m_i 个数据符号和 p_i 个奇偶校验符号。当一个节点(如机架 a 中的节点 (a, b))的数据符号更新时,其变更 Δx 会触发其他节点中奇偶校验符号的更新。对于不同机架 j (j ≠ a) 中的节点,为了最小化跨机架通信,研究者定义了 γ_(a,b),j 为从节点 (a, b) 发送到机架 j 以完成其所有奇偶校验更新所需的最少符号数。通过定理2证明,该值等于一个聚合编码矩阵 M(a, b, j) 的秩。基于此,定义了系统整体的跨机架更新带宽 γ 为更新单个节点时,所有跨机架传输符号数的平均值。同时,回顾了非规则阵列码满足 (n, k) 重构属性(即任何 k 个节点可恢复所有数据)的充要条件(定理1),为后续推导奠定基础。

第二阶段:下界推导。 这是研究的核心分析部分。 1. 跨机架更新带宽下界(定理3): 研究者通过严谨的数学分析,推导出在满足 (n, k) 重构属性的前提下,非规则阵列码的跨机架更新带宽下界。结果分为两种情况:当 u ≤ n - k 时,γ ≥ (n̄ - 1)b / (⌈k/u⌉ n),其中 b 是总数据符号数;当 u > n - k 时,下界为0(通过为每个机架独立构造编码实现)。该下界为衡量编码性能提供了基准。研究者将能达到此下界的编码定义为最小跨机架更新带宽(MCUB)码。作为验证,他们指出文献[26]中的MUB码在特定参数下(k 整除所有 m_ik = n - u)就是MCUB码(推论3),这证明了该下界是紧致的。 2. 冗余下界(定理4、5): 为了更全面地评估编码效率,研究者进一步探讨在已达成最小跨机架更新带宽的前提下,编码的冗余(奇偶校验总数 p)能降低到多少。他们将 k 表示为 k̄*u + u00 ≤ u0 < u)。对于 k ≤ n - uu0 = 0 的情况(定理4),推导出冗余下界 p ≥ (n - k)b / k。对于 k < n - uu0 > 0 的情况(定理5),推导出更一般的下界 p ≥ (n - k)b / ((k̄ + 1)u0)。能达到该冗余下界的MCUB码被定义为最小冗余MCUB(MR-MCUB)码。研究者同样指出,之前的MUB码在特定条件下也是MR-MCUB码。

第三阶段:编码构造与性能分析。 研究者提出了一种新的非规则阵列码的通用构造方法,旨在实现MCUB和MR-MCUB属性。 1. 构造过程(五.A节及算法1): 构造针对参数 k = k̄*u + u0(k̄+1)u0 整除所有 m_i 的情况。构造分为三个步骤: * 步骤1(应用局部可修复码LRC): 将每个节点 im_i 个数据符号分组,每组 (k̄+1)u0 个符号。每组内,先将符号分 (k̄+1) 个子组,每个子组用 (u, u0) MDS码编码得到 u 个符号(含数据和局部校验)。然后将这 (k̄+1)u 个符号作为一个整体,用系统式 (n-1, (k̄+1)u) MDS码编码,生成 (n - 1 - (k̄+1)u) 个全局校验符号。这样,每组生成了一个长度为 n-1 的、具有 n-k-1 容错能力的LRC码字。这些码字的 n-1 个符号分别对应除自身节点外的其他 n-1 个节点。 * 步骤2(符号映射到目标机架): 此步不进行编码,只是将步骤1中生成的符号重新排列,以适配机架拓扑并最小化跨机架更新带宽。具体而言,对于源节点 i(位于机架 a):(a) 将发往同机架其他节点(机架内)的符号指定为对应LRC码字中的全局校验符号(b) 任意选择 k̄+1 个其他机架构成集合 ω0,将发往 ω0 中每个机架所有节点的 u 个符号(对应LRC码字的某些位置)指定为一个 (u, u0) MDS码字(即局部编码段);(c) 将发往剩余机架(既不是 a 也不在 ω0 中)的符号指定为LRC码字中剩下的全局校验符号。 * 步骤3(生成最终奇偶校验符号): 为每个节点 i 计算一个缓冲大小 b_i,并生成一个范德蒙矩阵 V_i。节点 i 最终存储的奇偶校验向量 p_i 是来自所有其他节点 j 的映射后符号 c_i^(j) 的线性组合:p_i = Σ_(j≠i) V_(i,j) * c_i^(j)。这一步通过线性聚合确保了全局的 (n, k) 重构属性。 2. 性能分析: * 重构属性(定理6): 通过利用LRC的容错能力和范德蒙矩阵的可逆性,证明了所构造的编码满足 (n, k) 重构属性。 * 跨机架更新带宽(定理7): 计算了该编码的跨机架更新带宽 γ,表示为 (1 + δ) * γ_low,其中 γ_low 是定理3中的下界,δ = (n̄ - k̄ - 2)(u - u0) / ((n̄ - 1)u0)关键结果是:当参数满足 n - 2u < k < n - u 时,δ = 0,即 γ = γ_low,编码成为MCUB码。研究者还指出,在许多高码率参数下(如 |k̄ - (n̄-2)||u - u0| 相对于 n 很小),δ 趋近于0,编码具有接近最优的跨机架更新带宽。 * 最小冗余性(定理8): 证明了当所有节点存储相同数量的数据符号(m_i = m)时,所构造编码的冗余 p 恰好达到定理5中的下界 (n - k)b / ((k̄+1)u0),从而成为MR-MCUB码。 * 机架内更新带宽(第六节及推论4): 研究者进一步定义了机架内更新带宽,并推导了MCUB码的机架内更新带宽下界 (u - 1)b / ((k̄ + 1)u0 n)(定理10)。随后证明,他们构造的编码同样能达到这个下界(推论4),实现了机架内更新成本的最小化。 * 对比评估(五.D节): 研究者将提出的MCUB码与两种基准编码——系统式RS码(采用机架集中放置策略)和文献[26]的MUB码——进行了数值比较。通过表格展示了在不同系统参数 (n, u, k) 下,各编码的归一化跨机架更新带宽(即更新带宽与总数据量的比值)。结果表明,在大多数参数下,尤其是在 n - 2u < k < n - u 时,本研究提出的MCUB码具有最低的跨机架更新带宽。定理9从理论上证明了在 n-2u < k < n-u 且满足一定整除条件时,MCUB码的跨机架更新带宽严格小于MUB码。

本研究的结论是,为机架感知存储系统中的非规则阵列码建立了一套完整的跨机架更新带宽理论体系,包括模型、紧致下界以及能够同时达到最小跨机架更新带宽和最小冗余的明确编码构造(MR-MCUB码)。此外,所构造的编码还能达到机架内更新带宽的下界,实现了全面的更新成本优化。

本研究具有多重价值和亮点。其科学价值在于,首次在机架感知模型下,为非规则阵列码建立了关于跨机架更新带宽和冗余的严格理论下界,并证明了这些下界的紧致性,填补了该领域的一个理论空白。应用价值在于,提出的MR-MCUB编码构造为实际分布式存储系统(尤其是具有异构存储需求和更新密集型负载的系统)提供了高效、可实现的解决方案,能显著降低昂贵的跨机架通信流量,提升系统整体性能。重要创新点包括:1. 理论创新:推导出了紧致的跨机架更新带宽下界和MCUB码的冗余下界;2. 构造创新:设计了结合LRC局部性、特定符号映射规则和范德蒙聚合的三步编码构造法,能灵活适应参数变化并达到多个最优界;3. 全面优化:所构造的编码不仅优化了跨机架成本,还同时优化了冗余和机架内更新成本,实现了多维度的效率权衡。研究还揭示了在特定参数范围(n-2u < k < n-u)内,所构造编码能达到理论最优,这对于系统参数设计具有指导意义。文末指出,为更一般化的参数设计MR-MCUB码是未来的研究方向之一。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com