分享自:

基于深度强化学习的量子电路T门优化方法AlphaTensor-Quantum

期刊:nature machine intelligenceDOI:10.1038/s42256-025-01001-1

这篇发表于《nature machine intelligence》期刊2025年3月号的研究论文,由来自Google DeepMind、Quantinuum以及阿姆斯特丹大学信息研究所的研究团队共同完成。主要作者包括Francisco J. R. Ruiz和Tuomas Laakkonen(作为共同第一作者)、Johannes Bausch、Matej Balog等人,通讯作者为Francisco J. R. Ruiz。该研究致力于解决量子计算领域一个关键且具有挑战性的问题:量子电路优化(Quantum Circuit Optimization),特别是针对容错量子计算中成本高昂的T门(T gates)进行数量最小化,即T门数量(T-count)优化

学术背景 量子计算提供了一种解决密码学、药物发现、材料科学等领域复杂问题的新范式。在容错量子计算(Fault-Tolerant Quantum Computation)的框架下,量子门主要分为两类:克利福德门(Clifford gates,如Hadamard门、受控非门CNOT)和非克利福德门(non-Clifford gates,如T门)。根据Gottesman-Knill定理,仅使用克利福德门的量子电路可以被经典计算机高效模拟,因此需要非克利福德门(如T门)来实现通用量子计算。然而,在容错架构中,非克利福德门(特别是T门)的实现成本极其高昂,因为其需要通过消耗“魔法态”(magic states)来完成,而制备高质量的魔法态需要巨大的时间和空间开销。因此,最小化量子算法中的T门数量,是降低容错量子计算资源开销、推动其实际应用的核心挑战之一。T-count优化本身是一个NP-hard问题,此前已有多种方法被提出。本研究的目标是开发一种新的、强大的自动化方法,以超越现有技术水平,更有效地减少量子电路的T-count,并能够自动发现高效算法结构。

详细研究流程 本研究提出并验证了一种名为AlphaTensor-Quantum的新方法,它基于深度强化学习,并通过利用张量分解(tensor decomposition)与T-count优化之间的数学联系来解决问题。整个工作流程包含以下几个核心步骤和实验验证:

  1. 问题转化与核心方法构建

    • 理论基础:研究首先将量子电路的T-count优化问题转化为一个对称张量分解(symmetric tensor decomposition)问题。具体而言,将目标量子电路(经过预处理后仅含CNOT和T门的部分)编码为一个二进制、三阶的签名张量(signature tensor)。该张量唯一地(在克利福德等价意义下)表征了电路的非克利福德成分。研究表明,该张量的一个华林分解(Waring decomposition)中的每一个因子(一个二进制向量)都一一对应于电路中的一个T门。因此,寻找T-count最小的电路等价于寻找该签名张量的最小秩的华林分解。
    • AlphaTensor-Quantum算法:研究团队扩展了此前用于发现矩阵乘法算法的AlphaTensor方法。他们设计了一个名为TensorGame的单人游戏环境。游戏状态是当前剩余的张量,玩家的每一步“动作”是选择一个二进制向量(因子)。动作的奖励为-1(鼓励用更少的步数完成游戏)。游戏的目标是用尽可能少的步数将初始张量(即签名张量)减为零张量,此时所有动作构成的因子序列即为一个华林分解,步数即为T-count。
    • 关键创新与改进:相较于原始AlphaTensor,本研究针对量子问题进行了三项关键改进:(a) 优化对称张量秩,修改环境和动作空间以处理华林分解,将动作空间大小从2^3n大幅缩减至2^n,从而能处理更多量子比特(n)的电路(本研究处理了最多n=72的电路)。(b) 引入了神经网络的对称化轴向注意力(symmetrized axial attention)架构,提升了处理大尺寸对称张量的效率和性能。© 创造性地将“小工具”(gadgets) 知识融入强化学习环境。小工具是利用辅助量子比特(ancilla qubits)和测量等技术,用更少的T门等价实现特定量子门(如Toffoli门、CS门)的构造。研究通过修改奖励机制来鼓励智能体发现并利用这些小工具模式(例如,当连续7个动作构成Toffoli小工具模式时,总奖励调整为-2而非-7)。
  2. 实验对象与基准测试

    • 基准电路集:研究首先在一个广泛使用的量子电路基准集上进行测试,该集合包含多种算术运算原语(如加法器、乘法器、模运算电路等),来自已有文献。这些电路在实验前需经过编译(compilation)哈达玛门小工具化(Hadamard gadgetization) 等预处理步骤,将其转化为适合张量表示的CNOT+T形式,有时需要将大电路分割为子电路。
    • 实验设置:研究比较了不带小工具带小工具(Toffoli和CS) 的两个AlphaTensor-Quantum版本。基线对比包括文献中报道的最佳T-count结果,以及电路原始构造的T-count。
    • 实验结果分析:对于未分割的电路,不带小工具的AlphaTensor-Quantum匹配或超越了所有现有T-count优化方法。对于小规模电路,研究者甚至使用Z3定理证明器验证了其找到的分解在张量分解框架下是最优的。更重要的是,带小工具的AlphaTensor-Quantum实现了T-count的进一步大幅降低,在许多情况下甚至优于原始使用小工具构造的电路。论文中的表1详细列出了所有基准电路的对比结果,数据显示了新方法的显著优势。
  3. 在具体应用领域的验证: 研究团队将AlphaTensor-Quantum应用于多个具有实际意义的量子计算领域,以证明其通用性和强大能力:

    • 有限域乘法:这是密码学(如椭圆曲线密码)中的关键操作。AlphaTensor-Quantum为GF(2^m)乘法优化的电路,其Toffoli门数量呈现出 ~ m^{log_2(3)} 的标度律。这等同于经典算法中Karatsuba乘法的复杂度,而此前并未有文献报道量子电路可实现同等高效的有限域Karatsuba乘法。这是一个自动算法发现的突出例证。
    • 二进制加法:加法是许多量子算法(如Shor算法)的基础原语。AlphaTensor-Quantum将Cuccaro等人(2004)加法电路的Toffoli数量减少了一半,与Gidney(2018)利用“基于测量的非计算”(measurement-based uncomputation)技巧手动设计出的最优电路性能持平。关键在于,AlphaTensor-Quantum是在没有预先知晓该技巧的情况下,自动重新发现了与之等效的优化构造。
    • 量子化学模拟:以模拟铁钼辅因子(FeMoco)这一具有重要工业意义的分子为例。研究优化了其中关键的“选择”(Select)预言机(oracle)电路。尽管输入的电路版本未使用任何高级优化技巧,AlphaTensor-Quantum自动发现的电路其T-count与文献(Lee et al., 2021)中使用了复杂手动优化(包括基于测量的非计算)的先进构造完全匹配
    • 其他应用:研究还在汉明权重相位(Hamming weight phasing)一元迭代(unary iteration) 等电路上进行了测试,AlphaTensor-Quantum均能自动找回或匹配已知的最佳手动设计方案。

主要结果 本研究在每个实验阶段都取得了明确且有力的结果: 1. 在通用基准测试上:AlphaTensor-Quantum(无论是否使用小工具)在绝大多数测试电路上取得了当前最低的T-count。表1中的数据提供了确凿的证据,例如在多个GF(2^m)-mult电路上,T-count远低于基线方法和原始构造。 2. 在算法发现上:对有限域乘法电路,AlphaTensor-Quantum自动发现了复杂度与Karatsuba算法相同的构造(图4a),这是一个全新的、高效的量子算法。 3. 在找回已知最优解上:在二进制加法、量子化学模拟等案例中,AlphaTensor-Quantum在完全自动化的情况下,重新发现了人类研究者花费大量精力、利用特定领域技巧(如测量基非计算)才设计出的最优电路构造。图4b、图5等展示了优化前后的电路对比和性能提升。 4. 在验证与扩展性上:研究使用“Feynver”工具和直接计算张量等方法验证了优化后电路的正确性。同时,该方法展现了良好的扩展性,能处理多达72个量子比特的电路张量。

这些结果逻辑连贯:首先在标准基准上证明方法优于现有技术;然后通过在多个关键应用领域的成功,证明其通用性和发现高效构造(甚至新算法)的能力;最终通过匹配人类专家精心设计的最优解,证明其可以自动化地节省大量研究时间与人力成本。所有结果共同支撑了论文的核心结论。

结论与研究价值 本研究的结论是:AlphaTensor-Quantum是一种强大有效的量子电路T-count优化方法,它大幅超越了现有方法,能够自动发现与最佳人工设计相媲美甚至更优的电路构造,并在多个应用领域自动找回最优解,实现了完全自动化的电路优化。 其科学价值在于:① 首次将基于深度强化学习的对称张量分解成功应用于量子电路优化这一NP-hard问题,并取得了突破性进展。② 提出了一种融合领域知识(小工具)到强化学习框架的新范式,通过奖励工程使智能体学会利用这些知识。③ 开发了对称化轴向注意力等神经网络创新,提升了处理大规模对称问题的能力。 其应用价值极为显著:作为一种自动化工具,它可以极大加速量子算法和电路的设计过程,降低对专家手工优化的依赖,节省数百乃至数千小时的研究成本。随着量子计算硬件和算法的发展,新的小工具和优化指标不断出现,AlphaTensor-Quantum的框架可以灵活地融入这些新知识,持续推动容错量子计算的资源优化,在量子化学模拟、密码分析等领域具有重要应用前景。

研究亮点 1. 方法创新性:开创性地将深度强化学习、对称张量分解与量子电路优化深度结合,并成功融入了领域特定的“小工具”知识。 2. 性能突破性:在标准基准和多个实际应用上,取得了超越现有技术的T-count优化结果。 3. 自动算法发现:首次自动发现了有限域上具有Karatsuba复杂度的量子乘法算法,展示了强化学习在发现新量子算法方面的潜力。 4. 自动化替代人工:能够自动找回需要复杂手工技巧(如测量基非计算)才能得到的最优电路构造,证明了用自动化工具替代部分高技能人工设计工作的可行性。 5. 可扩展性与灵活性:能够处理大规模电路(72量子比特),且框架设计允许未来轻松扩展到优化其他指标(如T-depth、双量子比特门代价)或整合新的小工具。

其他有价值内容 论文详细描述了AlphaTensor-Quantum的系统实现,包括分布式训练架构、基于蒙特卡洛树搜索的决策过程、通过基变换和数据增强提升泛化能力等工程细节。此外,论文提供了完整的代码和数据可用性声明,支持研究的可重复性。这些内容为其他研究者理解和复现该方法提供了坚实基础。研究者也展望了未来方向,如改进神经网络架构、更优雅地处理哈达玛门等,指明了该领域进一步发展的潜在路径。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com