这篇文档是一篇发表于2023年9月22日《Science》期刊(卷381,期6664)上的Perspectives文章,标题为“Predicting pathogenic protein variants”。作者是来自英国爱丁堡大学MRC人类遗传学单元的Joseph A. Marsh和来自英国剑桥大学Wellcome Sanger研究所及卡文迪许实验室的Sarah A. Teichmann。这篇文章并非原创性研究报告,而是一篇针对同期发表的另一项重要研究(AlphaMissense)的评论与展望性文章。文章的核心主题是围绕利用人工智能预测蛋白质错义变异致病性的最新进展、意义、局限性与未来方向展开评述。
文章首先介绍了当前人类遗传学与临床诊断中的一个核心难题:随着DNA测序能力的飞速提升,我们能够发现大量的基因变异,尤其是发生在蛋白质编码区的错义变异(missense variant),但解读这些变异对健康的影响却非常困难。绝大多数错义变异被临床医生归类为“意义不明确的变异”(variant of uncertain significance, VUS),这极大地限制了基因测序在疾病诊断中的应用。为了解决这个问题,计算生物学家开发了多种变异效应预测器(variant effect predictor, VEP)。在此背景下,Cheng等人在本期《Science》上发表了AlphaMissense,这是一个基于革命性的蛋白质结构预测工具AlphaFold2构建的机器学习算法,用于预测错义变异的致病性。
文章的第一个主要观点是AlphaMissense代表了变异效应预测领域的一个重要突破,其成功的关键在于整合了蛋白质结构信息。作者指出,尽管实验方法如多重变异效应分析(multiplexed assays of variant effect, MAVEs)在特定基因的变异解读上展现出潜力,但目前仅覆盖了人类基因组中极小的一部分。因此,计算预测工具仍然不可或缺。传统的顶级VEP,如进化变异效应模型(evolutionary model of variant effect, EVE)和蛋白质语言模型ESM-1v,主要依赖于序列比对或未比对的氨基酸序列信息,蛋白质结构信息在此前对临床预测的帮助有限。然而,Cheng等人的工作表明,AlphaMissense通过整合AlphaFold2的结构预测模块,结合蛋白质语言建模和基于人类及非人灵长类群体等位基因频率的微调,实现了超越现有工具的预测性能。这标志着一个新阶段的开始:将蛋白质结构模型与其他特征(序列比对、等位基因频率、MAVE数据)或语言模型相结合,可能成为未来保持预测竞争力的必要条件。这一观点的支撑在于AlphaMissense在多个独立基准测试中均显示出卓越的性能,并且其结构预测阶段被证明是实现高精度预测所必需的。此外,近期另一个基于结构的预测工具PrimateAI-3D的强劲表现也佐证了这一趋势。
文章的第二个主要观点是尽管取得了显著进步,AlphaMissense等基于结构的预测工具仍存在重要的局限性。作者从几个层面进行了详细阐述。首先,当前的AlphaMissense在结构预测部分尚未充分考虑大多数蛋白质在体内会组装成复合物或形成具有不同四级结构的凝聚体这一事实。仅考虑单体结构可能无法揭示那些通过破坏蛋白质相互作用界面或产生长程变构效应而导致疾病的突变。其次,蛋白质的相互作用会因细胞类型或状态的不同(通过蛋白质丰度变化)而存在差异,人类细胞图谱计划正在揭示这种复杂性。再者,疾病相关突变的作用机制多样,并非所有突变都导致功能丧失(如蛋白质去稳定化或复合物组装破坏)。显性负效应或功能获得性突变同样致病,而这些变异通常涉及破坏性较小的氨基酸替换,且几乎被所有先前测试的VEP预测得很差。因此,评估AlphaMissense在非功能丧失型变异上的表现将非常关键。作者认为,未来整合能够预测蛋白质复合物结构的算法,将四级结构信息纳入考量,可能会带来预测能力的更大提升。
文章的第三个主要观点是评估新计算预测工具的性能面临重大挑战,但AlphaMissense的评估策略和资源共享做法值得鼓励。作者指出,方法创建者的自我评估往往不可靠,因为几乎所有新发布的VEP都声称自己优于所对比的现有工具。然而,Cheng等人采用了将AlphaMissense与多种现有VEP进行比较,并运用多种正交评估策略的方法,这种做法更为可靠和全面。一个潜在的担忧是,AlphaMissense使用了人类等位基因频率数据进行训练,这可能导致其在区分致病与良性变异的传统基准测试中表现被高估,尤其是与更无监督的VEP相比。但令人鼓舞的是,AlphaMissense在针对来自MAVE的独立数据进行测试时,依然取得了显著的结果,这表明其性能不太可能受到训练偏差的强烈影响。此外,作者团队已将AlphaMissense对整个人类蛋白质组(包括不同异构体)的预测结果作为社区资源免费提供,这将促进快速的独立评估,并有助于其整合到序列分析流程中。
文章的第四个主要观点是尽管预测方法不断增多,但计算预测在临床诊断中的影响仍然有限,需要谨慎解读预测结果并推进临床校准。目前,根据美国医学遗传学与基因组学学院和分子病理学协会的建议,计算预测在遗传诊断中仅能提供“支持性”证据,作用最小。近期的一些工作试图通过为计算变异效应评分提供更量化的解释,并将其与不同证据强度进行校准来改善这一状况。Cheng等人也尝试了类似的方法,根据达到90%精确度所需的阈值,将人类错义变异分类为“可能致病”或“可能良性”。作者强调,这虽然对变异解读和优先排序有帮助,但必须注意不要将这些标签与具有非常特定临床定义的术语混淆,后者依赖于多方面的证据。此外,“突变致病性”的概念极其复杂。计算预测器通常忽略遗传模式和等位基因状态,而且不完全外显意味着并非所有携带“致病”等位基因的个体都会表现出临床疾病,这可能受到遗传背景或环境的影响。因此,尽管目前尚不能单独依赖任何VEP进行遗传诊断,但随着计算方法及其解读策略的共同进步,它们在诊断过程中的效用将持续提高。
最后,文章总结了这篇Perspectives的价值与意义。它不仅向科学界介绍和评价了一项具有里程碑意义的新工具(AlphaMissense),更深入剖析了该工具成功背后的逻辑(整合结构信息)、当前面临的挑战(如忽略复合物、机制多样性)以及整个领域发展的关键问题(评估的可靠性、临床转化的障碍)。文章起到了承上启下的作用:既肯定了基于AlphaFold的蛋白质结构预测技术在功能基因组学应用中的巨大潜力,也为其未来的发展方向(如整合四级结构、改进对非功能丧失型变异的预测、加强临床校准)提供了清晰的路线图。对于从事计算生物学、人类遗传学和精准医疗的研究人员和临床医生而言,这篇文章提供了一个既全面又具有批判性的视角,有助于他们理解这项快速发展的技术,并思考如何负责任地将其应用于研究和临床实践。