基于西藏自治区某医院体检人群HBV C/D重组体进化起源分析研究报告
第一, 研究基本信息
本研究由谢雨华、徐琳莉、袁筱婕、张维璐、李红燕、龙泳、吉兆华、王玉华、李怡君、王月梅、刘昆等研究人员共同完成。主要研究机构包括空军军医大学军事预防医学系军队防疫与流行病学教研室、特殊作业环境危害评估与防治教育部重点实验室、陕西省环境健康危害评估与防护重点实验室,以及西藏大学附属阜康医院。该研究以《基于西藏自治区某医院体检人群hbv c/d重组体进化起源分析》为题,发表在《中国热带医学》(china tropical medicine)期刊上,网络首发日期为2026年5月28日,计划刊发于2026年6月第26卷第6期。
第二, 学术背景与研究目的
本研究属于病毒学、分子流行病学和进化生物学交叉领域,聚焦于乙型肝炎病毒(HBV)的基因进化与传播动力学。乙型肝炎病毒(HBV)感染是全球性公共卫生挑战,中国是HBV感染高负担国家。HBV具有高度基因多样性,存在A到J共10种基因型,而基因重组是其进化与传播的关键机制之一,可能影响病毒的致病性、传播效率及对治疗的反应。西藏自治区是中国HBV高流行区域,既往研究证实,HBV C/D基因型重组体(C/D recombinants,简称CD重组体)是当地流行的优势毒株,且当地人群乙肝表面抗原(HBsAg)阳性率高于全国平均水平。然而,对于这种在特殊地理生态环境和人文背景下流行的HBV C/D重组体的进化起源时间、具体传播路径以及历史种群动态变化,尚缺乏深入、系统的研究。
因此,本研究旨在通过获取西藏地区体检人群中的HBV C/D重组体全基因组序列,运用系统发育分析和贝叶斯进化模型,探究这些重组体的进化起源、分化时间、进化速率以及种群数量的历史变化规律。其最终目标是为理解HBV在西藏高原特殊环境下的适应与传播模式提供科学依据,进而为制定更具针对性的当地乙型肝炎防控策略、优化疫苗设计及临床管理方案奠定理论基础。
第三, 详细研究流程与方法
本研究流程清晰,主要包含研究对象纳入、病毒基因组获取与分型、重组分析、进化起源与动力学分析等核心步骤。
步骤一:研究对象纳入与样本采集。 研究于2022年5月至2023年7月期间,在西藏大学附属阜康医院进行。研究者从健康体检人群中,筛选出乙肝表面抗原(HBsAg)和HBV DNA检测均为阳性的个体作为研究对象。最终,共有47名感染者的样本被纳入分析。这些研究对象的平均年龄为(34.27±9.91)岁,男性25人,女性21人,民族构成以藏族为主(占97.83%),来自西藏的拉萨、那曲、日喀则等七个市/地区,其中拉萨市样本占比最高(52.08%)。本研究获得了医院伦理委员会批准(批准号:fk20210002),并获取了受检者或其家属的知情同意。
步骤二:HBV全基因组测序与初步分型。 研究人员使用商业化的病毒DNA提取试剂盒从血液样本中提取病毒核酸。为了获得完整的HBV基因组序列,他们采用了巢式聚合酶链式反应(nested PCR)技术,将HBV基因组分为12个片段分别进行扩增,以克服病毒载量可能较低的问题。扩增成功后,构建二代测序文库,并使用Illumina NextSeq™ 1000平台进行高通量测序。获得原始测序数据后,研究团队利用生物信息学工具(文中提及TBTools 2.154)进行序列组装和质控,最终获得了HBV的全长基因组序列。随后,使用MAFFT进行序列比对,并利用IQ-TREE 2软件进行系统发育分析,对获得的病毒序列进行初步的基因分型。
步骤三:HBV基因组重组事件扫描与鉴定。 这是本研究的核心分析环节之一,目的是精确鉴定C/D重组体的重组断点位置。研究采用了两种互补的生物信息学工具进行重组分析。首先,使用在线重组分析工具jpHMM(Java-based HMM,隐马尔可夫模型)对序列进行初步扫描。其次,为了更直观地确认和可视化重组模式,研究者进一步使用了SimPlot软件(版本3.5.1)。该软件通过滑动窗口(本研究参数设置为窗口200个碱基对,步长20个碱基对)的方式,将待测序列与已知的HBV不同基因型参考序列进行相似性比较,并绘制出相似性曲线图。通过分析曲线图中的“断裂”或“切换”点,可以精确判定重组发生的位置。分析结果显示,46例C/D重组体根据重组位点的不同,可分为两种类型:一种重组断点位于HBV基因组核苷酸第740位点附近,被定义为C/D1重组体(CD1重组体);另一种重组断点位于第1460位点附近,被定义为C/D2重组体(CD2重组体)。仅发现1例B/C重组体。
步骤四:进化起源与种群动态分析。 这是本研究的另一个核心分析环节,旨在追溯病毒祖先和描绘历史传播动态。研究者成功获得了46株HBV C/D重组体的全长序列。为了进行可靠的进化分析,他们从NCBI(美国国家生物技术信息中心)数据库中下载了截至2024年12月前上传的所有C基因型和D基因型的HBV全长序列,经过严格的筛选(要求有明确的采样时间和地点信息),最终构建了两个背景序列库:一个包含126条C基因型序列,另一个包含110条D基因型序列。这些背景序列来自全球多个地区和时间点,为估算进化时间提供了必要的校准点。
在进化模型选择上,研究者使用IQ-TREE软件中的ModelFinder功能,确定了用于分析C基因片段和D基因片段的最优核苷酸替换模型均为GTR+I+G(广义时间可逆模型,包含不变位点和伽马分布率异质性)。随后,他们使用BEAST软件(版本1.10.4)进行贝叶斯系统发育分析。具体方法是采用贝叶斯马尔科夫链蒙特卡洛法(Bayesian Markov Chain Monte Carlo, MCMC)来联合估算病毒的进化速率、分化时间(即最近共同祖先时间)以及系统发育关系。为确保分析结果的可靠性,他们运行了足够长的MCMC链,并使用Tracer软件检查有效样本量(ESS),确保所有关键参数的ESS值大于200。
此外,研究还利用BEAST软件中的贝叶斯天际线图(Bayesian Skyline Plot, BSP)分析功能,来重建HBV C基因型和D基因型有效种群大小随时间变化的历史动态。最后,使用TreeAnnotator和FigTree软件对BEAST生成的最大分支置信树(Maximum Clade Credibility tree, MCC tree)进行处理和可视化,在树上标注出关键的分化时间节点和地理信息。
第四, 主要研究结果
研究流程产生了多层次、相互关联的结果,逐步揭示了西藏HBV C/D重组体的特征、起源和传播历史。
结果一:样本特征与重组体分类。 从47例成功测序的样本中,鉴定出46例(98%)为HBV C/D重组体,仅1例(2%)为B/C重组体。这证实了C/D重组体在西藏该体检人群中的绝对优势地位。通过SimPlot软件的精确定位,这46例C/D重组体被明确分为两类:C/D1重组体(重组断点nt 740)和C/D2重组体(重组断点nt 1460)。
结果二:C基因片段的进化起源与动态。 对两类重组体中共同的C基因型片段进行独立进化分析发现:
- C/D1重组体中的C基因型:其最近共同祖先(MRCA)可追溯至大约公元1769年(95%最高后验密度区间HPD: 1456-1873),平均进化速率约为5.23×10^-5 核苷酸替换/(位点·年)。系统发育树显示,与它亲缘关系最近的是C2亚型分支,该分支大约在1933年进入西藏地区。
- C/D2重组体中的C基因型:其最近共同祖先时间更早,约为公元1763年(95% HPD: 1569-1801),平均进化速率约为4.89×10^-5 核苷酸替换/(位点·年)。其最近的姐妹分支同样是C2亚型,但该分支进入西藏的时间较晚,大约在1965年。
- 种群动态:贝叶斯天际线图分析显示,在两类重组体中,C基因型的有效种群数量在历史长河中波动均较小,整体保持相对稳定。这一结果提示,C基因型组分在西藏的流行历史可能较长且传播相对平稳。
结果三:D基因片段的进化起源与动态。 对两类重组体中共同的D基因型片段进行分析,得到了不同的时间尺度:
- C/D1重组体中的D基因型:其最近共同祖先时间约为公元1887年(95% HPD: 1838-1947),平均进化速率较快,约为3.19×10^-4 核苷酸替换/(位点·年)。系统发育分析表明,D1亚型是其最接近的分支,该D1分支大约在1990年进入西藏,并在2004年左右分化形成本研究中的C/D1重组体。
- C/D2重组体中的D基因型:其最近共同祖先时间更早,约为公元1868年(95% HPD: 1808-1925),平均进化速率约为2.68×10^-4 核苷酸替换/(位点·年)。同样,其最近的姐妹分支也是D1亚型,该分支进入西藏的时间略早于前者,大约在1989年,并在2002年左右分化出C/D2重组体。
- 种群动态:D基因型的种群动态呈现出明显的增长和下降趋势。在C/D1重组体中,D基因型种群在1970年后开始显著增长,但在2000-2010年间出现下降。在C/D2重组体中,D基因型种群在1970-2000年间显著增长,而在2010-2020年间出现下降。这种种群数量的变化可能与西藏的社会经济发展、人口流动(如青藏公路建成、边境贸易开放)以及公共卫生干预措施(如1990年代后期启动的乙肝疫苗免费接种项目)有关。
结果间的逻辑关系: 上述结果共同构建了一个关于西藏HBV C/D重组体形成与传播的假设性图景。分析表明,重组体中的C基因型和D基因型组分有着独立的进化历史。C基因型组分可能早在18世纪就已存在于相关谱系中,并通过不同的传播路径(C/D1和C/D2对应的C2分支进入西藏的时间相差约32年)在20世纪不同时期传入西藏。而D基因型组分则可能起源于19世纪末的亚洲地区,其D1亚型在20世纪末(约1989-1990年)才传入西藏,并在传入后相对较短的时期内(约2002-2004年)与早已存在的C基因型本地谱系发生重组,形成了现今流行的C/D1和C/D2重组体。D基因型种群在20世纪70年代后的快速增长,可能与现代交通和人口流动加速有关,而21世纪初的下降则可能反映了乙肝疫苗接种等防控措施的效果。
第五, 研究结论与价值
本研究通过对西藏某医院体检人群HBV C/D重组体的系统进化分析,得出以下核心结论:
- 起源时间:西藏流行的HBV C/D重组体,其D基因型组分可能起源于19世纪末的亚洲地区,而C基因型组分则可追溯至18世纪。这支持了HBV D基因型“亚洲起源”的学说,并揭示了西藏地区流行的病毒株具有复杂的多起源背景。
- 传播路径差异:虽然两类重组体(C/D1和C/D2)中的C基因型都与C2亚型关系最近,但它们的传播路径可能存在差异。C/D1重组体中的C基因型与传播至北美洲的C2分支更近,而C/D2中的则与东亚本土的C2分支更近。这提示了病毒传入西藏的可能路径多样性。
- 重组发生时间:C/D1和C/D2重组体的分化节点(约2002-2004年)显著晚于其组分基因型的起源时间,表明重组事件是相对近期发生的,西藏是这些重组体形成和传播的“热点”区域而非起源中心。
- 种群动态与防控启示:D基因型种群在20世纪后期显著增长,可能与地区开发和社会经济活动增加相关;而21世纪初的下降则可能与乙肝疫苗接种等公共卫生措施的实施有关。C基因型种群长期相对稳定。
本研究的科学价值在于首次较为精确地估算了西藏地区特色HBV C/D重组体各组分基因型的进化时间尺度,并描绘了其种群历史动态,为了解HBV在高海拔特殊环境下的进化适应和传播规律提供了关键数据。其应用价值在于为西藏地区的乙肝防控提供了有针对性的理论依据:防控重点应是阻断新型病毒株的输入和本地扩散,而非单纯的溯源;应继续巩固和优化针对重点人群(如新生儿、流动人口)的疫苗接种策略;在临床治疗中,有必要逐步开展HBV基因分型和重组体检测,以指导更精准的个体化治疗。
第六, 研究亮点
- 研究对象的特殊性:聚焦于中国HBV高流行区——西藏,针对当地独特的优势毒株C/D重组体进行深入研究,填补了该区域HBV深度进化研究的空白。
- 分析方法的系统性与先进性:综合运用了高通量测序、精细化的重组分析(jpHMM, SimPlot)以及前沿的贝叶斯系统发育学方法(BEAST),不仅鉴定了重组类型,还推断了进化时间、速率和种群历史动态,构成了一个完整、深入的分子流行病学研究范式。
- 重要的发现:明确了C/D重组体中C和D组分独立的、差异显著的进化历史(C组分古老且稳定,D组分较晚传入但增长迅速),并提出了重组发生相对晚近的结论。首次在西藏报道了罕见的B/C重组体,为后续研究提供了新线索。
- 将病毒进化与社会历史事件关联:尝试将病毒种群数量的波动(如D基因型在1970年后的增长)与西藏的社会经济发展阶段(交通建设、边境开放)和公共卫生事件(疫苗接种项目)进行联系,为理解病毒传播的社会驱动因素提供了视角。
第七, 其他有价值的内容
本研究亦坦诚地讨论了其局限性,这些内容对正确理解结果和指引未来研究方向至关重要:
- 样本局限性:样本量较小(46例C/D重组体),且均来自同一家医院,采集时间集中,可能无法完全代表西藏全区的HBV流行情况,存在一定的地域和选择偏倚。
- 序列库偏差:构建进化背景序列库时,仅纳入了有明确采样时间的现代序列,可能遗漏了一些缺乏时间信息但代表古老谱系的关键序列,这种“时间压缩”效应可能导致对进化速率的轻微高估。
- 临床关联性缺失:本研究未能将不同的HBV重组体类型与感染者的临床数据(如肝功能指标、疾病进展)进行关联分析,因此未能揭示不同基因型/重组体潜在的临床意义差异,这是未来需要探索的重要方向。
- 新毒株的提示:研究中发现的1例B/C重组体在西藏既往研究中未见报道,提示当地HBV基因库可能存在更复杂的多样性,值得进一步关注和研究。
综上所述,这项研究为解析西藏地区HBV的分子进化史提供了宝贵的数据和见解,强调了持续监测、扩大样本量和开展临床关联研究的重要性,以更好地服务于该地区的乙肝防控实践。