大规模基因组测序研究中的高效存储与回归计算

随着大规模人口生物样本库的日益普及,全基因组测序(Whole Genome Sequencing, WGS)数据在人类健康和疾病研究中的潜力得到了显著提升。然而,WGS数据的庞大计算和存储需求给研究机构,尤其是资金不足的机构或发展中国家的研究人员带来了巨大挑战。这种资源分配的不平等限制了前沿遗传学研究的公平性。为了解决这一问题,Manuel A. Rivas和Christopher Chang等人开发了新的算法和回归方法,显著减少了WGS研究的计算时间和存储需求,特别是针对罕见变异的处理。 论文来源 这篇论文由Manuel A. Rivas和Christopher Chang共同撰写。Rivas来自斯坦福大学生物医学数据科学系,Chang则供职于Grail Inc.。该论文于2025年2月1...

基于共享单元和多通道注意力机制的circRNA与疾病关联预测

背景介绍 近年来,环状RNA(circRNA)作为一种新型的非编码RNA分子,在疾病的发生、发展和治疗中扮演着重要角色。circRNA具有独特的环状结构,不易被核酸酶降解,因此被认为是潜在的生物标志物和治疗靶点。然而,通过实验方法研究circRNA与疾病的关联不仅耗时且成本高昂,这限制了相关研究的进展。为了解决这一问题,研究人员开始开发计算模型,通过生物信息学方法预测circRNA与疾病的关联,从而为实验研究提供指导。 尽管多视图学习方法在预测circRNA与疾病关联方面得到了广泛应用,但现有方法往往未能充分利用不同视图之间的潜在信息,且忽略了不同视图对预测结果的重要性差异。因此,哈尔滨工业大学和电子科技大学的团队提出了一种结合共享单元和多通道注意力机制的新方法,名为MSMCDA(Multi...

ACImpute:基于约束增强平滑方法的单细胞RNA测序数据插补

单细胞RNA测序(single-cell RNA sequencing, scRNA-seq)技术近年来在生物学和医学研究中得到了广泛应用,它能够揭示单个细胞的转录组信息,从而帮助科学家更好地理解细胞的异质性和复杂性。然而,scRNA-seq数据中存在一个普遍的问题,即“dropout事件”(dropout events)。这些事件导致许多基因在单个细胞中的表达值被记录为零,而这些零值可能分为两类:一类是“生物零”(biological zeros),表示基因在该细胞中确实没有表达;另一类是“技术零”(technical zeros),由于测序技术的限制导致基因表达未被检测到。这种数据稀疏性严重影响了后续分析的准确性和有效性,例如细胞聚类和轨迹推断。 为了解决这一问题,研究人员开发了多种插补...

基于APNet的稀疏深度学习模型在COVID-19严重程度驱动因素发现中的应用

学术背景 COVID-19大流行对全球公共卫生系统造成了巨大冲击,尽管目前疫情已有所缓解,但其复杂的免疫病理机制、长期后遗症(如“长新冠”)以及未来可能出现的类似威胁,仍然推动着相关研究的深入。特别是重症COVID-19患者,常伴随“细胞因子风暴”、急性呼吸窘迫综合征(ARDS)、多器官衰竭等严重症状,亟需更精准的预测模型和生物标志物来指导临床决策。 传统的机器学习(ML)和深度学习(DL)模型在高通量组学数据分析中表现出色,但往往缺乏生物可解释性,难以揭示非线性蛋白质动态(如翻译后修饰)和复杂的信号通路调控机制。为了解决这一问题,作者开发了APNet(Activity PASNet),一种结合了差异活性分析和生物信息驱动的稀疏深度学习模型,旨在通过可解释的预测发现COVID-19重症的驱动...

SP-DTI:基于亚口袋信息的Transformer模型用于药物-靶点相互作用预测

学术背景 药物-靶点相互作用(Drug-Target Interaction, DTI)预测是药物发现中的关键环节,能够显著降低实验筛选的成本和时间。然而,尽管深度学习技术已经提升了DTI预测的准确性,现有方法仍面临两大挑战:泛化能力不足和亚口袋级相互作用的忽视。首先,现有模型在未见过的蛋白质和跨域设置下性能显著下降;其次,当前的分子关系学习往往忽略了亚口袋级别的相互作用,而这些相互作用对于理解结合位点的细节至关重要。为了解决这些问题,研究人员提出了一种名为SP-DTI的新型模型,通过引入亚口袋分析和预训练语言模型,提升了DTI预测的准确性和泛化能力。 论文来源 这篇论文由Sizhe Liu、Yuchen Liu、Haofeng Xu、Jun Xia和Stan Z. Li共同撰写。他们分别来...