Transformerモデルを用いたDNA配列アラインメントの研究

学術的背景 DNAシーケンスアラインメントは、ゲノム解析における中心的な課題であり、短いDNA断片(リード)を参照ゲノム上の最も可能性の高い位置にマッピングすることを目的としています。従来の方法は通常、2つのステップに分かれています。まずゲノムをインデックス化し、次に効率的な検索を行ってリードの可能性のある位置を特定します。しかし、ゲノムデータの爆発的な増加、特に数十億塩基対の参照ゲノムを扱う場合、従来のアラインメント方法は計算効率と精度の面で大きな課題に直面しています。近年、Transformerモデルが自然言語処理(NLP)分野で成功を収めたことから、研究者はこれをDNAシーケンス解析に応用しようとしています。これまでの研究では、Transformerモデルが短いDNAシーケンスの分類タ...

SCICONE:単細胞コピー数変異とイベント履歴の再構築

腫瘍の進化過程において、ゲノムコピー数変異(Copy Number Alterations, CNAs)は腫瘍の異質性と進化を駆動する重要な要因です。これらの変異を理解することは、個別化されたがん診断や治療法の開発にとって極めて重要です。単一細胞シーケンス技術は、単一細胞レベルまで深く分析できる最高解像度のコピー数解析を提供します。しかし、低リード深度(low read-depth)の全ゲノムシーケンスデータは、コピー数変異の検出に大きな統計的および計算上の課題をもたらします。既存の計算方法の多くは細胞間の進化的関係を無視しており、その結果、検出精度が低下しています。そのため、細胞の進化歴史を組み込んだコピー数検出方法の開発が現在の研究における緊急の課題となっています。 論文の出典 本論文は...

FlowPacker: トーショナルフローマッチングを用いたタンパク質側鎖パッキング

タンパク質の三次元構造はそのアミノ酸配列によって決定され、タンパク質の機能はその三次元構造に大きく依存しています。タンパク質の側鎖構造(side-chain conformations)は、タンパク質の折り畳み、タンパク質-タンパク質相互作用、およびタンパク質設計(de novo protein design)において重要な役割を果たします。正確にタンパク質側鎖の構造を予測することは、タンパク質の折り畳みメカニズムを理解し、新しいタンパク質を設計し、タンパク質相互作用を研究するための鍵となります。しかし、従来の物理ベースのモデル(physics-based modeling)は、経験的なスコアリング関数(empirical scoring functions)、離散的なロタマーライブラリ(d...

トランスフォーマーを用いたCryo-EM密度マップの効率的な強化

学術的背景 低温電子顕微鏡(Cryo-EM)は、タンパク質などの巨大分子の構造を解析するための重要な実験技術です。しかし、Cryo-EMの有効性は、低コントラストや構造の異質性などの実験条件によって引き起こされるノイズや密度値の欠損によってしばしば制限されます。既存のグローバルおよびローカルな画像シャープニング技術はCryo-EM密度マップの改善に広く使用されていますが、より正確なタンパク質構造を構築するためにその品質を効率的に向上させることには依然として課題があります。この問題を解決するために、研究者はCryoTenという3D UNETR++スタイルのTransformerモデルを開発し、Cryo-EM密度マップの品質を効果的に向上させることを目指しています。 論文の出典 この論文は、Jo...

GCLink:遺伝子調節ネットワーク推論のためのグラフコントラストリンク予測フレームワーク

研究背景 遺伝子制御ネットワーク(Gene Regulatory Networks, GRNs)は、細胞内の複雑な生物学的プロセスを理解するための重要なツールです。それは転写因子(Transcription Factors, TFs)と標的遺伝子間の相互作用を明らかにし、遺伝子の転写プロセスを制御し、細胞の挙動を調節します。単細胞RNAシークエンシング(single-cell RNA-sequencing, scRNA-seq)技術の発展により、研究者は単細胞解像度で遺伝子発現データを取得できるようになり、これがGRNsの推論に前例のない機会を提供しています。しかし、scRNA-seqデータのスパース性と高い変動性は、GRNsの推論に大きな課題をもたらしています。 現存のGRN推論手法は主に...

免疫標的—がん免疫療法のための細胞表面標的の統合的優先順位付け

癌は世界的に死亡の主要原因の一つです。近年、免疫療法が著しい進展を遂げ、例えばキメラ抗原受容体T細胞(CAR-T)療法や抗体薬物複合体(ADCs)の成功が挙げられますが、がん特異的な表面タンパク質の標的を効果的に識別することは依然として大きな課題です。表面タンパク質の標的の識別は、精密で低毒性の免疫療法の開発にとって重要です。RNAシーケンシングやプロテオミクスなどの既存の技術は、これらの標的を分析するのに役立ちますが、最適な免疫療法の標的を体系的に優先選択する方法が不足しています。 この課題に対処するため、Children’s Hospital of Philadelphia、Drexel University、BC Cancer Research Instituteなどの研究チームは、I...