DeepRNA-Twist:言語モデル誘導型RNAねじれ角予測とアテンション-インセプションネットワーク

一、学術的背景と研究動機 生命科学およびバイオインフォマティクスの急速な発展に伴い、RNA分子構造とその機能に関する研究はホットな分野となっている。RNAは単なる遺伝情報の伝達者に留まらず、調節・触媒など数多くの生理過程で重要な役割を果たしている。RNA分子の三次元構造はその生物学的機能に直接影響し、RNA構造の精密な解析は基礎科学、創薬、疾患メカニズム研究などにとって極めて重要である。しかし、RNAの配列から構造への変換はタンパク質よりもはるかに複雑であり、RNAの骨格には7つの主鎖ねじれ角(α, β, γ, δ, ε, ζ, χ)があり、さらに複雑な擬似ねじれ角(η, θ)や非標準塩基対、多重ループ、三重相互作用など多様な構造要因が加わることで、高精度なRNA三次元構造予測が非常に困難と...

行列補完に基づくアンサンブル学習による微生物-疾患関連予測の改善

学術的背景と研究課題 微生物は地球上で最も広く存在する生命体の一つであり、海洋や土壌、そして人間そのものとも密接に関わっています。人体には約350兆個の微生物細胞(microbial cells)が存在しており、健康や病気の発症・進展と密接な関係を持っています。近年、シーケンシング技術とバイオインフォマティクスの急速な発展により、人体の微生物叢(microbiome)構成やその機能が健康に与える影響を明らかにする研究が数多くなされています。例えば、腸内細菌叢の構成変化は免疫系や疾患発症に影響を与え、肝臓の代謝も腸内微生物の調節を受け、エネルギー消費の低下や脂肪蓄積の促進などを介して代謝疾患の進展に寄与することが証明されています。 実験バイオ医学は微生物―疾患(microbe-disease)...

非コードRNAの分類とクラス注釈のための多モーダル解釈可能表現

非コードRNA(ncRNA)は、細胞プロセスや疾患の発症において重要な役割を果たしています。ゲノムシーケンシングプロジェクトによって大量の非コード遺伝子が明らかになりましたが、ncRNAの機能と分類は依然として複雑で挑戦的な問題です。ncRNAの多様性、複雑性、および機能性は、バイオマーカーや治療ターゲットの発見において、特に生物医学研究の重要な対象となっています。しかし、既存のncRNA分類ツールの多くは、単一または2種類のデータタイプ(例えば配列や二次構造)に依存しており、他の重要な情報源を無視しています。さらに、既存の手法は解釈可能性に欠けることが多く、異なるncRNAクラスの特徴を明らかにするのが困難です。 これらの問題を解決するため、Université Paris-Saclayと...

Transformerモデルを用いたDNA配列アラインメントの研究

学術的背景 DNAシーケンスアラインメントは、ゲノム解析における中心的な課題であり、短いDNA断片(リード)を参照ゲノム上の最も可能性の高い位置にマッピングすることを目的としています。従来の方法は通常、2つのステップに分かれています。まずゲノムをインデックス化し、次に効率的な検索を行ってリードの可能性のある位置を特定します。しかし、ゲノムデータの爆発的な増加、特に数十億塩基対の参照ゲノムを扱う場合、従来のアラインメント方法は計算効率と精度の面で大きな課題に直面しています。近年、Transformerモデルが自然言語処理(NLP)分野で成功を収めたことから、研究者はこれをDNAシーケンス解析に応用しようとしています。これまでの研究では、Transformerモデルが短いDNAシーケンスの分類タ...

トランスフォーマーを用いたCryo-EM密度マップの効率的な強化

学術的背景 低温電子顕微鏡(Cryo-EM)は、タンパク質などの巨大分子の構造を解析するための重要な実験技術です。しかし、Cryo-EMの有効性は、低コントラストや構造の異質性などの実験条件によって引き起こされるノイズや密度値の欠損によってしばしば制限されます。既存のグローバルおよびローカルな画像シャープニング技術はCryo-EM密度マップの改善に広く使用されていますが、より正確なタンパク質構造を構築するためにその品質を効率的に向上させることには依然として課題があります。この問題を解決するために、研究者はCryoTenという3D UNETR++スタイルのTransformerモデルを開発し、Cryo-EM密度マップの品質を効果的に向上させることを目指しています。 論文の出典 この論文は、Jo...