行列補完に基づくアンサンブル学習による微生物-疾患関連予測の改善

学術的背景と研究課題 微生物は地球上で最も広く存在する生命体の一つであり、海洋や土壌、そして人間そのものとも密接に関わっています。人体には約350兆個の微生物細胞(microbial cells)が存在しており、健康や病気の発症・進展と密接な関係を持っています。近年、シーケンシング技術とバイオインフォマティクスの急速な発展により、人体の微生物叢(microbiome)構成やその機能が健康に与える影響を明らかにする研究が数多くなされています。例えば、腸内細菌叢の構成変化は免疫系や疾患発症に影響を与え、肝臓の代謝も腸内微生物の調節を受け、エネルギー消費の低下や脂肪蓄積の促進などを介して代謝疾患の進展に寄与することが証明されています。 実験バイオ医学は微生物―疾患(microbe-disease)...

HSSPPI: 階層的および空間的シーケンシャルモデリングによるPPI予測

背景紹介:タンパク質間相互作用予測のボトルネックと機会の解明 タンパク質(Protein)は生命活動の中心分子として、遺伝子発現、RNA転写、DNA合成、免疫反応など、ほぼすべての生物学的プロセスや細胞機能に関与しています。タンパク質分子同士の相互作用(Protein-Protein Interactions, PPI)、および特定部位での相互作用(Protein-Protein Interaction Sites, PPIS)は、多様かつ精緻な生理活動を決定づけます。例えば、創薬、タンパク質機能アノテーション、疾患分子メカニズムの探究、グローバルなタンパク質間相互作用ネットワークの構築などは、すべて高品質なPPIおよびPPIS情報を基盤としています。 しかし、従来の生物学実験(X線結晶構造...

MAEST: グラフマスクオートエンコーダーを用いた空間トランスクリプトミクスにおける正確な空間領域検出

空間トランスクリプトミクス――組織空間ヘテロジニティ解析の最前線技術 空間トランスクリプトミクス(Spatial Transcriptomics, ST)は、近年急速に発展しているシーケンシング技術であり、その核心は組織スライスレベルで遺伝子発現と空間位置情報の両方を同時に取得できる点にあります。これにより、多細胞生物組織の空間構造、機能分区、および疾患マイクロ環境の解明に前例のないデータ基盤を提供します。10x Visium、Slide-seq、Stereo-seq、seqFISH、MERFISHといったプラットフォーム技術の進展に伴い、科学者たちは高解像度で空間的にトラッキング可能な大規模遺伝子発現データを取得でき、発生生物学、神経科学、腫瘍生物学などの分野の発展に大きく寄与しています。...

TopoQA: トポロジカルディープラーニングに基づくタンパク質複合体構造インターフェース品質評価アプローチ

学術的背景 タンパク質複合体の三次元構造解析は、現代の構造生物学、分子機構の研究、創薬、さらに人工タンパク質設計など多岐にわたる分野の核心的な課題である。タンパク質の機能はしばしばその構造によって決定されるが、多くの生物学的プロセスはタンパク質間の複雑な相互作用に関与している。従来の実験的手法(X線結晶構造解析、クライオ電子顕微鏡、NMRなど)はタンパク質の三次元構造を決定できるが、時間とコストがかかり、高スループットまたは大規模研究には不向きである。近年、データ駆動型のタンパク質構造予測手法(AlphaFold, RoseTTAFold等)が革命的な成果を挙げ、特に単体タンパク質モデルの精度は実験構造に匹敵するまでになった。しかし、タンパク質複合体の構造予測精度は単体ほど高くなく、とくに多...

Granger因果リカレントオートエンコーダーによる時系列単細胞RNAシーケンスデータからの遺伝子制御ネットワークの推論

1. 学術的背景と研究動機 近年、シングルセルRNAシーケンシング(single-cell RNA sequencing、scRNA-seq)は、生命科学および医学研究分野における画期的な技術の一つとなっており、研究者は細胞単位で多くの細胞間の転写レベルの微妙な差異を捉えることが可能となっています。この技術は細胞生物学を大いに豊かにし、細胞分化、発生、疾患発症メカニズムの理解に重大な意義を持ちます。scRNA-seqデータに基づき、遺伝子調節ネットワーク(gene regulatory networks, GRNs)を推定し、転写因子と標的遺伝子間の複雑な調節関係を明らかにすることは、現在のバイオインフォマティクスやシステムバイオロジーの中でも鍵となる課題です。 しかし、scRNA-seqデ...

Cox-SAGE:解釈可能なグラフニューラルネットワークを用いたCox比例ハザードモデルの強化とがん予後への応用

一、研究背景と学問的最前線 がん予後解析は、医学分野の中核的な研究テーマであり続けています。近年、ハイスループットシーケンシング技術(high-throughput sequencing technologies)が広く応用されたことで、科学者たちはがん患者の分子バイオマーカー(biomarker)や臨床的特徴をより深く探求できるようになりました。これにより、臨床医は患者の生存リスクをより正確に評価し、個別化された治療戦略を立てることが可能になりました。伝統的なCox比例ハザードモデル(Cox proportional hazards model)は、生存解析の古典的ツールとしてその優れた統計的基盤と適応性の高さから、がん予後研究で広く利用されています。 しかし、深層学習(Deep Lear...