問題解決プロトコル:タンパク質構造と言語モデル埋め込みを使用した正確な残基レベルの相分離予測

一、学術的背景と研究意義 近年、タンパク質の液-液相分離(phase separation、PS)は、細胞内生体分子の制御メカニズムとして生命科学分野で広く注目を集めています。相分離は膜なしオルガネラ(biomolecular condensates)の形成を促進するだけでなく、生化学反応速度、タンパク質の組織や局在に大きく影響し、さらに癌や神経変性疾患といった重大疾患の発症とも密接に関わっています。相分離現象の生物学的意義は次第に明らかになってきましたが、その駆動メカニズムや調節コードは依然として複雑かつ捉えがたく、とくに相分離を駆動するタンパク質領域の認識において、科学界は依然多くの課題に直面しています。 従来の相分離予測手法は、既存のタンパク質注釈情報や人工的に設定した特徴パラメータに...

Chrombus-XMBD:染色質特徴に基づく3Dゲノム予測グラフ畳み込みモデル

研究背景と学問的意義 真核細胞内において、クロマチン(Chromatin)の三次元空間構造は、遺伝子発現の制御に極めて重要な役割を果たしています。DNAは複雑な折りたたみやループ形成、局所的な空間再構築を通じて、異なる遺伝子要素(プロモーターpromoterやエンハンサーenhancerなど)が空間的に隣接し、精巧なシス(cis)制御を実現します。近年、発生生物学、疾患メカニズム、またはエピゲノム研究の分野で、三次元ゲノム(3D-genome)の動的構造が遺伝子発現の変化と密接に関連していることが繰り返し証明されています。 現在、ゲノム空間構造を捉える主な実験手法には、3C、4C、5C、Hi-C、ChIA-PET、HiChIPなどがあります。しかし、これらの実験手法はコストが高く、操作が複雑...

Deep scSTAR: 単細胞RNAシーケンシングおよび空間トランスクリプトミクスデータからの表現型関連特徴の抽出と強化のための深層学習の活用

近年、シングルセルRNAシーケンシング(scRNA-seq)及び空間トランスクリプトミクス(spatial transcriptomics, ST)などの先端技術は、生命科学・臨床医学の発展を飛躍的に促進してきました。これらの技術は細胞異質性を明らかにし、疾患、発生、免疫などの重要領域に新たな知見をもたらしました。しかし、大規模シングルセルデータは技術ノイズが強く、バッチ効果(batch effects)が複雑で、生物学的シグナルが多様かつ雑然としているため、「表現型に関連した特徴の正確な抽出と強調」が最大の課題の一つとなっています。多くの従来手法はノイズ除去や統合を主目的としていますが、同時に研究の鍵となる表現型決定シグナルを弱めたり、消失させたりしてしまい、疾患機構や細胞間相互作用の理解...

行列補完に基づくアンサンブル学習による微生物-疾患関連予測の改善

学術的背景と研究課題 微生物は地球上で最も広く存在する生命体の一つであり、海洋や土壌、そして人間そのものとも密接に関わっています。人体には約350兆個の微生物細胞(microbial cells)が存在しており、健康や病気の発症・進展と密接な関係を持っています。近年、シーケンシング技術とバイオインフォマティクスの急速な発展により、人体の微生物叢(microbiome)構成やその機能が健康に与える影響を明らかにする研究が数多くなされています。例えば、腸内細菌叢の構成変化は免疫系や疾患発症に影響を与え、肝臓の代謝も腸内微生物の調節を受け、エネルギー消費の低下や脂肪蓄積の促進などを介して代謝疾患の進展に寄与することが証明されています。 実験バイオ医学は微生物―疾患(microbe-disease)...

シングルセル多オミクスデータセットを使用したコピー数異常推論ツールのベンチマーク

一、研究背景及意义 腫瘍学およびゲノム研究分野において、染色体コピー数異常(Copy Number Alterations, CNAs)は癌の発生および進行を引き起こす主要な遺伝的変異タイプです。CNAsは腫瘍の異質性を決定するだけでなく、早期腫瘍検出、腫瘍サブクローン(subclone)進化解析、耐性機構の研究などにおいても重要な意義を持ちます。従来のコピー数変異検出方法は主に単一細胞DNAシーケンシング(scDNA-seq)に依存しており、分解能は高いものの、高コストやシーケンスカバレッジの低さに制約され、大規模・高スループットな実応用において広く利用するのは難しい現状です。 single-cell RNA sequencing(scRNA-seq)技術の普及とデータ蓄積が進むに伴い、s...

HSSPPI: 階層的および空間的シーケンシャルモデリングによるPPI予測

背景紹介:タンパク質間相互作用予測のボトルネックと機会の解明 タンパク質(Protein)は生命活動の中心分子として、遺伝子発現、RNA転写、DNA合成、免疫反応など、ほぼすべての生物学的プロセスや細胞機能に関与しています。タンパク質分子同士の相互作用(Protein-Protein Interactions, PPI)、および特定部位での相互作用(Protein-Protein Interaction Sites, PPIS)は、多様かつ精緻な生理活動を決定づけます。例えば、創薬、タンパク質機能アノテーション、疾患分子メカニズムの探究、グローバルなタンパク質間相互作用ネットワークの構築などは、すべて高品質なPPIおよびPPIS情報を基盤としています。 しかし、従来の生物学実験(X線結晶構造...

GCduo:GC × GC–MSデータ分析のためのオープンソースソフトウェア

学術的背景と研究動機 複雑なサンプル分析ニーズの高まりとともに、クロマトグラフィー技術、特に全二次元ガスクロマトグラフィー‐質量分析(GC×GC–MS、Comprehensive Two-dimensional Gas Chromatography coupled with Mass Spectrometry)は、ノンターゲット型メタボローム解析などの分野において主要な技術として、その強力な解析力を発揮しています。GC×GC–MSは、単一の実験で数百から数千の化合物成分を同時に分離・検出できますが、生成されるデータは膨大かつ構造が複雑であり、高次元性によってデータの解釈が困難となっており、これがこの技術の普及を妨げる最大のボトルネックとなっています。既存の商用ソフトウェアはいくつか自動化され...

がんにおける神経浸潤の評価による新たな癌の特徴の解明

癌症は世界的に重大な公衆衛生上の課題であり、その発生および進展のメカニズムは極めて複雑です。長年にわたり、腫瘍微小環境(tumor microenvironment,TME)の免疫、炎症、血管新生などのプロセスが広く注目され、腫瘍の生物学的挙動の重要な決定要因と見なされてきました。近年、「がん神経科学(cancer neuroscience)」という新たな学際分野が誕生し、神経系が神経伝達物質や神経ペプチドなどによって腫瘍の発展を調節し、また神経-腫瘍細胞間の直接または間接的な相互作用を通じて、腫瘍の成長・転移・浸潤に影響することが明らかになってきました。「末梢神経浸潤(perineural invasion, PNI)」など神経関連現象が注目されているものの、腫瘍疾患における「神経浸潤」の...

MAEST: グラフマスクオートエンコーダーを用いた空間トランスクリプトミクスにおける正確な空間領域検出

空間トランスクリプトミクス――組織空間ヘテロジニティ解析の最前線技術 空間トランスクリプトミクス(Spatial Transcriptomics, ST)は、近年急速に発展しているシーケンシング技術であり、その核心は組織スライスレベルで遺伝子発現と空間位置情報の両方を同時に取得できる点にあります。これにより、多細胞生物組織の空間構造、機能分区、および疾患マイクロ環境の解明に前例のないデータ基盤を提供します。10x Visium、Slide-seq、Stereo-seq、seqFISH、MERFISHといったプラットフォーム技術の進展に伴い、科学者たちは高解像度で空間的にトラッキング可能な大規模遺伝子発現データを取得でき、発生生物学、神経科学、腫瘍生物学などの分野の発展に大きく寄与しています。...

TopoQA: トポロジカルディープラーニングに基づくタンパク質複合体構造インターフェース品質評価アプローチ

学術的背景 タンパク質複合体の三次元構造解析は、現代の構造生物学、分子機構の研究、創薬、さらに人工タンパク質設計など多岐にわたる分野の核心的な課題である。タンパク質の機能はしばしばその構造によって決定されるが、多くの生物学的プロセスはタンパク質間の複雑な相互作用に関与している。従来の実験的手法(X線結晶構造解析、クライオ電子顕微鏡、NMRなど)はタンパク質の三次元構造を決定できるが、時間とコストがかかり、高スループットまたは大規模研究には不向きである。近年、データ駆動型のタンパク質構造予測手法(AlphaFold, RoseTTAFold等)が革命的な成果を挙げ、特に単体タンパク質モデルの精度は実験構造に匹敵するまでになった。しかし、タンパク質複合体の構造予測精度は単体ほど高くなく、とくに多...