スケーラブルな単細胞パーターバンススクリーニングを用いた分子経路シグネチャーの系統的再構築
機能ゲノミクスの分野では、研究者たちは観測データから因果関係を予測するために努力を続けてきました。しかし、現代の技術が多様な分子モダリティを測定できるにもかかわらず、観測データから因果関係を推測することは依然として難しい課題です。特に、シグナル経路の調節因子の下流エフェクター(effectors)の識別と定量化は、ゲノミクス研究の重要な焦点の一つです。CRISPRなどのゲノム編集ツールの登場により、大規模な並列スクリーニングが可能になり、特に単細胞RNAシーケンス(scRNA-seq)と組み合わせたPerturb-seq技術は、遺伝的擾乱を通じて因果推論を実現することができます。しかし、既存のPerturb-seqの応用は主に静止細胞に焦点を当てており、文脈依存的な遺伝子機能を正確に記述できない可能性があります。
この問題を解決するために、研究者たちは、コンビナトリアルインデックスと次世代シーケンス技術を組み合わせた拡張可能なPerturb-seqワークフローを開発し、さまざまな生物学的背景におけるシグナル調節因子のターゲットを体系的に識別しました。この方法により、研究者たちは擾乱効率の異質性を定量化するだけでなく、生体内および原位置サンプルにおけるシグナル経路の活性化変化を推測することができました。
論文の出典
この論文は、Longda Jiang、Carol Dalgarno、Efthymia Papalexi、Isabella Mascio、Hans-Hermann Wessels、Huiyoung Yun、Nika Iremadze、Gila Lithwick-Yanai、Doron Lipson、Rahul Satijaらによって共同執筆されました。著者たちは、New York Genome Center、New York Universityのゲノム・システム生物学センター、およびUltima Genomicsなど、複数の研究機関に所属しています。この論文は2025年3月に『Nature Cell Biology』誌に掲載され、DOIは10.1038/s41556-025-01622-zです。
研究の流れと結果
研究の流れ
実験設計と細胞培養
研究者たちは、6種類の異なる起源を持つがん細胞株(A549、MCF7、HT29、HAP1、BXPC3、K562)を選択し、これらの細胞にCRISPRi dCas9-KRAB-MeCP2カセットを発現させました。さまざまなシグナル経路の活動を研究するために、研究者たちは各細胞株に対して5種類の異なる刺激(IFN-β、IFNγ、TGF-β、TNF、インスリン)を行いました。各シグナル経路に対して、44から61個の既知の調節因子を選択し、各遺伝子に対して3つの独立した単一ガイドRNA(sgRNA)を設計しました。Perturb-seq実験
研究者たちは、Parse BiosciencesのEverCode Whole Transcriptome Mega Kitを使用して単細胞RNAシーケンスを行い、コンビナトリアルインデックス技術を組み合わせることで実験の拡張性とコスト効率を向上させました。実験では、260万個の細胞をシーケンスし、コンビナトリアルパースバーコード(Parse barcodes)を使用して細胞タイプと刺激条件を識別し、sgRNAバーコードを使用して遺伝的擾乱を識別しました。データ分析とアルゴリズム開発
Perturb-seqデータの技術的異質性と生物学的異質性を処理するために、研究者たちはMixScaleという計算フレームワークを開発しました。MixScaleは、各細胞の擾乱強度を推定することで、差異発現遺伝子(DEG)の識別を最適化します。MixScaleはまず各細胞の「擾乱ベクトル」を推定し、その後、スカラー射影を使用して各細胞の擾乱度合いを定量化します。さらに、研究者たちは加重多変量回帰(WMVReg)法を導入し、DEG識別のロバスト性を向上させました。シグナル経路特徴の抽出と検証
研究者たちは、多CCA(MulticCA)分解法を使用して、異なる細胞株とシグナル経路間で保存されている擾乱プログラムを識別しました。これらのプログラムは、特定の調節因子の下流遺伝子発現変化を反映しています。研究者たちは、外部データセットを使用してこれらのシグナル経路特徴を検証し、IFNβ刺激を受けた単核球、IFNγ刺激を受けたPBMCs、およびTGFβ刺激を受けた卵巣がん細胞株を含めました。
主な結果
MixScaleフレームワークの有効性
MixScaleは、CRISPRi擾乱データの勾配応答を定量化することができ、特に細胞擾乱効率に異質性がある場合に有効です。MixScaleにより、研究者たちはDEGをより正確に識別できるようになり、低細胞数条件下でも高い統計的検出力を維持することができました。シグナル経路特徴の保存性と特異性
研究者たちは、異なるシグナル経路の調節因子が同じ経路内で下流遺伝子ターゲットに高い重複を示す一方で、異なる細胞株間では明らかな特異性を示すことを発見しました。例えば、IFNγとIFNβ経路の応答は複数の細胞株間で保存されているのに対し、TGFβとインスリンシグナル経路は細胞タイプ特異性を示しました。シグナル経路特徴の応用
研究者たちは、抽出したシグナル経路特徴を使用して、COVID-19患者におけるIFNβシグナルの活性化を推測し、クローン病(Crohn’s disease)におけるTNFシグナル経路の非免疫細胞での活性化を識別しました。さらに、研究者たちは空間トランスクリプトミクス技術を使用して、マウス結腸損傷モデルにおけるTGFβシグナル経路の空間的活性化パターンを識別しました。
結論と意義
この研究は、拡張可能なPerturb-seqワークフローとMixScale計算フレームワークを開発することで、多様なシグナル経路の分子特徴を体系的に再構築しました。これらの特徴は、既存の遺伝子セットを拡張するだけでなく、異なる生物学的背景におけるシグナル経路の活性化を正確に推測することができます。この研究は、シグナル経路の調節メカニズムを理解するための新しいツールと方法を提供し、今後の機能ゲノミクス研究の基盤を築きました。
研究のハイライト
- 拡張可能なPerturb-seqワークフロー:コンビナトリアルインデックスと次世代シーケンス技術を組み合わせることで、大規模な実験でシグナル調節因子のターゲットを体系的に識別することが可能になりました。
- MixScale計算フレームワーク:MixScaleは、細胞擾乱効率の異質性を定量化し、DEGの識別を最適化することで、統計的検出力を向上させました。
- シグナル経路特徴の保存性と特異性:研究者たちは、異なる細胞株とシグナル経路間で保存されている擾乱プログラムを識別し、これらの特徴が多様な生物学的背景で応用可能であることを検証しました。
- 応用の可能性:この研究は、COVID-19やクローン病などの疾患におけるシグナル経路の活性化を理解するための新しいツールを提供し、その幅広い応用可能性を示しました。
その他の価値ある情報
研究者たちは、今後の研究でこのフレームワークを他の生物学的プロセスや細胞タイプに適用し、クロマチンアクセシビリティやタンパク質レベルなどの多モダリティデータを組み合わせることで、シグナル伝達メカニズムの理解をさらに深めることができると指摘しています。また、コンビナトリアル擾乱技術の応用は、経路内および経路間の調節因子の相互作用を探る新しい視点を提供するでしょう。
この論文は、革新的な実験設計と計算方法を通じて、機能ゲノミクス分野に重要なツールと洞察を提供し、複雑な生物システムを理解するためのPerturb-seq技術の可能性を示しました。