Reconstruction systématique des signatures de voies moléculaires à l'aide de criblages de perturbation unicellulaires évolutifs

Dans le domaine de la génomique fonctionnelle, les chercheurs s’efforcent de prédire les relations de régulation causales à partir de données d’observation. Cependant, bien que les technologies modernes permettent de mesurer diverses modalités moléculaires, l’inférence des relations de régulation causales à partir de données d’observation reste un défi. En particulier, l’identification et la quantification des effecteurs en aval des régulateurs des voies de signalisation constituent un objectif majeur de la recherche en génomique. L’émergence d’outils d’édition génomique tels que CRISPR a permis des criblages à haut débit, en particulier la technologie Perturb-seq, qui combine le séquençage de l’ARN à l’échelle d’une seule cellule (scRNA-seq) avec des perturbations génétiques pour permettre l’inférence causale. Cependant, les applications actuelles de Perturb-seq se concentrent principalement sur les cellules au repos, ce qui peut ne pas décrire avec précision les fonctions génétiques dépendantes du contexte.

Pour résoudre ce problème, les chercheurs ont développé un flux de travail évolutif de Perturb-seq, combinant l’indexation combinatoire et les technologies de séquençage de nouvelle génération, afin d’identifier systématiquement les cibles des régulateurs de signalisation dans différents contextes biologiques. Grâce à cette méthode, les chercheurs peuvent non seulement quantifier l’hétérogénéité de l’efficacité des perturbations, mais aussi déduire les changements d’activation des voies de signalisation dans des échantillons in vivo et in situ.

Source de l’article

Cet article a été co-écrit par Longda Jiang, Carol Dalgarno, Efthymia Papalexi, Isabella Mascio, Hans-Hermann Wessels, Huiyoung Yun, Nika Iremadze, Gila Lithwick-Yanai, Doron Lipson et Rahul Satija, entre autres. Les auteurs proviennent de plusieurs institutions de recherche, notamment le New York Genome Center, le Center for Genomics and Systems Biology de la New York University et Ultima Genomics. L’article a été publié en mars 2025 dans la revue Nature Cell Biology, avec le DOI 10.1038/s41556-025-01622-z.

Processus et résultats de la recherche

Processus de recherche

  1. Conception expérimentale et culture cellulaire
    Les chercheurs ont sélectionné six lignées cellulaires cancéreuses d’origines différentes (A549, MCF7, HT29, HAP1, BXPC3 et K562) et ont exprimé dans ces cellules une cassette CRISPRi dCas9-KRAB-MeCP2. Pour étudier l’activité des différentes voies de signalisation, les chercheurs ont soumis chaque lignée cellulaire à cinq stimuli différents : IFN-β, IFNγ, TGF-β, TNF et insuline. Pour chaque voie de signalisation, 44 à 61 régulateurs connus ont été sélectionnés, et trois ARN guides uniques (sgRNA) ont été conçus pour chaque gène.

  2. Expérience Perturb-seq
    Les chercheurs ont utilisé le kit EverCode Whole Transcriptome Mega Kit de Parse Biosciences pour le séquençage de l’ARN à l’échelle d’une seule cellule, en combinant la technologie d’indexation combinatoire pour améliorer l’évolutivité et la rentabilité de l’expérience. Au total, 2,6 millions de cellules ont été séquencées, et des codes-barres combinatoires (Parse barcodes) ont été utilisés pour identifier les types de cellules et les conditions de stimulation, tandis que les codes-barres sgRNA ont servi à identifier les perturbations génétiques.

  3. Analyse des données et développement d’algorithmes
    Pour traiter l’hétérogénéité technique et biologique dans les données de Perturb-seq, les chercheurs ont développé un cadre de calcul appelé MixScale. MixScale estime l’intensité de la perturbation pour chaque cellule, optimisant ainsi l’identification des gènes différentiellement exprimés (DEG). MixScale commence par estimer un “vecteur de perturbation” pour chaque cellule, puis quantifie le degré de perturbation par projection scalaire. De plus, les chercheurs ont introduit une méthode de régression multivariée pondérée (WMVReg) pour améliorer la robustesse de l’identification des DEG.

  4. Extraction et validation des caractéristiques des voies de signalisation
    Les chercheurs ont utilisé une méthode de décomposition multicCA (MulticCA) pour identifier des programmes de perturbation conservés dans différentes lignées cellulaires et voies de signalisation. Ces programmes reflètent les changements d’expression des gènes en aval de régulateurs spécifiques. Les chercheurs ont également validé ces caractéristiques de voies de signalisation à l’aide de jeux de données externes, y compris des monocytes stimulés par l’IFNβ, des PBMCs stimulés par l’IFNγ et une lignée cellulaire de cancer de l’ovaire stimulée par le TGFβ.

Principaux résultats

  1. Efficacité du cadre MixScale
    MixScale permet de quantifier les réponses en gradient dans les données de perturbation CRISPRi, en particulier dans les cas où l’efficacité de la perturbation varie entre les cellules. Grâce à MixScale, les chercheurs peuvent identifier les DEG avec plus de précision, tout en maintenant une puissance statistique élevée même avec un faible nombre de cellules.

  2. Conservation et spécificité des caractéristiques des voies de signalisation
    Les chercheurs ont constaté que les régulateurs de différentes voies de signalisation ciblent des gènes en aval qui se chevauchent largement dans la même voie, mais présentent une spécificité marquée selon les lignées cellulaires. Par exemple, les réponses des voies IFNγ et IFNβ sont conservées dans de nombreuses lignées cellulaires, tandis que les voies de signalisation TGFβ et insuline présentent une spécificité de type cellulaire significative.

  3. Applications des caractéristiques des voies de signalisation
    Les chercheurs ont utilisé les caractéristiques extraites des voies de signalisation pour déduire avec succès l’activation de la voie IFNβ chez les patients atteints de COVID-19, et ont identifié l’activation de la voie TNF dans les cellules non immunitaires de la maladie de Crohn. De plus, les chercheurs ont utilisé la transcriptomique spatiale pour identifier les modèles d’activation spatiale de la voie TGFβ dans un modèle de lésion colique chez la souris.

Conclusion et signification

Cette étude, grâce au développement d’un flux de travail évolutif de Perturb-seq et du cadre de calcul MixScale, a systématiquement reconstruit les caractéristiques moléculaires de plusieurs voies de signalisation. Ces caractéristiques étendent non seulement les ensembles de gènes existants, mais permettent également de déduire avec précision l’activation des voies de signalisation dans différents contextes biologiques. Cette étude fournit de nouveaux outils et méthodes pour comprendre les mécanismes de régulation des voies de signalisation et jette les bases de futures recherches en génomique fonctionnelle.

Points forts de la recherche

  1. Flux de travail évolutif de Perturb-seq : En combinant l’indexation combinatoire et les technologies de séquençage de nouvelle génération, les chercheurs peuvent identifier systématiquement les cibles des régulateurs de signalisation dans des expériences à grande échelle.
  2. Cadre de calcul MixScale : MixScale permet de quantifier l’hétérogénéité de l’efficacité des perturbations cellulaires et optimise l’identification des DEG, augmentant ainsi la puissance statistique.
  3. Conservation et spécificité des caractéristiques des voies de signalisation : Les chercheurs ont identifié des programmes de perturbation conservés dans différentes lignées cellulaires et voies de signalisation, et ont validé la valeur de ces caractéristiques dans divers contextes biologiques.
  4. Perspectives d’application : Cette étude fournit de nouveaux outils pour comprendre l’activation des voies de signalisation dans les maladies, en particulier dans le contexte de la COVID-19 et de la maladie de Crohn, démontrant son potentiel d’application étendu.

Autres informations utiles

Les chercheurs soulignent également que les recherches futures pourraient appliquer ce cadre à d’autres processus biologiques et types de cellules, et intégrer des données multimodales telles que l’accessibilité de la chromatine et les niveaux de protéines, afin d’enrichir davantage la compréhension des mécanismes de transduction du signal. De plus, l’application de technologies de perturbation combinatoire offrira de nouvelles perspectives pour explorer les interactions entre les régulateurs au sein et entre les voies.

Cet article, grâce à sa conception expérimentale innovante et ses méthodes de calcul, fournit des outils et des insights importants pour le domaine de la génomique fonctionnelle, démontrant le potentiel de la technologie Perturb-seq pour comprendre les systèmes biologiques complexes.