Stage M2 - Apprentissage de modèles Booléens de l’initiation de la dystrophie musculaire de Duchenne

 Stage · Stage M2  · 6 mois    Bac+5 / Master   LS2N - Laboratoire de Sciences du Numérique de Nantes · Nantes (France)

Mots-Clés

Biologie de Systèmes, single cell RNA-Seq, modèles booléens, programmation logique

Description

Titre du stage : Apprentissage de modèles Booléens de l’initiation de la dystrophie musculaire de Duchenne lors de la différenciation de cellules souches pluripotentes humaines

Équipes d’accueil :

  • LS2N Laboratoire des Sciences du Numérique de Nantes. Équipe COMBI - Combinatoire et Bioinformatique. Nantes Université. Contact : Carito Guziolowski carito.guziolowski@ls2n.fr

  • TaRGeT Translational Gene Therapy. Equipe ATIP Avenir – Next Generation Disease Models. Nantes Université, INSERM. Contact : Jean-Baptiste Dupont jean-baptiste.dupont@univ-nantes.fr

Lieu du stage : LS2N, Nantes

Contexte Biologique

La dystrophie musculaire de Duchenne (DMD) est une maladie neuromusculaire touchant environ 1 garçon sur 4000 et qui entraîne une perte progressive des fonctions motrices, respiratoires et cardiaques. Les patients décèdent entre 30 et 40 ans des suites de la maladie, et aucun traitement curatif n’est disponible pour la majorité des patients. La DMD se caractérise par des mécanismes complexes, et les cellules musculaires affectées souffrent de multiples perturbations à l’échelle cellulaire et moléculaire, qui s’auto-entretiennent et s’auto-aggravent. Il est donc extrêmement difficile de déterminer la séquence d’événements conduisant à la dégénérescence cellulaire, à un contexte inflammatoire soutenu et au remplacement du tissus musculaire par du tissus fibreux et adipeux. De même, les phases d’initiation de la maladie restent peu décrites, car les modèles animaux de la maladie ne permettent pas la mise en évidence de dérégulations subtiles et, dans certains cas, propres à l’espèce humaine. Dans ce contexte, nous utilisons des cellules souches pluripotentes induites (iPS) possédant une mutation dans le gène DMD impliqué dans la pathologie, et nous étudions les phases successives de leur différenciation en cellules musculaires par différentes techniques. En particulier, nous avons récemment déterminé la trajectoire développementale de ces cellules après single-cell RNA-Seq, et nous avons montré que la mutation DMD entraîne une bifurcation des cellules malades sur une branche alternative de la trajectoire, différente de celle suivie par les cellules contrôles. Ainsi la différenciation myogénique aboutit à des destins cellulaires différents en fonction du contexte génétique (contrôle ou muté), à partir d’un « point de décision » atteint (pour la DMD) entre 7 à 10 jours de différenciation.

 

Intégration des réseaux de régulation des gènes et de signalisation et inférence de modèles Booléens

Nous avons récemment proposé SCIBORG, une méthode permettant l’inférence de réseaux Booléens à partir de données de single-cell RNA-Seq. Nous avons récemment appliqué SCIBORG pour étudier et comparer des populations de cellules issues de deux stades successifs du développement embryonnaire. Notre méthode est basée sur la sélection d’un ensemble de gènes dont le niveau d’expression : (i) maximise d’un coté la diversité de notre population de cellules et (ii) reflète une similitude d’expression entre les deux stades comparés [1,2]. A la différence d’autres méthodes qui infèrent des modèles grâce à des données single-cell [3-5], notre méthode (i) prend en compte l’hétérogénéité des profils d’expression en travaillant avec l’expression d’une trentaine de gènes sur une centaine des cellules différentes, (ii) explore l’espace de modèles compatibles avec les données pour proposer des solutions robustes et optimales, et (iii) prend en compte la redondance présente dans les données single-cell. Les résultats obtenus sont des réseaux Booléens qui connectent une vingtaine de gènes et leurs multiples prédécesseurs avec des portes logiques.

But du stage : sur la base des méthodes précédemment proposés, construire et analyser les modèles booléennes de l’initiation de la DMD à partir de la différenciation de cellules souches pluripotentes humaines.

 

Méthodologie du stage

L’équipe de biologistes a réalisé des analyses de single-cell sur des cellules souches pluripotentes humaines contrôles et mutées dans le gène DMD au cours de leur différenciation dirigée en cellules musculaires, en reproduisant les étapes successives du développement embryonnaire in vitro. Par ailleurs nous disposons d’une liste de gènes ou facteurs de transcription clés dans ce processus.

  1. La première étape du stage consistera à extraire les informations qui sont liées à ces listes de gènes dans la base de données PathwayCommons http://www.pathwaycommons.org/. Pour cela, l'outil pyBRAvo [6] développé par l’équipe de C Guziolowski sera utilisé pour effectuer des requêtes SPARQL (SPARQL Protocol and RDF Query Language) au sein de cette base de données et en extraire tous les pathways en amont de ces ensembles de gènes.

  2. La seconde étape fera l'objet d'une analyse topologique du graphe obtenu dans l’étape précédente, pour identifier une liste de gènes : entrée, intermédiaire, sortie. Cette classification des nœuds, nous permettra d’appliquer notre outil SCIBORG pour extraire un ensemble de cellules et un ensemble de gènes caractéristiques de l’état « Contrôle sain » et du stade « DMD ».

  3. La troisième étape, consistera à construire les modèles Booléens, à l’aide de l’outil caspo [7] en utilisant le graphe construit dans l’étape 1 et l’ensemble de données (cellules + gènes) extrait dans l’étape 2.

Ces modèles booléennes permettront d’obtenir un premier aperçu des différents mécanismes régulateurs mis en jeu de manière différentielle entre les cellules DMD et les cellules contrôles.

Compétences requises: Une bonne maîtrise en programmation est requise. Le ou la candidate peut présenter un profil bioinformatique ou informatique. Le ou la candidate devra faire preuve de rigueur et de curiosité.

Informations complémentaires: L’offre de stage s’adresse aux étudiants en Master 2 pour l'année 2024-25, pour une durée de 5 à 6 mois avec gratification en vigueur. Les dates de début et fin sont flexibles. L'abonnement au réseau de transport Naolib (mensuel ou annuel) peut être remboursé à 75% par l'employeur sur présentation des pièces justificatives.

Bibliographie

  1. Bolteau, M., Bourdon, J., David, L. & Guziolowski, C., Inferring Boolean Networks from Single-Cell Human Embryo Datasets en, in Bioinformatics Research and Applications (eds Guo, X., Mangul, S., Patterson, M. & Zelikovsky, A.) (Springer Nature, Singapore, 2023), 431–441, isbn: 9789819970742.

  2. Bolteau, M., Chebouba, L., David, L., Bourdon, J. & Guziolowski, C., Boolean Network Models of Human Preimplantation Development, Journal of Computational Biology, https://www.liebertpub.com/doi/abs/10.1089/cmb.2024.0517 (2024) (May 2024)

  3. Chevalier, S., Noël, V., Calzone, L., Zinovyev, A. & Paulevé, L., Synthesis and Simulation of Ensembles of Boolean Networks for Cell Fate Decision en, in Computational Methods in Systems Biology (eds Abate, A., Petrov, T. & Wolf, V.) (Springer International Publishing, Cham, 2020), 193–209, isbn: 9783030603274

  4. Dunn, S. J., Li, M. A., Carbognin, E., Smith, A. & Martello, G., A common molecular logic determines embryonic stem cell self-renewal and reprogramming, EMBO J 38 (Jan. 2019)

  5. Moignard, V., Woodhouse, S., Haghverdi, L., Lilly, A. J., Tanaka, Y., Wilkinson, A. C., Buettner, F., Macaulay, I. C., Jawaid, W., Diamanti, E., Nishikawa, S.-I., Piterman, N., Kouskoff, V., Theis, F. J., Fisher, J. & Göttgens, B., Decoding the regulatory network of early blood development from single-cell gene expression measurements, en, Nature Biotechnology 33, 269–276, issn: 1546-1696, https://www.nature.com/articles/nbt.3154 (2024) (Mar. 2015)

  6. Lefebvre, M., Gaignard, A., Folschette, M., Bourdon, J. & Guziolowski, C., Large-scale regulatory and signaling network assembly through linked open data, Database 2021 (2021)

  7. Videla, S., Saez-Rodriguez, J., Guziolowski, C., Siegel, A. & Wren, J., caspo: a toolbox for automated reasoning on the response of logical signaling networks families, Bioinformatics 33, 947–950, issn: 33/6/947/2585024 (2017)

Candidature

Procédure : Envoyé votre candidature à: carito.guziolowski@ls2n.fr et jean-baptiste.dupont@univ-nantes.fr Votre candidature doit contenir : (1) votre CV, (2) votre lettre de motivation exposant votre projet professionnel, et (3) votre relevé de notes de Bac +3 à Bac +5 ou équivalent

Date limite : None

Contacts

Carito Guziolowski

 caNOSPAMrito.guziolowski@ls2n.fr

 https://uncloud.univ-nantes.fr/index.php/s/BwrrwJjXRpFPCqH

Offre publiée le 30 août 2024, affichage jusqu'au 31 janvier 2025