Développement d'une méthode de phylostratigraphie : nouvelle approche pour prédire l’âge des gènes
Stage · Stage M2 · 6 mois Bac+5 / Master I2BC (Institut de Biologie Intégrative de la Cellule) - Univ Paris-Saclay / CEA / CNRS · Gif-sur-Yvette (France)
Mots-Clés
génomique, algorithmique, évolution, émergence de nouveaux gènes, adaptation, biodiversité
Description
Contexte : Décrypter les bases moléculaires de l’évolution est essentiel pour comprendre comment les espèces s’adaptent aux changements environnementaux et finalement, les origines de la biodiversité. Les approches de génomiques offrent des méthodes très précieuses pour élucider les évènements évolutifs ayant conduit aux génomes actuels. Notamment, la phylostratigraphie permet d’estimer l’âge d’un gène en datant son apparition dans la phylogénie à partir de méthodes de génomique comparée. Cette approche encore très peu exploitée offre de nombreuses applications. En effet, avec l’accumulation de génomes complètement séquencés d’espèces colonisant des niches écologiques très variées, incluant des environnements extrêmes, la phylostratigraphie s’avère un outil de choix pour identifier les gènes apparus récemment spécifiques d’un sous-ensemble d’espèces. Notamment, elle permet d’identifier les gènes ayant émergé de novo d’une région initialement non-codante et qui peuvent jouer un rôle dans l'adaptation, la réponse au stress, des processus cognitifs ou cancers - domaine de la biologie aujourd’hui en plein essor (Roginski et al. 2024; Van Oss & Carvunis 2019). Enfin, en datant l’ensemble des gènes d’un génome, elle permet d’étudier l’évolution de certaines propriétés géniques ou protéiques et de les relier à l’apparition de phénotypes d’intérêt.
Objectifs : A ce jour, seul le programme GenEra permet de réaliser la phylostratigraphie d’un génome complet, mais ce dernier est très coûteux en temps de calcul et en mémoire et se trouve limité à de tout petits génomes (Barrera-Redondo et al. 2023). Au laboratoire, nous avons développé un prototype près de 1000 fois plus rapide permettant de traiter plusieurs génomes en parallèle quelle que soit leur taille. Dans ce projet, le/la candidat(e), en s’appuyant sur notre prototype, mettra en place une nouvelle approche de phylostratigraphie et l’appliquera à 22 génomes caractérisés par des vitesses et modes d’évolution très variés, vivant dans des environnements très différents (hôtes, pathogènes…) et pour lesquels nous avons déjà caractérisé un grand nombre de descripteurs. Ce travail nous permettra (i) de mieux comprendre l’évolution de certaines propriétés génomiques, protéiques et phénotypiques à travers une approche intégrative (intégrant données génomiques, OMIQUES, évolutives ou structurales) et (ii) de fournir un programme unique à la communauté scientifique ouvrant la voie à de nouvelles applications pour l’exploration à grande échelle de l’évolution et l’adaptation de plusieurs dizaines de génomes.
Environnement : Le stage se déroulera au sein de l'Institut de Biologie Intégrative de la Cellule (I2BC). Notre équipe réunit des compétences de bioinformatique très variées et complémentaires, ainsi qu'un grand nombre de jeunes chercheurs (doctorants, ingénieurs) offrant un environnement idéal et dynamique pour les chercheuses/chercheurs en herbe. Nous sommes dotés d’une grosse puissance de calcul (plusieurs centaines de CPUs et plusieurs GPUs, dont deux propres à notre équipe permettant la réalisation de calculs à très grande échelle). Nous sommes localisés dans les nouveaux bâtiments de l’I2BC, situés au sud de Paris, dans le campus verdoyant et historique du CNRS. Le projet bénéficiera de la vaste gamme d'expertises et de techniques déjà disponibles à l'I2BC, ainsi que du solide réseau de collaborations que nous avons développé avec des expérimentateurs experts en transcriptomique, Ribosome Profiling et spectrométrie de masse.
Pour plus d'information sur les travaux de l'équipe :
http://bim.i2bc.paris-saclay.fr/anne-lopes/
Compétences techniques requises : programmation, algorithmique, statistiques. Des compétences en génomique, intelligence artificielle sont les bienvenues mais pas obligatoires.
Références bibliographiques :
Barrera-Redondo J, Lotharukpong JS, Drost H-G, Coelho SM. 2023. Uncovering gene-family founder events during major evolutionary transitions in animals, plants and fungi using GenEra. Genome Biol. 24:54. doi: 10.1186/s13059-023-02895-z.
Roginski P, Grandchamp A, Quignot C, Lopes A. 2024. De Novo Emerged Gene Search in Eukaryotes with DENSE. Genome Biol. Evol. 16:evae159. doi: 10.1093/gbe/evae159.
Van Oss SB, Carvunis A-R. 2019. De novo gene birth. PLOS Genet. 15:e1008160. doi: 10.1371/journal.pgen.1008160.
Candidature
Procédure : envoyer un mail avec CV et LM à anne.lopes@i2bc.paris-saclay.fr
Date limite : None
Contacts
Anne Lopes
anNOSPAMne.lopes@i2bc.paris-saclay.fr
Offre publiée le 23 octobre 2024, affichage jusqu'au 22 décembre 2024