gènes de novo et nouvelles microprotéines chez les virus et archées à partir de régions non-codantes

 Stage · Stage M2  · 6 mois    Bac+5 / Master   I2BC (Institut de Biologie Intégrative de la Cellule) - Univ Paris-Saclay / CEA / CNRS · Gif-sur-Yvette (France)

Mots-Clés

génome non-codant, gènes de novo, virus, archées, adaptation, biodiversité, génomique

Description

Contexte : Les approches OMIQUES et de génomique ont révélé un rôle essentiel du génome non-codant dans l'émergence de gènes de novo (i.e., gènes ayant émergé depuis une région initialement non-codante) et de leurs produits associés (microprotéines de novo) [1-4]. Notamment, de nombreux exemples ont été et continuent d'être rapportés chez des organismes très différents tels que S. cerevisiae, C. elegans, D. melanogaster, M. musculus, H. sapiens par exemple et plus récemment chez certaines bactéries. Ces découvertes ont mis en lumière l’impact de ces gènes de novo dans l'adaptation des espèces, la réponse au stress, ou certains processus cognitifs, révélant finalement un nouveau rôle des régions non-codantes dans l’évolution et l’adaptation des espèces. Ces résultats ont motivé le développement de nombreux programmes de recherche pour comprendre à la fois, (i) l’étendue et la diversité du répertoire microprotéique résultant de l’expression des régions non-codantes et (ii), son rôle dans l’évolution et l’adaptation des espèces. Si de considérables avancées ont été réalisées chez les eucaryotes et bactéries, les virus et archées demeurent à ce jour très peu explorés. Pourtant ces derniers sont caractérisés par de nombreux gènes d’origine inconnue pouvant avoir un rôle dans l’échappement immunitaire ou l’adaptation à l’hôte pour les virus, ou contribuer, pour les archées, à l’adaptation et la colonisation de nouvelles niches écologiques, incluant des environnements extrêmes.

 

Objectifs : Au laboratoire, nous avons développé une suite de programmes visant à identifier les gènes de novo et caractériser diverses propriétés des smORFs (small ORFs) et de leurs microprotéines associées, telles que leur expression, leurs propriétés de séquences, profils évolutifs, ou propriétés structurales [1, 2, 5, 6].

Dans ce projet, on se propose d’investiguer la contribution des régions non-codantes (cadres alternatifs de lecture et régions intergéniques pour les archées) dans l’émergence de nouveaux gènes chez les virus et les archées. Nous emploierons des approches de génomique à grande échelle pour investiguer deux bases de données inédites de virus et d’archées annotés et dont la phylogénie a été établie. Ces travaux amélioreront notre compréhension de l’émergence de nouvelles ORFs chez les virus et archées, phénomène encore jusque-là largement sous-exploré chez ces derniers, donnant ainsi un éclairage inédit sur leur évolution et plus généralement sur le rôle cadres alternatifs de lecture dans l’émergence de nouveaux gènes. Ce stage sera réalisé en étroite collaboration avec Violette Da Cunha (Univ. Evry) et Patrick Forterre (I. Pasteur et I2BC).

 

Environnement : Le stage se déroulera au sein de l’Équipe de Bioinformatique Moléculaire dirigée par Olivier Lespinet à l'Institut de Biologie Intégrative de la Cellule (I2BC). Notre équipe réunit des compétences de bioinformatique très variées et complémentaires, ainsi qu'un grand nombre de jeunes chercheurs (doctorants, ingénieurs) offrant un environnement idéal et dynamique pour les chercheuses/chercheurs en herbe. Nous sommes dotés d’une grosse puissance de calcul (plusieurs centaines de CPUs et plusieurs GPUs, dont deux propres à notre équipe permettant la réalisation de calculs à très grande échelle). Nous sommes localisés dans les nouveaux bâtiments de l’I2BC, situés au sud de Paris, dans le campus verdoyant et historique du CNRS. Le projet bénéficiera de la vaste gamme d'expertises et de techniques déjà disponibles à l'I2BC, ainsi que du solide réseau de collaborations que nous avons développé avec des expérimentateurs experts en transcriptomique, Ribosome Profiling et spectrométrie de masse.

 

Compétences techniques requises : programmation (obligatoire). Des compétences en OMIQUES, génomique, statistiques, intelligence artificielle sont les bienvenues.

Pour en savoir plus sur les travaux de l'équipe :

http://bim.i2bc.paris-saclay.fr/anne-lopes/

Références bibliographiques :

[1] Papadopoulos C, Arbes H, Cornu D, Chevrollier N, Blanchet S, Roginski P, Rabier C, Atia S, Lespinet O, Namy O, Lopes A. The Ribosome Profiling landscape of yeast reveals a high diversity in pervasive translation. Genome Biology, 2024, 25, 268

[2] Papadopoulos C, Callebaut I, Gelly JC, Hatin I, Namy O, Renard M, Lespinet O, Lopes A. Intergenic ORFs as Elementary Structural Modules of de Novo Gene Birth and Protein Evolution. Genome Res 2021, 2303–2315.

[3] Patraquim P, Magny EG, Pueyo JI, Platero AI, Couso JP. Translation and natural selection of micropeptides from long non-canonical RNAs. Nature Communications. 2022; 13:6515.

[4] Wacholder A, Parikh SB, Coelho NC, Acar O, Houghton C, Chou L, et al. A vast evolutionarily transient translatome contributes to phenotype and fitness. Cell Systems. 2023; 14:363-381.e8.

[5] Roginski P, Granchamp A, Quignot C, Lopes A. De Novo Emerged Gene Search in Eukaryotes with DENSE. Genome Biology and Evolution, 2024, 16, 8, evae159

[6] Papadopoulos C, Chevrollier N, Lopes A. Exploring the Peptide Potential of Genomes. In: Simonson T, editor. Computational Peptide Science Methods in Molecular Biology. New York, NY: Springer US; 2022. p. 63–82.

 

 

Candidature

Procédure : Envoyer un mail avec CV et LM à anne.lopes@i2bc.paris-saclay.fr

Date limite : None

Contacts

Anne Lopes

 anNOSPAMne.lopes@i2bc.paris-saclay.fr

Offre publiée le 23 octobre 2024, affichage jusqu'au 22 décembre 2024