Annotation et étude des séquences virales endogènes chez les plantes
Stage · Stage M2 · 6 mois Bac+5 / Master INRAE · Versailles (France)
Date de prise de poste : 3 février 2025
Mots-Clés
Génomique, Annotation, Plantes, Virus, Biologie de l'évolution
Description
Contexte
Les séquences virales endogènes (EVE) résultent de l'intégration de tout ou partie de génomes viraux dans le génome d’hôtes eucaryotes ou procaryotes. Les EVE peuvent être considérés comme des fossiles moléculaires et donnent accès à des séquences virales anciennes ou inconnues qui peuvent être utilisées dans des approches de paléovirologie pour reconstruire l'histoire évolutive de virus [1]. Les EVE peuvent aussi avoir un impact sur la biologie de leur hôte en modifiant l’expression de certains de leurs gènes par l’apport de séquences régulatrices de la transcription et/ou en apportant de nouvelles fonctions cellulaires via la domestication de gènes viraux (REF ERV). Chez les vertébrés, les EVE de la famille Retroviridae (ERV), qui constituent 8% du génome humain, sont à l’origine d’innovations biologiques ayant conduit à des transitions évolutives majeures [2].
Chez les plantes, la plupart des EVE caractérisées appartiennent à la famille Caulimoviridae, qui est la seule famille de virus de plantes rétrotranscrits [3]. Le génome de ces virus ne comporte pas de gène codant pour une intégrase et l’intégration du génome viral n’est pas une étape obligatoire de son cycle de réplication. Pourtant, les EVE de Caulimoviridae (appelés ECV) sont très répandues dans les génomes de plantes [4].
Les travaux de l’équipe encadrante ont permis d’identifier la présence d’ECV dans de nombreux génomes végétaux [5]. Ils ont révélé l’étendue de la diversité moléculaire des virus de la famille Caulimoviridae et l’existence de plusieurs genres viraux qui étaient inconnus et sont probablement fossiles. Ils ont également permis d’élargir considérablement la gamme d’hôtes connus des virus de cette famille, qui apparaît s’étendre à l’ensemble des plantes vasulaires [6]. La population d’ECV dans les génomes de plantes comporte des séquences anciennes, dégénérées et non fonctionnelles, mais aussi des séquences capables de produire des formes virales infectieuses, qui résultent vraisemblablement d’évènements d’intégrations beaucoup plus récents.
Nous savons aujourd’hui que les ECV sont présents dans la plupart des génomes de plantes et souvent sous forme de séquences répétées en quantité importante. Ils demeurent cependant non-répertoriés dans la majorité des génomes de plantes publiés et sont ainsi ignorés ou confondus avec d’autres séquences répétées lors d’analyses génomiques, épigénétiques ou transcriptomiques. En conséquence, notre vision de l’abondance des ECV dans les génomes de plantes, de leur distribution chromosomique et de leur impact sur leurs hôtes demeure très partielle. Par ailleurs, les ECV sont encore peu exploités pour étudier la dynamique endogène des Caulimoviridae et reconstruire leur histoire évolutive. Pour pallier ce problème, nous avons récemment développé un outil bioinformatique, appelé Caulifinder, permettant la detection et l’annotation automatique in silico des ECV dans les génomes de plantes [4]. Grâce à cet outil, l’accès à l’ensemble de la diversité des ECV est facilité et des études comparatives à grande échelle peuvent être réalisées.
Objectifs
Le sujet de stage proposé se focalisera sur l’annotation, l’étude de la distribution et l’exploitation des ECV présents dans les génomes des plantes à fleurs (angiospermes). Il aura pour objectifs de :
- Enrichir une banque interne de génomes de plantes en effectuant un travail bibliographique afin d’y inclure une grande diversité d’angiospermes et de bénéficier des dernières versions d’assemblage de ces génomes
- Générer une banque de séquences d’ECV pour chaque génome de plante et produire une annotation génomique de ces éléments
- Quantifier les ECV par génome et par genre viral et caractériser leur distribution génomique
- Analyser l’impact potentiel des ECV sur les séquences régulatrices de gènes de plantes
- Rechercher, dans les annotations produites, des ECV pouvant potentiellement donner naissance à des formes infectieuses et effectuer une analyse transcriptomique croisée
Le ou la stagiaire acquerra des connaissances en biologie de l’évolution et des compétences en annotation des génomes de plantes par l’utilisation d’un pipeline d’analyse utilisant l’outil Caulifinder. Le travail sera réalisé dans un environnement virtuel (VM ou cluster) en utilisant des commandes UNIX (shell).
Environnement
Localisée à Versailles, l’équipe AGIPP s’intéresse à l’étude de l’évolution des génomes et des interactions plantes-parasites. Cette équipe a récemment rejoint l’Institut Jean-Pierre Bourgin (IJPB). Elle est rattachée au département de Biologie et Amélioration des Plantes (BAP) de INRAE et composante du pôle « Génome » de l’IJPB.
Profil souhaité
Etudiant(e) en M2 ou école d’ingénieur, curieux(-se) et autonome. Bon niveau en programmation et en langage Python. Connaissance de l’environnement Linux. Une double compétence en biologie et bioinformatique serait un avantage.
Durée
6 mois (début souhaité à partir de février 2025).
Références
1. Aiewsakun, P.; Katzourakis, A. Endogenous viruses: Connecting recent and ancient viral evolution. Virology 2015, 479-480, 26-37, doi:10.1016/j.virol.2015.02.011.
2. Johnson, W.E. Origins and evolutionary consequences of ancient endogenous retroviruses. Nat Rev Microbiol 2019, 17, 355-370, doi:10.1038/s41579-019-0189-2.
3. Vassilieff, H.; Geering, A.D.W.; Choisne, N.; Teycheney, P.Y.; Maumus, F. Endogenous Caulimovirids: Fossils, Zombies, and Living in Plant Genomes. Biomolecules 2023, 13, doi:10.3390/biom13071069.
4. Vassilieff, H.; Haddad, S.; Jamilloux, V.; Choisne, N.; Sharma, V.; Giraud, D.; Wan, M.; Serfraz, S.; Geering, A.D.W.; Teycheney, P.Y.; et al. CAULIFINDER: a pipeline for the automated detection and annotation of caulimovirid endogenous viral elements in plant genomes. Mob DNA 2022, 13, 31, doi:10.1186/s13100-022-00288-w.
5. Geering, A.D.; Maumus, F.; Copetti, D.; Choisne, N.; Zwickl, D.J.; Zytnicki, M.; McTaggart, A.R.; Scalabrin, S.; Vezzulli, S.; Wing, R.A.; et al. Endogenous florendoviruses are major components of plant genomes and hallmarks of virus evolution. Nat Commun 2014, 5, 5269, doi:10.1038/ncomms6269.
6. Diop, S.I.; Geering, A.D.W.; Alfama-Depauw, F.; Loaec, M.; Teycheney, P.Y.; Maumus, F. Tracheophyte genomes keep track of the deep evolution of the Caulimoviridae. Sci Rep 2018, 8, 572, doi:10.1038/s41598-017-16399-x.
Candidature
Procédure : Adresser un CV et une lettre de motivation à Florian Maumus (florian.maumus@inrae.fr)
Date limite : 31 décembre 2024
Contacts
Florian Maumus
flNOSPAMorian.maumus@inrae.fr
Offre publiée le 4 novembre 2024, affichage jusqu'au 31 décembre 2024