Annotation et étude des éléments viraux endogènes chez les plantes

 Stage · Stage M2  · 6 mois    Bac+5 / Master   URGI · Versailles (France)

 Date de prise de poste : 15 janvier 2024

Mots-Clés

Génomique, Plantes, Virus, Paléovirologie, Biologie de l'évolution

Description

Contexte

Les éléments viraux endogènes (EVE) résultent de l'intégration de tout ou partie de génomes viraux dans le génome d’hôtes eucaryotes ou procaryotes. Les EVE peuvent être considérés comme des fossiles moléculaires et donnent accès à des séquences virales anciennes qui peuvent être utilisées dans des approches de paléovirologie pour reconstruire l'histoire évolutive de virus, voire de genres viraux ou de familles virales [1].

Chez les plantes, la plupart des EVE caractérisées appartiennent à la famille des Caulimoviridae, la seule famille de virus végétaux rétrotranscrits [2]. Le génome de ces virus ne comporte pas de gène codant pour une intégrase et l’intégration du génome viral n’est pas une étape obligatoire de son cycle de réplication. Pourtant, les EVE de Caulimoviridae (appelés ECV) sont très répandus dans les génomes de plantes [3]

Les travaux de l’équipe encadrante ont permis d’identifier la présence d’ECV dans de nombreux génomes végétaux [4]. Ils ont révélé l’étendue de la diversité moléculaire des virus de la famille Caulimoviridae et l’existence de plusieurs genres viraux qui étaient inconnus et sont probablement fossiles. Ils ont également permis d’élargir considérablement la gamme d’hôtes connus des virus de cette famille qui apparaît s’étendre à l’ensemble des plantes vasulaires [5]. La population d’ECV dans les génomes de plantes comporte des séquences anciennes, dégénérées et non fonctionnelles, mais aussi des intégrations beaucoup plus récentes parfois capables de produire des formes virales infectieuses.

 

Objectifs

Nous savons aujourd’hui que les ECV sont présents dans la plupart des génomes de plantes et souvent en quantité importante. Ils demeurent cependant non-répertoriés dans la majorité des génomes de plantes publiés et sont ainsi ignorés ou confondus avec d’autres séquences répétées dans le cadre d’analyses génomiques, épigénétiques ou transcriptomiques. En conséquence, notre vision de l’abondance des ECV dans les génomes, leur distribution chromosomique et leur impact sur leurs hôtes demeure très partielle. Par ailleurs, les ECV sont encore peu exploités pour étudier la dynamique endogène des Caulimoviridae et reconstruire leur histoire évolutive. Pour pallier ce problème, nous avons récemment développé un outil bioinformatique, appelé Caulifinder, permettant la detection et l’annotation automatique in silico des ECV dans les génomes de plantes [3]. Grâce à cet outil, l’accès à l’ensemble de la diversité des ECV est facilité et des études comparatives à grande échelle peuvent être réalisées.

Le sujet de stage proposé se focalisera sur l’annotation, l’étude de la distribution et l’exploitation des ECV présents dans les génomes des plantes à fleurs (angiospermes). Il portera les objectifs suivants :

  • Consolider une banque interne de génomes de plantes en effectuant un travail bibliographique afin d’y inclure une grande diversité d’angiospermes et de bénéficier des dernières versions d’assemblages
  • Générer une banque de séquences d’ECV pour chaque génome de plante et produire une annotation génomique de ces éléments
  • Construire les jeux de données pour chaque espèce de plante de la banque, associés à leurs métadonnées, afin de rendre accessible et publique cette banque de données (la partie web sera assurée par la plateforme de l’unité)
  • Quantifier les ECV par génome et par genre viral et caractériser leur distribution génomique
  • Analyser l’impact potentiel des ECV sur les séquences régulatrices de gènes de plantes
  • Rechercher dans les annotations produites des ECV pouvant potentiellement donner naissance à des formes actives et effectuer une analyse transcriptomique croisée

Le ou la stagiaire acquerra des connaissances en biologie de l’évolution et des compétences en annotation des génomes de plantes par l’utilisation d’un pipeline d’analyse utilisant l’outil Caulifinder. Le travail sera réalisé dans un environnement virtuel (VM ou cluster) en utilisant des commandes UNIX (shell).

 

Environnement

Localisée à Versailles, l’Unité de Recherche en Génomique-Info (URGI) est rattachée au département Biologie et Amélioration des Plantes (BAP) de INRAE. L'URGI est une unité de recherche en bioinformatique qui développe des outils et des connaissances sur la structure, le fonctionnement et l'évolution des génomes des plantes. Elle héberge également la plateforme de bio-informatique des plantes PlantBioinfoPF et est membre de l’Institut Français de Bioinformatique (IFB).

 

Profil souhaité

Etudiant(e) en M2 ou école d’ingénieur, curieux et autonome. Bon niveau en programmation et en langage Python. Connaissance de l’environnement Linux. Une double compétence en biologie et bioinformatique serait un plus.

 

Références

1.            Aiewsakun, P.; Katzourakis, A. Endogenous viruses: Connecting recent and ancient viral evolution. Virology 2015, 479-480, 26-37, doi:10.1016/j.virol.2015.02.011.

2.            Vassilieff, H.; Geering, A.D.W.; Choisne, N.; Teycheney, P.Y.; Maumus, F. Endogenous Caulimovirids: Fossils, Zombies, and Living in Plant Genomes. Biomolecules 2023, 13, doi:10.3390/biom13071069.

3.            Vassilieff, H.; Haddad, S.; Jamilloux, V.; Choisne, N.; Sharma, V.; Giraud, D.; Wan, M.; Serfraz, S.; Geering, A.D.W.; Teycheney, P.Y.; et al. CAULIFINDER: a pipeline for the automated detection and annotation of caulimovirid endogenous viral elements in plant genomes. Mob DNA 2022, 13, 31, doi:10.1186/s13100-022-00288-w.

4.            Geering, A.D.; Maumus, F.; Copetti, D.; Choisne, N.; Zwickl, D.J.; Zytnicki, M.; McTaggart, A.R.; Scalabrin, S.; Vezzulli, S.; Wing, R.A.; et al. Endogenous florendoviruses are major components of plant genomes and hallmarks of virus evolution. Nat Commun 2014, 5, 5269, doi:10.1038/ncomms6269.

5.            Diop, S.I.; Geering, A.D.W.; Alfama-Depauw, F.; Loaec, M.; Teycheney, P.Y.; Maumus, F. Tracheophyte genomes keep track of the deep evolution of the Caulimoviridae. Sci Rep 2018, 8, 572, doi:10.1038/s41598-017-16399-x.

Candidature

Procédure : Adresser un CV et une lettre de motivation à Florian Maumus (florian.maumus@inrae.fr)

Date limite : 30 novembre 2023

Contacts

Florian Maumus

 fmNOSPAMaumus@gmail.com

Offre publiée le 14 septembre 2023, affichage jusqu'au 30 novembre 2023