Thèse CIRAD-INRAE Etude de la macroévolution des Caulimoviridae

 CDD · Thèse  · 36 mois    Bac+5 / Master   Unité de Recherche en Génomique Info · Versailles (France)

 Date de prise de poste : 6 septembre 2021

Mots-Clés

virus endogènes biologie évolutive génomique

Description

Les séquences virales endogènes (EVE) résultent de l’intégration active (par une enzyme virale appelée intégrase) ou passive (par recombinaison non homologue) de tout ou partie de génomes viraux dans le génome d’hôtes eucaryotes ou procaryotes. Les EVE sont donc des séquences virales fossiles parfois vieilles de dizaines de millions d'années. Tout comme les fossiles utilisés en paléontologie pour étudier l'évolution des organismes vivants, les EVE peuvent être utilisées en paléovirologie [1] pour étudier les processus évolutifs des virus sur des échelles de temps pouvant atteindre plusieurs millions d'années.

Chez les végétaux, la plupart des EVE connus appartiennent à la famille Caulimoviridae [2], la seule famille de virus de plantes rétrotranscrits [3]. Les virus de cette famille possèdent un génome ADN double brin monopartite dont le cycle de réplication ne nécessite pas son intégration dans le génome de leur hôte. Pourtant, de très nombreux génomes de plantes contiennent des EVE Caulimoviridae, dont on pense qu'ils se sont intégrés par recombinaison non homologue à la faveur de réparations de cassures dans l'ADN chromosomique de cellules germinales de plantes hôtes infectées ou via des interactions entre des génomes viraux et des éléments transposables [4]. L'URGI, le CIRAD et l'Université du Queensland ont identifié des EVE Caulimoviridae dans des dizaines de génomes végétaux [5, 6].

L'URGI a ensuite développé un pipeline pour l'annotation automatique des EVE Caulimoviridae dans les génomes végétaux. Ce pipeline, appelé Caulifinder, a le potentiel d'améliorer significativement la recherche et la caractérisation des EVE Caulimoviridae, en éliminant les étapes de curation manuelle sur lesquelles repose actuellement la caractérisation de ces EVE qui, parce qu’elles sont très chronophage, freinent la découverte de nouvelles EVE. Étant donné que les EVE Caulimoviridae sont beaucoup plus répandues que les EVE Geminiviridae dans les génomes végétaux, l’accès à l’ensemble de la diversité des EVE Caulimoviridae grâce à Caulifinder permettra un changement d’échelle dans la conduite des études d’évolution virale destinées à alimenter les modèles prédictifs d'émergence virale.

Le/la doctorant(e) procèdera au recueil de l’ensemble des données de génomique végétale utilisables par Caulifinder (génomes de plantes séquencés, données de transcriptomique). Il/elle utilisera un assemblage de génomes comme entrée pour produire un ensemble de gènes marqueurs non redondants, les incorporera dans une bibliothèque de référence et utilisera cette dernière pour établir les relations phylogénétiques existant entre ces séquences. Il/elle construira des séquences consensus représentatives des séquences répétées liées aux Caulimoviridae (génomes partiels et complets), reconstruira leurs ORF, annotera les domaines protéiques et les positions de tous les EVE Caulimoviridae dans un génome végétal donné, et construira des réseaux de séquences consensus basés sur la similarité.

En interaction avec d’autres équipes, il/elle reconstruira l’histoire évolutive des Caulimoviridae en utilisant l’ensemble des génomes Caulimoviridae disponibles (ceux reconstruits à partir d’EVE et ceux d’espèces virales contemporaines connues sous forme épisomale). Pour cela, le/la doctorant(e) mettra en œuvre des approches d’évolution structurelle, d’analyse phylogénétique et les combinera à des données de distribution géographique des hôtes afin de proposer des scénarios d’évolution des Caulimoviridae.

Ce projet de thèse sera effectué sur le site INRAE de Versailles dans l’unité de Recherche en Génomique-Info (URGI). Il sera co-encadré par Florian Maumus (URGI-INRAE) et Pierre-Yves Teycheney (UMR PVBMT-CIRAD). La bourse de thèse est co-financée par INRAE et CIRAD. 

[1] Patel MR, Emerman M, Malik HS (2011) Paleovirology - ghosts and gifts of viruses past. Curr Opin Virol. 1(4):304-9.

[2] Teycheney P.-Y., Geering ADW, Dasgupta I, Hull R, Kreuze JF, Lockhart B, Muller E, Olszewski N, Pappu N, Pooggin M, Richert-Pöggeler K, Schoelz JE, Seal S, Stavolone L, Umber M (2020). ICTV Virus Taxonomy Profile: Caulimoviridae. Journal of General Virology https://doi.org/10.1099/jgv.0.001497

[3] Krupovic M, Blomberg J, Coffin JM, Dasgupta I, Fan H, Geering AD, Gifford R, Harrach B, Hull R, Johnson W, Kreuze JF, Lindemann D, Llorens C, Lockhart B, Mayer J, Muller E, Olszewski N, Pappu HR, Pooggin M, Richert-Pöggeler KR, Sabanadzovic S, Sanfaçon H, Schoelz JE, Seal S, Stavolone L, Stoye JP, Teycheney P.-Y., Tristem M, Koonin EV, Kuhn JH (2018) Ortervirales: new virus order unifying five families of reverse-transcribing viruses. J Virol 92:e00515-18

[4] Teycheney P.-Y., Geering AD: Endogenous viral sequences in plant genomes. In: Recent advances in plant virology. Edited by Caranta Carole AMATML-MJJ. Norfolk, Royaume-Uni: Caister Academic Press; 2011: 343-362.

[5] Geering A.D.W., Maumus F., Copetti D., Choisne N., Zwicki D., Zytnicki M., McTaggart A.R, Scalabrin S., Vezzulli S., Wing R.A., Quesneville H., Teycheney P.-Y. (2014). Endogenous florendoviral elements are major components of plant genomes and molecular fossils of reverse-transcribing viruses with unique and variable genome organizations. Nature Communications 5: 5269

[6] Diop S, Geering ADW, Alfama-Depauw F, Loarec M, Teycheney P.-Y., Maumus F (2018) Tracheophyte genomes keep track of the deep evolution of the Caulimoviridae. Scientific Reports 8, 572.

Candidature

Procédure : Envoyer cv et lettre de motivation à florian.maumus@inrae.fr

Date limite : 25 juin 2021

Contacts

Florian Maumus

 flNOSPAMorian.maumus@inrae.fr

Offre publiée le 15 avril 2021, affichage jusqu'au 30 juillet 2021