Mots-Clés
transfert horizontal
virus
insectes
génomique comparative
évolution moléculaire
Description
[ENGLISH BELOW]
**Contribution des virus endogènes aux transferts horizontaux dans les communautés hôtes-parasitoïdes.
**
Mots Clé
Horizontal gene transfer, endogenous virus, insects, comparative genomics, molecular evolution
Résumé du projet de thèse
Les insectes parasitoïdes pondent leurs œufs dans le corps d’autres arthropodes, principalement insectes, et sont, à ce titre, les principaux régulateurs naturels des populations d’insectes. En effet, leur développement se termine par la mort de leurs hôtes dans la grande majorité des cas. Au sein de l’extraordinaire diversité de parasitoïdes retrouvés dans l’ordre des hyménoptères, on sait que 3 clades ont domestiqués des virus, permettant ainsi de protéger leur progéniture de la réponse immunitaire de leurs hôtes. Ce phénomène est rendu possible par le fait que ces virus « domestiqués » par la guêpe sont injectés dans l’hôte et permettent l’intégration de gènes de la guêpe dans l’hôte, manipulant ainsi sa physiologie depuis l’intérieur ! La littérature actuelle indique que ces segments de guêpes peuvent intégrer non seulement l’ADN des tissus somatiques mais aussi celui des tissus germinaux des hôtes attaqués, certains s’étant même fixés au sein de certaines espèces d’hôtes, malgré le fait que les hôtes parasités meurent habituellement. Cependant, le flux réel des gènes de guêpes qui sont passés au cours de l’évolution depuis les guêpes parasitoïdes vers leurs hôtes n’est pas connu. On ne sait pas non plus dans quelle mesure ils contribuent, ou ont contribué, à la fitness de ces espèces « receveuses ». Enfin, on ne sait pas non plus si d’autres cas de domestication de virus, au-delà des trois cas actuellement connus, se sont produits dans la grande diversité des parasitoïdes d’hyménoptères. Le projet de thèse vise à répondre à ces questions, en s’appuyant sur une analyse bioinformatique des 7125 assemblages de génomes d’insectes actuellement disponibles et incluant 437 Hyménoptères ayant un mode de vie parasitoïde.
Thématique
La thèse porte sur les transferts horizontaux (TH) de matériel génétique, autrement dit la transmission d’ADN entre organismes par des mécanismes autres que la reproduction1. Ce type de transfert a été bien étudié chez les procaryotes, chez lesquels les vecteurs et les mécanismes sous-jacents aux TH sont bien connus2. Chez les eucaryotes en revanche, les TH ont été relativement peu étudiés et de nombreuses questions persistent sur la manière dont ils se produisent, sur les mécanismes sous-jacents et sur les facteurs expliquant leur occurrence au cours de l’évolution. Le sujet proposé contribuera à répondre à ces questions en mesurant la contribution des virus domestiqués retrouvés chez les insectes aux transferts horizontaux entre insectes parasitoïdes et leurs hôtes potentiels.
Domaine
Cette thèse se situe dans le domaine de la biologie de l’évolution et plus spécifiquement dans ceux de la génomique évolutive et de l’évolution moléculaire. Elle repose sur des approches de bio-informatique et de génomique comparative (comparaison de génomes complets) et de génomique évolutive (identification de signaux de sélection dans les génomes).
Contexte
Il ne fait plus aucun doute que des éléments génétiques peuvent se déplacer entre différentes branches de l’arbre de la vie, parfois très éloignées les unes des autres. L’importance de ce phénomène est clairement reconnue depuis près d’un siècle chez les bactéries et les archées, à l’image des travaux pionniers de Griffith et de ses collègues3. Plus récemment, on a découvert que le transfert horizontal de gènes (HGT, pour « horizontal gene transfer ») pouvait également concerner les eucaryotes multicellulaires tels que les plantes ou les animaux4,5. Le transfert horizontal de gènes peut se produire entre les eucaryotes multicellulaires et les microbes (bactéries6, virus7, champignons8), mais aussi entre les eucaryotes multicellulaires, y compris les animaux9. Cependant, l’étendue réelle, la nature des éléments transférés horizontalement et les mécanismes moléculaires et écologiques impliqués restent pour la plupart inconnus.
Chez les insectes parasitoïdes, qui se développent à partir d’autres insectes (et qui finissent par les tuer en général), un mécanisme spécifique conduisant à la transmission horizontale de matériel génétique entre insectes éloignés a été récemment identifié. Ce mécanisme implique des virus dont le matériel génétique est entré dans les chromosomes des guêpes par un processus connu sous le nom d’« endogénisation ». Ces gènes d’origine virale ont été conservés par la sélection naturelle dans les populations de guêpes parasitoïdes, dans un processus connu sous le nom de « domestication » : ils permettent aux femelles de produire des structures de type viral (STV) qui sont injectées dans l’hôte et qui protègent la progéniture en développement de la réponse immunitaire de l’hôte. Ces éléments sont appelés « polyDNAvirus » (PDV), car ces STV contiennent des cercles d’ADN provenant de la guêpe qui s’intègrent finalement dans le génome de l’hôte (chenille)10. Ces systèmes sont donc par nature « hybrides » car les cercles d’ADN présents dans les particules sont vraisemblablement d’origine eucaryote (ils pré-existaient à l’acquisition du virus), tandis que la machinerie permettant la formation des virions dérive de gènes viraux. L’expression hétérologue de ces gènes de guêpes (codés dans les cercles) dans l’hôte permet alors de manipuler la physiologie de l’hôte de l’intérieur, inhibant ainsi le système immunitaire de l’hôte, et facilitant le développement de la progéniture de la guêpe11.
Au cours des dernières décennies, on a découvert que l’ADN de guêpe ne pénètre pas seulement dans les cellules somatiques de l’hôte lors d’une infestation par une guêpe parasite, mais qu’il peut parfois pénétrer dans l’ADN germinal des hôtes attaqués ; certains fragments de ces ADN de guêpe se sont même fixés chez certains hôtes, en dépit du fait que les hôtes parasités meurent généralement12-14. Ce résultat indique que les PDV peuvent servir d’autoroute pour les transferts horizontaux.
Cependant, on ne connaît pas le flux réel des gènes de guêpes transmis au cours de l’évolution depuis les guêpes parasitoïdes vers leurs hôtes. Nous ne savons pas non plus dans quelle mesure ils contribuent ou ont contribué au phénotype de ces espèces « réceptrices ». On ne sait pas non plus si d’autres cas de domestication de virus, en plus des trois actuellement connus, se sont produits dans la grande diversité des parasitoïdes hyménoptères.
Ces questions sont actuellement abordées en utilisant un échantillonnage limité aux espèces spécifiquement retrouvées dans un écosystème situé au Costa-Rica (Area de Conservation de Guanacaste) et impliquant 58 espèces parasitoïdes (provenant d’une seule superfamille d’hymenoptères) et leurs hôtes lépidoptères (n=132). Ce travail en cours nous permettra d’aborder les questions mentionnées ci-dessus, mais souffrira également de certaines limitations, en raison de la relative faible diversité échantillonnée dans ce jeu de données, à la fois du côté des parasitoïdes et des hôtes. L’idée du présent projet de thèse est d’utiliser un jeu de données beaucoup plus important, comprenant une diversité bien supérieure du côté des parasitoïdes et des hôtes potentiels, afin de gagner en puissance statistique pour étudier la contribution des virus domestiqués à l’HGT. En effet, dans ce projet, nous étendrons notre analyse à tous les génomes d’insectes disponibles dans les dépôts publics (n=6897), complétés par les génomes que nous avons générés dans le cadre du projet du Costa-Rica (n=228). Cet ensemble de données contiendra plus de 437 espèces d’hyménoptères parasitoïdes, toutes les espèces restantes étant des hôtes potentiels (n=6688).
Avec ce grand ensemble de données, la thèse abordera, en utilisant une approche bioinformatique, les questions suivantes :
a. Les guêpes parasitoïdes codant pour des PDVs (3 cas indépendants) sont-elles plus souvent engagées dans des transferts horizontaux avec leurs hôtes, comme attendu si les PDVs sont des acteurs importants du transfert ?
b. Quels sont les gènes transmis horizontalement (seulement ceux à l’intérieur des segments et lesquels, ou tout gène du génome et lesquels) ? Existe-t-il un signal de convergence dans la catégorie des gènes transmis aux hôtes pour les trois clades de guêpes codant pour des PDV ? Quel est le destin évolutif des gènes acquis horizontalement chez les nouveaux hôtes ?
c. À partir du patron de transferts horizontaux global, pouvons-nous identifier de nouveaux clades d’hyménoptères parasitoïdes qui codent des machineries virales semblables aux PDV ?
Méthode
Axe 1 - Quantifier la contribution des PDV aux HGT
Cette question sera abordée en mesurant le flux de HGT entre les guêpes parasitoïdes et tous les autres génomes d’insectes disponibles (leurs hôtes potentiels) en utilisant des méthodes de distance. L’idée est d’identifier des séquences d’ADN dont les niveaux de similarités entre parasitoïdes hyménoptères et autres insectes sont incompatibles avec une transmission verticale depuis leur ancêtre commun. Cela devrait être relativement facile à mettre en place, puisque la plupart des parasitoïdes hyménoptères se sont diversifiés très tôt au sein des hyménoptères (environ 250 millions d’années). Ces transferts seront ensuite confirmés par des approches phylogénétiques. Nous mesurerons ensuite le nombre de HGT impliquant des lignées contenant des PDV par rapport à celles qui n’en contiennent pas. Étant donné que les PDV ont évolué au moins trois fois indépendamment, nous pourrons tester l’hypothèse en utilisant trois ensembles de données indépendants dans un modèle apparié. Nous limiterons notre analyse aux gènes codant pour les protéines situées dans les segments inclus dans les PDV matures (parce que les espèces apparentées qui ne codent pas pour les PDV codent pour des protéines homologues incluses dans les segments), ou nous utiliserons l’ensemble du protéome. Dans ce dernier cas, nous extrairons toutes les protéines de tous les génomes, puis nous les regrouperons en clusters en utilisant des critères stricts (qui excluent du même cluster des protéines transmises verticalement depuis l’ancêtre commun des hyménoptères parasitoïdes et des autres insectes, c’est-à-dire depuis 250 millions d’années). Les clusters qui regroupent des hyménoptères et d’autres insectes constitueront alors de bons candidats à l’HGT. Nous quantifierons également la proportion de HGT susceptibles d’être médiés par les PDV en recherchant la présence de motifs spécifiques directement impliqués dans le processus d’« endogénisation » au cours de l’infection par le PDV, connus sous le nom de HIM pour Host-Integration-Motifs (de manière similaire à ce que nous avons fait dans la référence 14).
Axe 2 - Déterminer la nature des gènes transférés horizontalement
Une fois que les gènes acquis horizontalement par les insectes auront été identifiés, nous testerons leur enrichissement dans certaines fonctions biologiques à l’aide d’approches d’enrichissement GO. L’expression des gènes sera également évaluée pour les espèces pour lesquelles des données transcriptomiques seront disponibles, étant donné qu’une forte expression suggère une fonction biologique. Nous vérifierons en outre si la sélection naturelle a façonné ces gènes acquis horizontalement en mesurant la conservation des séquences dans les cas où les gènes acquis horizontalement sont partagés par des espèces apparentées (approches dN/dS, de la même manière que nous l’avons fait dans la référence 15).
Axe 3 - Découverte de nouveaux systèmes de type PDV
Cette dernière idée, plus exploratoire, viendra naturellement si l’on constate, comme on peut s’y attendre, un excès de HGT lorsque les espèces donneuses hébergent des PDV. Alors, à l’inverse, nous examinerons en détail les génomes des guêpes particulièrement impliquées dans l’HGT. Ces espèces candidates peuvent en effet coder de nouveaux systèmes de type PDV, à l’origine de l’excès d’HGT. Nous rechercherons donc des régions particulières de ces génomes de guêpes qui sont localement enrichies en gènes impliqués dans des transferts horizontaux. Cela pourrait nous permettre d’identifier de nouveaux « segments » d’ADN de guêpes qui pourraient être empaquetés dans des structures de type viral, à l’instar des systèmes PDV. Le grand nombre d’hôtes potentiels disponibles dans ce vaste ensemble de données (n=6688 espèces non parasitoïdes) maximisera les chances de succès de cette approche.
Résultats attendus
Nous attendons la caractérisation et la quantification de l’HGT médiée par les PDV dans les communautés d’insectes, ainsi qu’un aperçu de leur contribution en termes d’adaptation et d’innovation génétique dans leurs nouvelles espèces « hôtes ». Cela permettra également de mieux comprendre les mécanismes qui sous-tendent le transfert de gènes entre insectes. Enfin, si le dernier axe nous permet d’identifier de nouveaux systèmes similaires aux PDV, cela permettra des avancées décisives dans notre compréhension des interactions hôte-parasitoïde, ouvrant éventuellement de nouvelles voies pour l’optimisation du biocontrôle.
Références bibliographiques
1. Soucy, S. M., Huang, J. & Gogarten, J. P. Horizontal gene transfer: building the web of life. Nat. Rev. Genet. 16, 472–82 (2015).
2. Frost, L. S., Leplae, R., Summers, A. O. & Toussaint, A. Mobile genetic elements: the agents of open source evolution. Nat. Rev. Microbiol. 3, 722–32 (2005).
3. Griffith, F. The Significance of Pneumococcal Types. J. Hyg. (Lond.) 27, 113–159 (1928).
4. Keeling, P. J. & Palmer, J. D. Horizontal gene transfer in eukaryotic evolution. Nat. Rev. Genet. 9, 605–618 (2008).
5. Sibbald, S. J., Eme, L., Archibald, J. M. & Roger, A. J. Lateral Gene Transfer Mechanisms and Pan-genomes in Eukaryotes. Trends Parasitol. 36, 927–941 (2020).
6. Verster, K. I. et al. Horizontal Transfer of Bacterial Cytolethal Distending Toxin B Genes to Insects. Mol. Biol. Evol. 36, 2105–2110 (2019).
7. Di Giovanni, D. et al. A Behavior-Manipulating Virus Relative as a Source of Adaptive Genes for Drosophila Parasitoids. Mol. Biol. Evol. 37, 2791–2807 (2020).
8. Moran, N. A. & Jarvik, T. Lateral Transfer of Genes from Fungi Underlies Carotenoid Production in Aphids. Science 328, 624–627 (2010).
9. Graham, L. A. & Davies, P. L. Horizontal Gene Transfer in Vertebrates: A Fishy Tale. Trends Genet. 37, 501–503 (2021).
10. Herniou, E. A. et al. When parasitic wasps hijacked viruses: genomic and functional evolution of polydnaviruses. Philos. Trans. R. Soc. B Biol. Sci. 368, 20130051 (2013).
11. Chevignon, G. et al. Cotesia congregata Bracovirus Circles Encoding PTP and Ankyrin Genes Integrate into the DNA of Parasitized Manduca sexta Hemocytes. J. Virol. 92, (2018).
12. Schneider, S. E. & Thomas, J. H. Accidental Genetic Engineers: Horizontal Sequence Transfer from Parasitoid Wasps to Their Lepidopteran Hosts. PLoS ONE 9, e109446 (2014).
13. Gasmi, L. et al. Recurrent Domestication by Lepidoptera of Genes from Their Parasites Mediated by Bracoviruses. PLOS Genet. 11, e1005470 (2015).
14. Heisserer, C. et al. Massive Somatic and Germline Chromosomal Integrations of Polydnaviruses in Lepidopterans. Mol. Biol. Evol. 40, msad050 (2023).
15. Guinet, B. et al. Endoparasitoid lifestyle promotes endogenization and domestication of dsDNA viruses. eLife 12, e85993 (2023).
**Conditions scientifiques matérielles et financières
**
La thèse sera co-encadrée par Julien Varaldi (MCF HDR, laboratoire LBBE, Univ. Lyon 1) et Clément Gilbert (DR CNRS, laboratoire EGCE, Univ. Paris-Saclay). L’essentiel des analyses prévues dans la thèse seront effectuées au laboratoire de Biométrie et Biologie Evolutive à Lyon, mais plusieurs séjours au laboratoire EGCE sont envisagés afin de faciliter le partage de connaissances.
Ce projet s’inscrit dans le cadre plus large d’un projet ANR financé (VIRHOZFER, 2024 – 2029), impliquant plusieurs membres des laboratoires LBBE (Univ. Lyon 1) et EGCE (Univ. Paris Saclay) avec lesquels le.la candidat.e pourra interagir autant que besoin. Tous les coûts associés au bon déroulement de la thèse (contribution au cluster, participation aux congrès, frais de publications) seront couverts par le projet ANR VIRHOZFER.
Le projet de doctorat repose exclusivement sur des données génomiques et des ressources bioinformatiques. Ces deux éléments sont entièrement disponibles dans l’équipe d’accueil. La partie informatique du projet sera possible grâce à l’accès au cluster bioinformatique du LBBE/PRABI Lyon (25 nœuds pour 1200 cpu, dont 4 nœuds « bigmem » avec 1 To de RAM et ∼300 To de stockage beeGFS). Le cluster est utilisé par 150 personnes du FR BioEnvis chaque année (∼5000000 h de calculs par an). En outre, nous aurons accès au CC-IN2P3 pour le stockage à long terme des données.
Collaborations envisagées
Ce projet est en lui-même une collaboration entre les deux encadrants qui se connaissent depuis plusieurs années via des interactions dans des conférences et au sein de jurys et comités de thèse. Par ailleurs, les encadrants échangent déjà régulièrement en visio conférence dans le cadre de deux thèses en cours (Sara Oukkal et Audrey Portal) encadrées au LBBE (co-encadrement J. Varaldi & Sylvain Charlat) et dans le cadre de la rédaction du projet ANR VIRHOZFER. L’étudiant.e bénéficiera du réseau de collaborateurs national (notamment S. Charlat, CR CNRS, Sara Oukkal et Audrey Portal directement impliqués dans l’analyse du jeu de données provenant du Costa-Rica) et international des deux encadrants.
objectifs de valorisation des travaux du doctorant :
Les résultats obtenus au cours de la thèse feront l’objet d’au moins 3 publications de rang A dans des journaux tels que Genome Biology and Evolution, PLOS Genetics, Molecular Biology and Evolution. De plus, le/a doctorant/e sera encouragé/e à participer à des actions de vulgarisation et à présenter ses travaux à au moins deux conférences internationales pendant la thèse.
Lien web avec complément sur le sujet
Le projet ANR VIRHOZFER a débuté le 1er mars 2025 et son résumé est disponible ici : https://anr.fr/Projet-ANR-24-CE02-1004
Profil et compétences recherchées
Etudiant.e intéressé par les sciences de l’évolution, avec une appétence pour la bioinformatique.
**ENGLISH VERSION
**
**Contribution of endogenous viruses to horizontal gene transfer in host-parasitoid communities
**
Key-words
Horizontal gene transfer, endogenous viruses, insects, comparative genomics, molecular evolution
Summary
Insect parasitoids lay their eggs in the bodies of other arthropods, mainly insects, and are therefore the main natural regulators of insect populations, including pests. In the vast majority of cases, their development ends with the death of their hosts. Among the extraordinary diversity of parasitoids found in the order Hymenoptera, we know that 3 monophyletic clades of wasps have domesticated viruses, enabling them to protect their offspring from the immune response of their hosts. This phenomenon is made possible by the fact that these viruses ‘domesticated’ by the wasp are injected into the host and enable the wasp’s genes to be integrated into the host, thereby manipulating host physiology from the inside! The current literature indicates that these wasp segments can integrate not only the DNA of somatic tissues but also the DNA of germinal tissues of attacked hosts, with some even becoming fixed within certain host species, despite the fact that parasitized hosts usually die. However, the actual flow of wasp genes passed on during evolution from parasitoid wasps to their hosts is not known. Nor do we know to what extent they contribute or have contributed to the fitness of these ‘recipient’ species. Nor is it known whether other cases of virus domestication, beyond the three currently known, have occurred in the wide diversity of hymenopteran parasitoids. The thesis project aims at answering these questions, based on a bioinformatics analysis of the 7125 insect genome assemblies currently available, including 437 Hymenoptera with a parasitoid lifestyle.
Theme
This thesis focuses on the horizontal transfer (HT) of genetic material, in other words the transmission of DNA between organisms by mechanisms other than reproduction1. This type of transfer has been well studied in prokaryotes, where the vectors and mechanisms underlying HT are well known2. In eukaryotes, on the other hand, HT has been relatively little studied and many questions remain about how it occurs, the underlying mechanisms and the factors explaining its occurrence during evolution. The proposed subject will help to answer these questions by measuring the contribution of domesticated viruses found in insects to horizontal transfers between parasitoid insects and their potential hosts.
Domain
This thesis is in the field of evolutionary biology, and more specifically in that of evolutionary genomics and molecular evolution. It is based on bioinformatics and comparative genomics approaches (comparison of complete genomes) and evolutionary genomics (identification of selection signals in genomes).
Context
There is no longer any doubt that genetic elements can move between different branches of the tree of life, sometimes very distantly related. The importance of this phenomenon has been clearly recognized since almost a century now in bacteria and archaea, starting from the pioneering work of Griffith and colleagues3. More recently, it has been found that horizontal gene transfer (HGT) may also involve multicellular eukaryotes such as plants or animals4,5. HGT may occur between multicellular eukaryotes and microbes (bacteria6, viruses7, fungi8) but also between multicellular eukaryotes, including animals9. However, the actual extent, the nature of the horizontally transferred elements and the molecular and ecological mechanisms involved remain mostly unknown.
In insect parasitoids, who develop from (and usually kill) other insects, a specific mechanism leading to the horizontal transmission of genetic material among distantly related insects has been recently identified. This mechanism involves viruses whose genetic material has entered wasp chromosomes in a process known as “endogenization”. These virally-derived genes have been retained by natural selection in the parasitic wasp populations, in a process known as “domestication”: they allow the females to produce viral-like structures (VLS) that are injected into the host and that protect the developing offspring from host immune response. These elements are referred to as “polyDNAviruses” (PDVs), because these VLS contain in fact circles of wasp DNA that ultimately integrate into the (caterpillar) host genome10. These structures are thus hybrids systems because the DNA circles found in the particles are most likely of eukaryotic origin (they were present before the acquisition of the virus), while the machinery allowing for the formation of the virion derives from viral genes. The heterologous expression of these wasp genes (encoded in the circles) in the host then allows manipulation of the host physiology from the inside, thereby inhibiting the host immune system, ultimately facilitating the development of the wasp offspring11.
In the last decades, it has been found that wasp DNA not only enter the DNA of host somatic cells during an infestation by a parasitic wasp, but on occasion, may enter the DNA of germinal tissues, some wasp DNA having been fixed within certain host species, despite the fact that parasitized hosts usually die12–14. This result indicates that PDVs may serve as highways for HGT.
However, the actual flow of wasp genes passed on during evolution from parasitoid wasps to their hosts is not known. Nor do we know to what extent they contribute or have contributed to the fitness of these ‘recipient’ species. Nor is it known whether other cases of virus domestication, beyond the three currently known, have occurred in the wide diversity of hymenopteran parasitoids.
We are currently addressing these questions with a sampling scheme limited to the species specifically found in an ecosystem located in Costa-Rica (Area de Conservation de Guanacaste) and involving 58 hymenopteran parasitoid species (all from a single superfamily) and their Lepidoptera hosts (n=132). This ongoing work will enable us to provide insights into the questions mentioned above but will also suffer from some limitations, due to the relatively small diversity sampled in this dataset both on the parasitoid and host sides. The idea of the current thesis project is to use a much larger dataset encompassing much more diversity both on the parasitoid and on the potential hosts sides to gain statistical power for addressing the contribution of domesticated viruses to HGT. Indeed, in this project, we will extend the analysis to all insect genomes available on public repositories (n=6897), complemented by the genomes we generated from the Costa-Rica project (n=228). This dataset will contain more than 437 hymenopteran parasitoid species, with all remaining species being potential hosts (n=6688).
With this large dataset, the thesis will address, using a bioinformatics approach, the following questions:
a. Are parasitic wasp encoding PDVs (3 independent cases) more often engaged in HGT with their hosts, as expected if PDVs are important players in HGT?
b. Which genes are transmitted (only those inside PDV segments and which ones, or any gene or TEs outside the segments and which ones)? Is there a signal of convergence on the category of genes transmitted to hosts for the 3 PDV-encoding wasp clades? What is the evolutionary fate of horizontally acquired genes in the novel hosts?
c. From the overall large-scale pattern of HGT, can we identify new clades of parasitic Hymenoptera that encode new PDV-like machineries?
Method
Axis 1 – Quantifying the contribution of PDVs to HGT
This question will be addressed by measuring the flux of HGT between parasitoid wasps and all other insect genomes available (their potential hosts) by using distance methods. The idea will be to identify DNA sequences showing unexpectedly high levels of similarity between hymenopteran parasitoids and other insects, incompatible with vertical inheritance since their common ancestor. This should be relatively easy to setup, since most hymenopteran parasitoids diversified very early among Hymenoptera (around 250Mya). These HGT will be further confirmed using phylogenetic approaches. We will then measure the number of HGT involving lineages containing PDV from those that do not. Since PDVs have evolved at least three times independently, we will be able to test the hypothesis using three independent datasets in a paired design. We will either restrict our analysis to the protein coding genes located in the segments included in mature PDVs (because the related species that do not encode PDVs encode similar homologous proteins included in the segments), or using the whole proteome. In that last case, we will extract all proteins from all the genomes, then clusterize them using stringent criteria (which exclude from the same cluster proteins that have been transmitted vertically since the common ancestor of parasitic hymenopterans and other insects, i.e. 250 million years ago). Clusters that will include Hymenoptera and other insects will then constitute good candidates for HGT. We will also quantify the proportion of HGT that are likely mediated by PDVs versus other unknown mechanisms by searching for the presence of specific motifs that are directly involved in the “endogenization” process during PDV infection, known as HIM for Host-Integration-Motifs (similarly to what we did in 14).
Axis 2 – Determining the nature of the horizontally transferred genes
Once the genes that have been horizontally acquired by insects will be available, we will test for the enrichment in some biological functions using GO-enrichment approaches. The expression of the genes will also be assessed for the species in which transcriptomics data will be available, since high expression is suggestive of biological function. We will further test whether natural selection has shaped these horizontally-acquired genes by measuring the conservation of the sequences in cases where horizontally-acquired genes are shared by related species (dN/dS approaches, in a similar way as we did in 15).
Axis 3 – Discovery of new PDV-like systems
This last idea, more exploratory, will naturally come if we do see, as can be expected, an excess of HGT when the donor species harbor PDVs. Then, conversely, we will scrutinize in details the genomes of wasps that are particularly involved in HGT. These candidate species may in fact encode new PDV-like systems, underlying the excess in HGT. We will thus seek for particular regions of these wasp genomes that are locally enriched in genes involved in HGT. This could allow us to identify new wasps DNA “segments” that are possibly packed in Viral-like structures, similarly to PDV systems. The high number of potential hosts available in this large dataset (n=6688 non parasitoid species) will maximize the chances of success of this approach.
Expected results
We expect that we will be able to produce a detailed characterization and quantification of PDV mediated HGT in insect communities, as well as new insights into their contribution in terms of adaptation and genetic innovation in their new « host » species. The project will also shed new light into the mechanisms underlying HGT among insects. Finally, if the last axis allows us to identify new PDV-like systems, this will be a substantial breakthrough in our understanding of host-parasitoid interactions, possibly opening new avenues for biocontrol optimization.
References
1. Soucy, S. M., Huang, J. & Gogarten, J. P. Horizontal gene transfer: building the web of life. Nat. Rev. Genet. 16, 472–82 (2015).
2. Frost, L. S., Leplae, R., Summers, A. O. & Toussaint, A. Mobile genetic elements: the agents of open source evolution. Nat. Rev. Microbiol. 3, 722–32 (2005).
3. Griffith, F. The Significance of Pneumococcal Types. J. Hyg. (Lond.) 27, 113–159 (1928).
4. Keeling, P. J. & Palmer, J. D. Horizontal gene transfer in eukaryotic evolution. Nat. Rev. Genet. 9, 605–618 (2008).
5. Sibbald, S. J., Eme, L., Archibald, J. M. & Roger, A. J. Lateral Gene Transfer Mechanisms and Pan-genomes in Eukaryotes. Trends Parasitol. 36, 927–941 (2020).
6. Verster, K. I. et al. Horizontal Transfer of Bacterial Cytolethal Distending Toxin B Genes to Insects. Mol. Biol. Evol. 36, 2105–2110 (2019).
7. Di Giovanni, D. et al. A Behavior-Manipulating Virus Relative as a Source of Adaptive Genes for Drosophila Parasitoids. Mol. Biol. Evol. 37, 2791–2807 (2020).
8. Moran, N. A. & Jarvik, T. Lateral Transfer of Genes from Fungi Underlies Carotenoid Production in Aphids. Science 328, 624–627 (2010).
9. Graham, L. A. & Davies, P. L. Horizontal Gene Transfer in Vertebrates: A Fishy Tale. Trends Genet. 37, 501–503 (2021).
10. Herniou, E. A. et al. When parasitic wasps hijacked viruses: genomic and functional evolution of polydnaviruses. Philos. Trans. R. Soc. B Biol. Sci. 368, 20130051 (2013).
11. Chevignon, G. et al. Cotesia congregata Bracovirus Circles Encoding PTP and Ankyrin Genes Integrate into the DNA of Parasitized Manduca sexta Hemocytes. J. Virol. 92, (2018).
12. Schneider, S. E. & Thomas, J. H. Accidental Genetic Engineers: Horizontal Sequence Transfer from Parasitoid Wasps to Their Lepidopteran Hosts. PLoS ONE 9, e109446 (2014).
13. Gasmi, L. et al. Recurrent Domestication by Lepidoptera of Genes from Their Parasites Mediated by Bracoviruses. PLOS Genet. 11, e1005470 (2015).
14. Heisserer, C. et al. Massive Somatic and Germline Chromosomal Integrations of Polydnaviruses in Lepidopterans. Mol. Biol. Evol. 40, msad050 (2023).
15. Guinet, B. et al. Endoparasitoid lifestyle promotes endogenization and domestication of dsDNA viruses. eLife 12, e85993 (2023).
Conditions
The thesis will be co-supervised by Julien Varaldi (MCF HDR, LBBE laboratory, Univ. Lyon 1) and Clément Gilbert (DR CNRS, EGCE laboratory, Univ. Paris-Saclay). Most of the analyses in the thesis will be carried out in the Biometrics and Evolutionary Biology laboratory in Lyon, but several visits to the EGCE laboratory are planned in order to facilitate the sharing of knowledge.
This project is part of a larger funded ANR project (VIRHOZFER, 2024 - 2029), involving several members of the LBBE (Univ. Lyon1) and EGCE (Univ. Paris-Saclay) laboratories, with whom the candidate will be able to interact as required. All costs associated with the successful completion of the thesis (contribution to the cluster, participation in conferences, publication costs) will be covered by the ANR VIRHOZFER project.
The PhD project relies exclusively on genomics data and bioinformatics resources. Both are fully available in the host team. The computational part of the project will be possible thanks to the access to the LBBE/PRABI Lyon bioinformatic cluster (25 nodes for 1200 cpu, including 4 nodes “bigmem” with 1 To of RAM and ∼300 To of beeGFS storage). The cluster is used by 150 people from the FR BioEnvis every year (∼5000000 h calculations (on per year). Additionally, we will have access to the (CC-IN2P3) for long-term storage of the data.
Collaborations
This project is in itself a collaboration between the two supervisors, who have known each other for several years through interaction at conferences and on thesis juries and committees. In addition, the supervisors are already in regular contact by videoconference as part of two ongoing theses (Sara Oukkal et Audrey Portal) supervised at the LBBE (co-supervision of J. Varaldi & Sylvain Charlat) and as part of the drafting of the ANR VIRHOZFER project. The student will benefit from the network of national collaborators (in particular S. Charlat, CR CNRS, Sara Oukkal and Audrey Portal who are involved in the analysis of the data set from Costa Rica) and international collaborators of the two supervisors.
Valorisation :
The results obtained during the thesis will be the subject of at least 3 rank A publications in journals such as Genome Biology and Evolution, PLOS Genetics, Molecular Biology and Evolution. In addition, the doctoral student will be encouraged to participate in outreach activities and to present his/her work at at least two international conferences during the thesis.
Website
The ANR VIRHOZFER project began on 1 March 2025 and its summary is available here: https://anr.fr/Projet-ANR-24-CE02-1004