Stage : Estimation des paramètres de l'évolution des Bactéries

 Stage · Stage M2  · 6 mois    Bac+5 / Master   CBIO - Mines Paris PSL / Institut Curie · Paris (France)

 Date de prise de poste : 3 février 2025

Mots-Clés

Évolution Bactéries Alignement Modélisation

Description

Contexte

L’évolution des génomes bactériens suit des règles particulières lorsqu’on les compare
aux autres domaines du vivant. En effet, les bactéries se reproduisent clonalement, et
l’apparition de nouvelles caractéristiques dans une population ne peut donc provenir que
de deux sources : une nouvelle mutation, ou un transfert de matériel génétique provenant
d’une autre population de bactéries.


La prévalence de ce second phénomène complique l’étude de l’évolution bactérienne.
Les génomes bactériens sont ainsi fortement plastiques, avec une très forte variation
dans le contenu en gène même à l’intérieur d’une seule espèce (Vernikos et al. 2015).
Distinguer, au sein d’un génome, quelle portion est réellement issue d’un ancêtre commun
et quelle portion relève d’un échange de gène est complexe (Ravenhall et al. 2015).
Pourtant, c’est une tâche essentielle si l’on souhaite établir une phylogénie bactérienne,
étape nécessaire pour mieux connaître ce domaine du vivant, pour par exemple inférer
l’histoire et la fonction de nouveaux gènes, décrire et comprendre la microbiodiversité,
et mieux exploiter les quantités grandissantes d’informations contenues dans les bases de
données actuelles.


Pour construire des phylogénies, l’état de l’art est de sélectionner des gènes pour
lesquels il est peu probable qu’ils soient impliqués dans des transferts, et de construire un
arbre à partir de ces gènes (Kapli, Yang, and Telford 2020). Le projet dans lequel ce stage
s’inscrit a pour but de proposer une alternative pour établir des arbres phylogénétiques,
qui ne se base pas sur des sélections de gènes, mais plutôt sur les propriétés statistiques de
la comparaison de genomes bactériens, émergeant de différentes caractéristiques des deux
voies de transmissions de matériel génétique, verticales et horizontales. Des résultats
probants ont pu être obtenus en étudiant la famille des Enterobactéries (Sheinman, Arndt,
and Massip 2024). L’objectif suivant est maintenant de généraliser ces résultats à d’autres
familles bactériennes, à des bactéries plus éloignés évolutionnairement, mais également
d’explorer différents scénarios à l’aide de simulations pour mieux comparer cette méthode
à la littérature.

Objectifs

La/le stagiaire pourra choisir ses domaines de contributions en fonction de ses affinités,
avec comme exemples :
• Explorer différentes méthodes afin de quantifier l’incertitude sur l’estimation : Ap-
proximate Bayesian Computation (ABC), Bootstrap. . .
• Établir les liens entre caractéristiques du génomes (taux de GC, topologie de l’arbre
phylogénétique, longueur des transferts) et estimation de l’histoire évolutive, via des
simulations.
• Comparer, via des simulations, les performances de cette méthodes à une sélection
de méthodes de la littérature.
• Appliquer le modèle chez les Archées, domaine moins connu du vivant dans lequel
l’annotation (i.e. le placement des gènes sur un génome) est encore plus hasardeux.

 

Profil recherché

Étudiant·e en M2/Ingénieur, à l’aise en programmation (Python essentiellement) et
confortable avec la modélisation statistique. Des bases en bioinformatique (aligne-
ments, pipelines) et évolution (méthodes d’inférences d’arbres phylogénétiques) sont un plus.

 

Références

Kapli, Paschalia, Ziheng Yang, and Maximilian J. Telford (July 2020). “Phylogenetic
Tree Building in the Genomic Age”. In: Nature Reviews Genetics 21.7, pp. 428–444.
issn: 1471-0056, 1471-0064. doi: 10.1038/s41576- 020- 0233- 0. url: https:
//www.nature.com/articles/s41576-020-0233-0
(visited on 01/18/2024).
Ravenhall, Matt et al. (May 28, 2015). “Inferring Horizontal Gene Transfer”. In: PLOS
Computational Biology 11.5, e1004095. issn: 1553-7358. doi: 10.1371/journal.
pcbi.1004095. url: https://journals.plos.org/ploscompbiol/article?
id=10.1371/journal.pcbi.1004095
(visited on 10/04/2023).
Sheinman, Michael, Peter F. Arndt, and Florian Massip (Mar. 26, 2024). “Modeling
the Mosaic Structure of Bacterial Genomes to Infer Their Evolutionary History”.
In: Proceedings of the National Academy of Sciences 121.13, e2313367121. doi:
10.1073/pnas.2313367121. url: https://www.pnas.org/doi/10.1073/
pnas.2313367121
(visited on 10/03/2024).
Vernikos, George et al. (Feb. 1, 2015). “Ten Years of Pan-Genome Analyses”. In: Cur-
rent Opinion in Microbiology. Host–Microbe Interactions: Bacteria • Genomics 23,
pp. 148–154. issn: 1369-5274. doi: 10.1016/j.mib.2014.11.016. url: https:
//www.sciencedirect.com/science/article/pii/S1369527414001830

(visited on 09/16/2024).

Candidature

Procédure : Envoyer un mail à paul.etheimer@minesparis.psl.eu, avec votre CV.

Date limite : 17 janvier 2025

Contacts

Paul Etheimer

 paNOSPAMul.etheimer@minesparis.psl.eu

Offre publiée le 16 décembre 2024, affichage jusqu'au 17 janvier 2025