Sujet de thèse avec financement

 Apprentissage · Thèse  · 36 mois (renouvelable)    Bac+5 / Master   Université de Sherbrooke, QC, Canada · Sherbrooke (Canada)

 Date de prise de poste : 2 septembre 2024

Mots-Clés

Algorithme Bio-informatique Classification, Clustering Évolution

Description

Les arbres phylogénétiques (arbre additifs ou X-arbres) sont des représentations schématiques de l’histoire évolutive des espèces. Chaque gène a sa propre histoire évolutive, qui peut différer considérablement de celle des autres gènes. Par exemple, certains gènes peuvent être affectés par des événements d’évolution réticulée, tels que le transfert horizontal de gènes, l’hybridation et la recombinaison. Ainsi, l'histoire de l'évolution de chaque gène doit être représentée par son propre arbre phylogénétique, dont les schémas d'évolution peuvent différer de l'arbre des espèces (ou Arbre de Vie). Un des problèmes majeurs en biologie comparative est de combiner des arbres phylogénétiques définis sur différents ensembles d’espèces. L’arbre phylogénétique résultant est nommé « super-arbre ». Cependant, un super-arbre d'espèces fiable ne peut pas être inféré à partir d'un alignement de séquences multiples d'une famille de gènes unique ou de la concaténation des alignements correspondant à des familles de gènes ayant des histoires évolutives différentes. De nombreuses méthodes ont été proposées pour reconstruire un super-arbre unique pour un ensemble donné d'arbres phylogénétiques. Or, l'application de ces méthodes classiques peut conduire à la perte d'informations sur les histoires évolutives spécifiques qui caractérisent certaines familles de gènes ou certains groupes de familles de gènes. Dans ce cas, le problème de l'inférence de plusieurs super-arbres alternatifs, en utilisant le clustering, devient pertinent puisqu'il permet de regrouper dans chaque cluster des arbres de gènes ayant des schémas évolutifs similaires (par exemple, des arbres représentant des gènes qui ont subi les mêmes événements de transfert horizontal, d’hybridation ou de recombinaison).

L'objectif de ce projet de recherche en biologie computationnelle est d'établir les bases mathématiques et statistiques pour résoudre le problème difficile de la classification d’arbres phylogénétiques et de créer une nouvelle plateforme gratuite permettant aux biologistes d'utiliser nos nouvelles méthodes. Nous définirons une nouvelle approche efficace pour détecter le regroupement d’arbres phylogénétiques en vue d’inférer plusieurs super-arbres alternatifs. Pour ce faire, nous adapterons la distance Billera-Holmes-Vogtmann dans notre stratégie. Cette métrique est bien adaptée en raison de sa géodésie intrinsèque, ce qui permet de réduire le temps d'exécution de la fonction objective.

Candidature

Procédure : Procédure : contacter Nadia.Tahiri@USherbrooke.ca Les personnes candidates intéressées sont invitées à soumettre les documents suivants : • CV • Relevés de notes • Lettres de recommandation

Date limite : 1 septembre 2024

Contacts

Nadia Tahiri

 NaNOSPAMdia.Tahiri@USherbrooke.ca

 https://tahirinadia.github.io/

Offre publiée le 23 juin 2024, affichage jusqu'au 1 septembre 2024