Étude bioinformatique des peptides marqueurs utilisés en paléoprotéomique

 Stage · Stage M2  · 5 mois    Bac+5 / Master   Centre de Recherche en Informatique, Signal, et Automatique de Lille (CRIStAL) · Lille (France)

 Date de prise de poste : 3 janvier 2023

Mots-Clés

paléoprotéomique , phylogénie , python

Description

Contexte scientifique :

Au cours de ces dernières années, l’analyse d’échantillons biologiques anciens a changé notre compréhension de l'évolution de la vie sur Terre, renouvelant les approches utilisées jusqu’alors en paléontologie basées sur l’étude de fossiles ou la datation au carbone 14. Au premier rang des nouvelles techniques moléculaires se trouvent la paléogénétique (séquençage d’ADN ancien) cependant l’ADN se dégrade relativement rapidement. Plus récemment, la paléoprotéomique via la ZooArchaeologie par spectrometrie de masse (ZooMS) offre une possibilité d'identification des fragments d'os morphologiquement ambigus ou non identifiables provenant d’assemblages osseux. L’identification des os en ZooMS résultent du séquençage d’une protéine cible, telle que le collagène abondamment présent dans les fragments osseux. Le collagène présent dans les échantillons est digéré et la masse des peptides obtenue par spectrométrie donne une information indirecte sur la séquence d’acides aminés de la protéine présente. Pour exploiter ces masses, la communauté travaille ensuite avec des peptides marqueurs, qui servent en quelque sorte de codes-barres moléculaires pour l’assignation taxonomique.

Cependant, les peptides marqueurs utilisés pour identifier les espèces ne représentent pas la totalité de l’information présente dans les séquences et la quantité d’information phylogénétique présente dans les peptides marqueurs classiquement utilisés n’a pas été formellement évaluée. Le projet de Master2 proposé ici par les laboratoires CRIStAL (Centre de Recherche en Informatique, Signal, et Automatique de Lille) et EEP (Évolution, Écologie et Paléontologie) basés à Lille vise, en étudiant ces peptides marqueurs, à explorer les données issues de ZooMS de façon à améliorer leur analyse et par conséquent l’identification des espèces.

Projet de stage Master 2 :

L’objectif du stage est d’évaluer la capacité des séquences utilisées en ZooMS à discriminer les différentes espèces pour l’assignation taxonomique. Cela comprend les tâches suivantes :

  • constituer des jeux de données de référence ;
  • définir à quel niveau taxonomique correspond l’information portée par les séquences d’une part et les peptides marqueurs  (espèce, genre, famille, etc…),
  • comparer l’information portée par les peptides de collagène de différents types (le collagène de type I représente environ 90% du collagène total).
  • comprendre comment les peptides issus de séquences actuelles peuvent nous aider à identifier les peptides anciens.

Toutes ces tâches devront mener à la mise en place d’un protocole bioinformatique original pour systématiser et automatiser ces analyses, en utilisant des approches à base de phylogénie, modélisation de l’évolution et d’analyse de séquences. Des compétences en programmation Python sont également nécessaires.

Encadrement du stage :

Le stage sera encadré par Hélène Touzet (DR CNRS, bioinformaticienne, CRIStAL UMR 9189-INS2I) et Céline Poux (maîtresse de conférences, évolution, EEP UMR 8198-INEE), en collaboration avec Fabrice Bray (IR CNRS, MSAP USR 3290-INC) responsable de la plateforme de ZooMS lilloise et Patrick Auguste (CR CNRS, paléontologue, EEP UMR 8198 - INEE).

Candidature

Procédure : Envoyer un email à Hélène Touzet (helene.touzet@univ-lille.fr) et/ou Céline Poux (celine.poux@univ-lille.fr)

Date limite : None

Contacts

Hélène Touzet

 heNOSPAMlene.touzet@univ-lille.fr

Offre publiée le 18 novembre 2022, affichage jusqu'au 16 janvier 2023