Traduction du site en cours

Le site de la SFBI est en cours de traduction en anglais.

Etudiant en Thèse - Machine learning et Microbiologie

 Autre · Thèse  · 36 mois    Bac+5 / Master   ANSES · 94700 (France)

 Date de prise de poste : 1 novembre 2023

Mots-Clés

Machine learning, Big Data, Data Science, Microbiologie

Description

Prévenir les TIA (Toxi-Infection Alimentaire) constitue un enjeu de santé publique majeure, avec la perspective de détecter des signaux, le plus en amont possible, sur la chaîne alimentaire pour réduire l’exposition du consommateur et ainsi le nombre de malades. En France, le nombre annuel de malades a été évalué, sur la période 2008-2013, à près de 2 millions, avec 20 000 hospitalisations et 250 morts (Cauteren et al. 2017). Les données annuelles européennes de surveillance des zoonoses, rapportées à l’EFSA par les Etats membres de l’Union Européenne, indiquent un nombre de malades dans le cas de TIAC (TIA Collective) de 30 000, 3 000 hospitalisations et une trentaine de décès. La listeriose est une zoonose causée par Listeria monocytogenes (Lm) qui affecte les hommes et les animaux, en particulier les ruminants. Cette maladie présente un taux de mortalité chez l’homme parmi les plus élevés des agents responsables de zoonoses (jusqu’à 30%). Bien que majoritairement asymptomatiques chez les ruminants, la listeriose est responsable de rhombencephalites et de pathologies abortives pour les formes graves.

L’objectif de ce projet est le développement de méthodes de classification utilisant des algorithmes de ML (Machine Learning) afin de prédire le potentiel d’émergence de Lm chez l’homme et/ou l’animal. Les données utilisées pour développer ce modèle seront issues de base de données publiques telles que Bigsdb (Institut Pasteur) ou Pathogens (NCBI) afin d’obtenir un jeu de données le plus exhaustif possible, incluant des données de souches humaines, animales, issues de l’environnement ou de la surveillance de la chaine alimentaire.

Le projet de thèse proposé est un sujet impliquant l’ANSES et plus particulièrement le laboratoire de sécurité des aliments et le laboratoire de Santé animale et une PME francilienne (ISOFT) experte en algorithmes de machine learning et en traitement de données massives complexes et hétérogènes. Ainsi, la thèse sera basée à la fois au sein du SPAAD (Service Partagé d’Appui à l’Analyse de Données) rattaché au laboratoire de Sécurité des Aliments à Maisons-Alfort et au sein de la société ISoft localisé à Saint-Aubin. L’étudiant sera amené à travailler pour 80% de son temps au sein de l’équipe du SPAAD à Maisons-Alfort et pour 20% au sein du département Bioanalyse et Bioinformatique d’ISoft. L’école doctorale (ED) de rattachement sera l’ED de Santé Publique (EDSP, http://www.ed-sante-publique.universite-paris-saclay.fr/).

La thèse impliquera de l’analyse et de l’intégration de données massive (Big Data) de différents types afin de proposer un modèle final de prédiction d’émergence de bactéries. Le travail sera réparti en 3 phases : (i) Création du jeu de données d’entrainement. La récupération de données génomiques et métadonnées publiques de souches de Lm. Le nettoyage et la normalisation des données seront réalisés afin d’assurer une homogénéité des données. (ii) Développement d’un modèle de prédiction de l’émergence des clones bactériens dans la chaîne alimentaire, chez l’homme et/ou l’animal. (iii) Validation du modèle de prédiction sur des données indépendantes issues de cas réels de TIAC recensé au laboratoire ou sur des bases de données publiques de TIAC (Liseq).

Compétences recherchées
 

  • Compétences en programmation en python ;
  • Bonne connaissance en analyse de données massives et hétérogènes ;
  • Connaissance des modèles prédictif (machine learning) ;
  • Maitrise de l’anglais ;
  • Un intérêt pour le domaine de la microbiologie ou des sciences de la vie ;
  • Des connaissances pratiques en analyse de données de séquençage haut-débit serait un plus ;
  • Qualités rédactionnelles, maîtrise de l’orthographe ;
  • Capacité de synthèse ;
  • Capacité de recherche bibliographique et d’approfondissement du sujet ;
  • Capacité de d’écoute et d’adaptation ;

 

 

 

Candidature

Procédure : Adresser les candidatures par courriel (lettre de motivation + cv) en indiquant la référence Thèse MOPEB à : virginie.chesnais@anses.fr et jean_philippe.meyniel@isoft.fr

Date limite : 17 septembre 2023

Contacts

 virginie.chesnais@anses.fr

 viNOSPAMrginie.chesnais@anses.fr

Offre publiée le 29 juin 2023, affichage jusqu'au 17 septembre 2023