Mots-Clés
workflow
Galaxy
OMICS
Spectrométrie de masse
Description
Institution et laboratoire :
L’Ecole des Hautes Etudes en Santé Publique (EHESP) est un établissement public de l’État à caractère scientifique, culturel et professionnel, membre de la conférence des grandes écoles. L’EHESP a le statut de « grand établissement » (loi du 9 août 2004 et décret du 7 décembre 2006). Le laboratoire d’étude et de recherche en environnement et santé (Leres), contribue à l’ensemble des missions de l’EHESP via son expertise dans le domaine de l’évaluation de l’exposition humaine aux contaminants de l’environnement. Son plateau analytique et son équipe lui permettent de développer des méthodes d’analyse innovantes pour la conduite de projets de recherche en synergie avec une activité de prestations sous accréditation Cofrac. En complément des activités analytiques, le Leres développe et met en place des solutions bio-informatiques pour le retraitement des données de spectrométrie de masse à haute résolution.
Le Leres est une plateforme analytique de l’Institut de Recherche en Santé Environnementale et Travail (https://www.irset.org) (Irset-Inserm UMR 1085). L’Irset est l’un des principaux centres de recherche en exposomique en France et en Europe, réalisant des recherches innovantes en génomique, transcriptomique, chimie analytique, toxicologie, science de l’exposition, épidémiologie et évaluation des risques.
Contexte du poste :
Depuis 2016, le Leres développe des approches analytiques innovantes reposant sur la chromatographie liquide couplée à la spectrométrie de masse haute résolution (LC-HRMS) pour mesurer l’exposition humaine aux contaminants chimiques de manière plus compréhensive à partir d’échantillons biologiques. Les données générées sont massives et complexes et nécessitent le développement d’outils bio-informatiques performants. En ce sens, plusieurs outils bio-informatiques (Python) ont déjà été développés (https://github.com/scannotation) ou sont en cours de développement au laboratoire. Le poste proposé s’intègre dans le projet européen « Partenariat européen pour l’évaluation des risques liés aux produits chimiques (#EU_PARC) ». Ce projet majeur comprend 200 partenaires de 28 pays de l’UE : des agences nationales et des organismes de recherche travaillant dans les domaines de l’environnement ou de la santé publique, l’Agence européenne des produits chimiques (ECHA), l’Autorité européenne de sécurité des aliments (EFSA) et l’Agence européenne pour l’environnement (AEE). L’objectif est de développer l’évaluation des risques chimiques de nouvelle génération afin de protéger la santé et l’environnement.
Missions proposées :
Afin d’améliorer la surveillance des expositions aux substances chimiques via des approches innovantes, l’ingénieur travaillera au Leres sur un projet visant à développer sous l’environnement Galaxy un pipeline/workflow automatisé pour le retraitement des données LC- HRMS. Plus précisément, l’ingénieur aura pour missions :
- De coordonner, en interaction avec les partenaires européens, la mise en place des différents outils sous Galaxy afin de développer le workflow de retraitement. En particulier, l’ingénieur s’assurera de l’interopérabilité des différents outils.
- De contribuer à implémenter les solutions bio-informatiques développées au Leres au sein d’un workflow dans l’environnement Galaxy.
- De retraiter des données LC-HRMS obtenues sur des échantillons biologiques dans le cadre d’un essai collaboratif entre les partenaires et dans un objectif d’annotation/identification des composés chimiques contaminants.
Le poste impliquera des interactions et présentations régulières des avancées en anglais au consortium Européen.
Compétences recherchées :
- Issu(e) d’une formation niveau Master 2 en bio-informatique / informatique (avec première expérience)
- Expérience en analyse et traitement des données de type OMICS pour la mise en place de pipelines bio-informatiques (maîtrise des bibliothèques Pandas, Numpy, SQLite, Matplotlib, etc.)
- Maitrise des outils de versioning et de conteneurisation : Git et Docker
- Connaissance de la plateforme Galaxy ou autres gestionnaires de pipelines (e.g., Snakemake, Conda)
- Maîtrise des différents langages de programmation : Python, SQL et Bash. Connaissance du langage XML
- Communication et gestion de projet
- Anglais requis (niveau B2 minimum)
- Autonomie
Compétences souhaitées (optionnelles) :
- Connaissances en chimie analytique, et plus particulièrement en LC-HRMS appliquée à la métabolomique et/ou la protéomique
- Expérience de mise en place d’analyses bio-statistiques pour le traitement de données OMICs
- Maîtrise d’algorithmes de machine learning