Ingénieur développement informatique en protéomique

 CDD-OD · Ingénieur autre  · 36 mois    Bac+5 / Master   CEA · Bagnols sur Ceze (France)  2861€ bruts

 Date de prise de poste : 1 novembre 2024

Mots-Clés

Protéotypage Métaprotéomique Protéomique Python Pipelines IA

Description

Intitulé du poste : Développement d’un pipeline bioinformatique en protéotypage

Localisation : Centre de Marcoule dans le Gard, à 30 kms au Nord d'Avignon

Laboratoire : Institut des sciences du vivant Frédéric Joliot - Laboratoire Innovations technologiques pour la Détection et le Diagnostic (cea.fr)

Contexte : L’offre s’incrit dans les activités innovantes de détection d’organismes et de marqueurs par spectrométrie de masse du Laboratoire Innovations technologiques pour la Détection et le Diagnostic (Li2D). Un pipeline de typage par le séquençage de peptides permet des applications en protéomique microbienne et métaprotéomique, domaines dans lequel la plateforme ProGénoMix est mondialement reconnue. Le projet s’inscrit dans le besoin d’évolution du pipeline existant, écrit en Python, permettant la caractérisation taxonomique et fonctionnelle d’échantillons inconnus. Le projet permettra de tester de nouveaux concepts, les intégrer, et valider les performances.

Description du poste : Sous l'encadrement d'un ingénieur de recherche senior en informatique-bioinformatique, et en collaboration avec celui-ci, le candidat aura à développer de nouvelles fonctionnalités,  évaluer les performances comparées des processus existants et des nouvelles options possibles (DIA, denovo, IA…) avant intégration, et tester les performances finales.

Les missions principales du poste incluront de:

  • Tester et intégrer divers outils récents de mises en correspondance spectres MS/MS – séquence de peptides (DDA, DIA, de novo…) dans le process global de protéotypage, dans une démarche de simplification et optimisation,
  • Sélectionner et appliquer des méthodes de classification ou de régression par IA (PyTorch, sélection de features, modèles…).
  • Optimiser les bases de données d’organismes utilisées pour un compromis couverture / rapidité / empreinte mémoire, en intégrant les nouveaux séquençages d’organismes (isolats, MAGs, SAGs …)
  • Définir, mettre en œuvre et valider un estimateur de confiance global (Python, R),

Tout au long du projet, une documentation sera rédigée afin de faciliter une utilisation ultérieure.

Compétences souhaitées : 

- Fortes compétences en développement/rationalisation de code  Python

- Compétences ou intérêt pour les méthodes de classification IA.

- Connaissances SQL

Aptitudes personnelles :

  • Force de proposition
  • Reporting
  • Rigueur

Candidature

Procédure : Envoyer un mail à olivier.pible@cea.fr, avec CV, lettre de candidature et si possible coordonnées de référents.

Date limite : 28 juillet 2024

Contacts

Olivier Pible

 olNOSPAMivier.pible@cea.fr

Offre publiée le 8 juillet 2024, affichage jusqu'au 28 juillet 2024