Stage de Master 2 en Bioinformatique (intégration de données multi-omiques)

 Stage · Stage M2  · 6 mois    Bac+5 / Master   Institut MICALIS · Jouy en Josas (France)  gratification en accord avec celles pratiquées dans la fonction publique

 Date de prise de poste : 3 février 2025

Mots-Clés

développement logiciel intégration de données base de données multi-omiques métabolomique métatranscriptomique

Description

Contexte :

Le(a) stagiaire évoluera au sein de l’institut Micalis à l’INRA de Jouy en Josas et plus précisément dans l’équipe Food Microbial Ecology (FME) dirigée par Marie-Christine Champomier-Vergès. La thématique que mène notre équipe vise à comprendre les règles qui gouvernent les écosystèmes alimentaires afin d’en améliorer la qualité, la sécurité et la conservation que ce soit à travers des procédés fermentaires ou de bio-préservation. Nous étudions en particulier sur les écosystèmes laitiers, carnés ainsi que les légumes fermentés. Dans le cadre de nos projets, nous développons des consortia synthétiques de micro-organismes afin de comprendre les synergies existantes entre différents micro-organismes de ces écosystèmes et d’élucider notamment leur impact sur la santé, sur la fermentation ou la bio-préservation.

Dans le cadre du « Grand Défi Ferments du Futur » (GDFF), le projet SynthPlex se concentre sur le développement d'aliments fermentés à base de plantes avec des propriétés bénéfiques pour la santé, par le biais d'interactions avec le microbiote intestinal. SynthPlex cherche à identifier l'influence de métabolites spécifiques présents dans les matrices alimentaires végétales sur la croissance et le métabolisme des micro-organismes. Les résultats de cette recherche seront utilisés pour concevoir des consortiums microbiens adaptés pour des aliments fermentés fonctionnels. SynthPlex combine des expérimentations in vitro dans des micro-fermenteurs et des analyses in silico pour identifier les interactions trophiques au sein des consortia synthétiques.

Des bases de données sont en cours de développement pour héberger ces données massives et hétérogènes : en particulier l’entrepôt de données SIDURI développé par l’unité MAIAGE dans le cadre de GDFF. De même, au sein de l’équipe FME, Food2Gut est une plateforme de recherche conçue pour intégrer des données « omiques » variées (génomiques, métagénomiques) et des métadonnées afin d’étudier les interactions microbiennes dans les aliments et l’intestin. Food2Gut permet des analyses complexes pour relier les données microbiennes à leurs contextes fonctionnels et environnementaux, offrant de nouvelles perspectives sur les microbiomes alimentaires et intestinaux et leurs impacts sur la santé.

Missions :

Le but du stage sera de développer, pour les besoins du projet SynthPlex, les modules dédiés aux données métabolomiques, aux données transcriptomiques et à la description des interactions entre micro-organismes au sein de l’entrepôt de données de l’équipe puis de mettre en place les procédures d’intégration de données nécessaires à leur alimentation. La mise en œuvre de l’interopérabilité entre ces données et des données génomiques et métagénomiques déjà intégrées serait également souhaitée.

Enfin, il est également crucial de mettre en place une interopérabilité forte avec l’entrepôt SIDURI de GDFF.

Pour cela voici les principales taches associées :

 

  • Concevoir et développer les modules de la base de données multi-omique
  • Intégrer les données métabolomiques caractérisant les consortia synthétiques à la base de données
    • Automatiser le traitement régulier des flux de données pour capter les sorties issues des micro-fermenteurs
    • Développer des procédures ETL (Extract Transform Load) pour l’intégration de ces données dans l’entrepôt.
  • Intégrer les données de méta-omics générées dans le cadre de SynthPlex dans la base de données de l’équipe à l’aide des pipelines bioinformatiques existants. Identifier des données pivots pour garantir l’interopérabilité avec SIDURI.
  • Participer au développement d’une base de données conforme aux principes FAIR pour stocker et interroger les résultats des analyses, facilitant ainsi la modélisation des consortia microbiens. En fonction des choix stratégiques et techniques, cette base de données pourraient être une extension de Food2Gut.

 

Compétences mises en oeuvre:

  • Modélisation-conception de bases de données (PostgreSQL, potentiellement NOSQL) : Langage UML / Merise et SQL
  • Développement de scripts (python, bash), de workflows (Snakemake ou Nextflow) et de procédures ETL (Extract Transform Load) afin d’automatiser les processus nécessaires à l’alimentation de la base de données à partir des sorties des micro-fermenteurs et des pipelines d’analyses de l’équipe.

 

Profil souhaité :

Etudiant en Master de bioinformatique ayant un goût prononcé pour l’intégration de données, de bonnes compétences en développement de script.

Un intérêt pour la métagénomique et la microbiologie serait un plus.

Anglais apprécié.

Candidature

Procédure : Envoyer un email à nacer.mohellibi@inrae.fr et julien.tap@inrae.fr

Date limite : 25 novembre 2024

Contacts

Nacer Mohellibi - Julien Tap

 naNOSPAMcer.mohellibi@inrae.fr

 https://jobs.inrae.fr/ot-22828

Offre publiée le 23 septembre 2024, affichage jusqu'au 25 novembre 2024