Evolution de l'interface web d'Omnicrobe afin d'ordonner les données selon leur qualité
Stage · Stage M2 · 6 mois Bac+5 / Master INRAE - Unité MaIAGE · Jouy-en-Josas (France)
Mots-Clés
text-mining base de données interface web publications scientifiques phénotypes et habitats microbiens
Description
Contexte
L’unité Mathématiques et Informatique Appliquées du Génome à l’Environnement (MaIAGE) est située sur le centre INRAE de Jouy-en-Josas. Cette unité de recherche regroupe des mathématiciens, des informaticiens, des bioinformaticiens et des biologistes qui développent des méthodes pour répondre à des questions de biologie et agro-écologie, allant de l'échelle moléculaire à l'échelle du paysage en passant par l'étude d'individus, de populations ou d'écosystèmes. MaIAGE est structurée en cinq équipes dont l’équipe Acquisition et formalisation des connaissances à partir de textes (Bibliome), l’équipe Bioinformatique et statistique des données “omiques” (StatInfOmics) et la plateforme bioinformatique Migale. Bibliome développe des méthodes de traitement automatique des langues (TAL) et d'apprentissage automatique (ML) pour extraire des informations de textes par des ontologies dans le domaine de la biologie. StatInfOmics développe et met en œuvre des méthodes statistiques et bioinformatiques dédiées à l’analyse de données “omiques”. Migale fournit des services à la communauté des sciences de la vie. Cette proposition de stage s’inscrit sur un projet commun aux trois équipes.
Missions
L’unité MaIAGE développe l’application Omnicrobe qui rassemble des informations sur les habitats, les phénotypes et les usages des micro-organismes, extraites automatiquement de sources textuelles (PubMed, GenBank, DSMZ, CIRM). Les données sont accessibles via une interface web et une interface programmatique (API). Afin de faciliter la lecture par l’utilisateur, le ou la stagiaire aura pour mission de modifier l’interface web afin d’ordonner les informations de l’interface en fonction de leur qualité. Le ou la stagiaire utilisera des métriques basées sur la combinaison de l’évaluation de la qualité des relations agrégées et des informations prédites par les outils de text-mining.
Compétences
Master 2 / dernière année d’école d’ingénieur en bio-informatique.
Compétences souhaitées :
- Javascript / Python
- PostgreSQL
Contacts
- Louise Deléger, louise.deleger@inrae.fr
- Sandra Dérozier, sandra.derozier@inrae.fr
Références
- Unité MaIAGE, https://maiage.inrae.fr/
- INRAE, https://www.inrae.fr/
- Equipe Bibliome, https://maiage.inrae.fr/fr/bibliome
- Equipe StatInfOmics, https://maiage.inrae.fr/fr/statinfomics
- Plateforme Migale, https://migale.inrae.fr
- Dérozier S et al. Omnicrobe, an open-access database of microbial habitats and phenotypes using a comprehensive text mining and data fusion approach. bioRxiv. 2022. DOI: https://doi.org/10.1101/2022.07.21.500958
- Interface web Omnicrobe, https://omnicrobe.migale.inrae.fr/
- Interface programmatique Omnicrobe, https://omnicrobe.migale.inrae.fr/api
Candidature
Procédure : Envoyer votre candidature (CV et lettre de motivation) par mail à sandra.derozier@inrae.fr et louise.deleger@inrae.fr.
Date limite : None
Contacts
Sandra Dérozier
saNOSPAMndra.derozier@inrae.fr
Offre publiée le 18 novembre 2022, affichage jusqu'au 31 mars 2023