Optimisation de la solution Grist pour l’intégration de données de séquençage de microbes
Stage · Stage M2 · 6 mois Bac+5 / Master PHIM IRD · Montpellier (France) gratification stage fonction publique
Date de prise de poste : 1 mars 2025
Mots-Clés
Base de données, séquençage, PGD, microbes, python
Description
Optimisation et standardisation de la solution Grist pour l’intégration de données de séquençage de microbes.
Contexte
Au sein de l’IRD (Institut de Recherche pour le Développement) à Montpellier, deux unités de recherche, PHIM (Plant Health Institute of Montpellier) et MIVEGEC (Maladies Infectieuses et Vecteurs : Ecologie, Génétique, Evolution et Contrôle), expérimentent l’utilisation de la solution de base de données Grist (https://www.getgrist.com/) pour faciliter la gestion de données de recherche. Ces données peuvent être de différente nature selon les projets : données d’échantillonnage sur le terrain (localisation GPS, dates de collecte, photos d’échantillon), données de laboratoire pour la gestion de collection de microbes issus des échantillons terrain, données phénotypiques sur les souches bactériennes éventuellement isolées, et métadonnées associées au séquençage de ces microbes. L’objectif est de disposer d’un système souple (i) facilitant la saisie de données par les membres des équipes de recherche et leurs partenaires, (ii) permettant la mise à disposition de tableaux de bord synthétiques des données, et (iii) assurant la traçabilité des données et apportant les bases d’un plan de gestion de données (PGD) de séquençage (iv) assurant la standardisation et l’interopérabilité des données avec les bases de données publiques (vocabulaire contrôlé, ontologies).
Dans ce contexte, un projet est en cours pour mutualiser les efforts entre les unités et consolider les bases de cette solution. En effet, plusieurs instances Grist ont été initiées pour répondre aux besoins des équipes de recherche, et des développements plus aboutis sont nécessaires aujourd’hui pour disposer d’un environnement complet plus générique et interopérable. En effet, des développements complémentaires sont nécessaires pour ajouter de nouvelles fonctionnalités et tirer un maximum du potentiel de Grist, notamment via l’utilisation des API pour faciliter la communication avec la base Grist et permettre d’automatiser la soumission de séquences dans les banques publiques (NCBI, ENA). Par ailleurs, nous souhaitons aussi implémenter l’ajout de vocabulaire contrôlé (ontologies) pour faciliter la communication et permettre l'interopérabilité avec d’autres bases de données.
A l’IRD, nos activités de développement et d’analyse bio-informatiques s’appuient sur le plateau bioinformatique i-trop de l’IRD (https://bioinfo.ird.fr/) et la plate-forme bioinformatique Montpellieraine South Green (https://www.southgreen.fr/).
Objectifs
Les objectifs du stage seront (i) d’harmoniser les modèles de bases existantes afin d’obtenir un modèle unique et générique, applicable à la fois aux microbes de santé humaine, animale et végétale (ii) de développer l’utilisation de termes d’ontologies existantes pour décrire les données et métadonnées, notamment celles liées aux analyses bioinformatiques sous-jacentes (ontologie EDAM) et au phénotypage des microbes isolés (ontologie OMP) et (iii) de développer un module permettant de soumettre les données de séquençage aux banques publiques (NCBI, ENA).
Profil souhaité
- Master 2 Bioinformatique ou équivalent
- Connaissances et maîtrise des concepts de bases de données relationnelles
- Intérêt pour les systèmes de gestion et d’intégration de données
- Maîtrise du langage de programmation python
Encadrement
Alexis Dereeper (IE IRD Bioinformatique) : alexis.dereeper@ird.fr
Juliette Hayer (CR IRD Bioinformatique) : juliette.hayer@ird.fr
Pierre Larmande (DR IRD Bioinformatique): pierre.larmande@ird.fr
Candidature
Procédure : Envoyer un mail à alexis.dereeper@ird.fr, juliette.hayer@ird.fr, pierre.larmande@ird.fr
Date limite : 31 janvier 2025
Contacts
Alexis Dereeper
alNOSPAMexis.dereeper@ird.fr
Offre publiée le 17 janvier 2025, affichage jusqu'au 31 janvier 2025