Stage: optimisation de la solution Grist pour la gestion de données de recherche.
Stage · Stage M2 · 6 mois Bac+5 / Master PHIM IRD · Montpellier (France)
Date de prise de poste : 3 février 2025
Mots-Clés
base de données, Grist, PGD, docker
Description
Configuration et optimisation de la solution Grist pour la gestion de données de recherche.
Contexte
Au sein de l’IRD (Institut de Recherche pour le Développement) à Montpellier, deux unités de recherche, PHIM (Plant Health Institute of Montpellier) et MIVEGEC, expérimentent l’utilisation de la solution de base de données Grist (https://www.getgrist.com/) pour faciliter la gestion de données de recherche. Ces données peuvent être de différente nature selon les projets : données d’échantillonnage sur le terrain (localisation GPS, dates de collecte, photos d’échantillon), données de laboratoire pour la gestion de collection de microbes issus des échantillons terrain, données phénotypiques sur les souches bactériennes éventuellement isolées, et métadonnées associées au séquençage de ces microbes. L’objectif est de disposer d’un système souple (i) facilitant la saisie de données par les membres des équipes de recherche et leurs partenaires, (ii) permettant la mise à disposition de tableaux de bord synthétiques des données, et (iii) assurant la traçabilité des données et apportant les bases d’un plan de gestion de données (PGD) de séquençage.
Dans ce contexte, un projet est en cours pour mutualiser les efforts entre les unités et consolider les bases de cette solution. En effet, plusieurs instances Grist ont été initiées pour répondre au besoin des équipes de recherche et des investigations plus approfondies sont nécessaires aujourd’hui pour disposer d’un socle robuste, en termes de solution d’hébergement, d’optimisation d’espace disque pour le passage à l’échelle de grosses volumétries de données, de mise en place de service d’authentification pour les partenaires, de communication avec des systèmes de gestion de formulaires comme KoboToolBox (https://www.kobotoolbox.org/) et l’application KoboCollect pouvant être déployé sur tablette pour la saisie sur le terrain, ou encore d’utilisation des API pour faciliter le développement d’application tierce devant interagir avec la base Grist.
A l’IRD, nos activités de développement et d’analyse bio-informatiques s’appuient sur le plateau bioinformatique i-trop de l’IRD (https://bioinfo.ird.fr/) et la plate-forme bioinformatique Montpellieraine South Green (https://www.southgreen.fr/) et sont réalisées en lien étroit avec le service informatique de l’IRD (Direction du Développement des Usages Numériques Innovants (DDUNI)).
Objectif
Les objectifs du stage seront (i) de mesurer les performances de la solution Grist afin d’identifier les potentielles limites de cet outil pour la gestion de données de recherche, (ii) de configurer plusieurs systèmes d’authentification via l’utilisation de containers Docker (Docker compose), (iii) de mettre en place un connecteur permettant la communication directe entre un serveur KoboToolBox et une instance Grist via l’intégration de n8n (https://n8n.io/integrations/grist/and/kobotoolbox/)
Profil souhaité
- Licence Pro Informatique ou Master 2 Bioinformatique avec un intérêt pour les aspects DevOps, containerisation, développement web et ingénierie réseau
- Connaissances et maitrise des concepts de bases de données relationnelles
- Intérêt pour les systèmes de gestion et d’intégration de données
- La maîtrise du langage de programmation python est un plus
Encadrement
Alexis Dereeper, Juliette Hayer
Candidature
Procédure :
Date limite : 20 décembre 2024
Contacts
Alexis Dereeper
alNOSPAMexis.dereeper@ird.fr
Offre publiée le 29 novembre 2024, affichage jusqu'au 20 décembre 2024