Stage: optimisation de la solution Grist pour la gestion de données de recherche.

 Stage · Stage M2  · 6 mois    Bac+5 / Master   PHIM IRD · Montpellier (France)

 Date de prise de poste : 3 février 2025

Mots-Clés

base de données, Grist, PGD, docker

Description

Configuration et optimisation de la solution Grist pour la gestion de données de recherche.

Contexte

Au sein de l’IRD (Institut de Recherche pour le Développement) à Montpellier, deux unités de recherche, PHIM (Plant Health Institute of Montpellier) et MIVEGEC, expérimentent l’utilisation de la solution de base de données Grist (https://www.getgrist.com/) pour faciliter la gestion de données de recherche. Ces données peuvent être de différente nature selon les projets : données d’échantillonnage sur le terrain (localisation GPS, dates de collecte, photos d’échantillon), données de laboratoire pour la gestion de collection de microbes issus des échantillons terrain, données phénotypiques sur les souches bactériennes éventuellement isolées, et métadonnées associées au séquençage de ces microbes.  L’objectif est de disposer d’un système souple (i) facilitant la saisie de données par les membres des équipes de recherche et leurs partenaires, (ii) permettant la mise à disposition de tableaux de bord synthétiques des données, et (iii) assurant la traçabilité des données et apportant les bases d’un plan de gestion de données (PGD) de séquençage.

Dans ce contexte, un projet est en cours pour mutualiser les efforts entre les unités et consolider les bases de cette solution. En effet, plusieurs instances Grist ont été initiées pour répondre au besoin des équipes de recherche et des investigations plus approfondies sont nécessaires aujourd’hui pour disposer d’un socle robuste, en termes de solution d’hébergement, d’optimisation d’espace disque pour le passage à l’échelle de grosses volumétries de données, de mise en place de service d’authentification pour les partenaires, de communication avec des systèmes de gestion de formulaires comme KoboToolBox (https://www.kobotoolbox.org/) et l’application KoboCollect pouvant être déployé sur tablette pour la saisie sur le terrain, ou encore d’utilisation des API pour faciliter le développement d’application tierce devant interagir avec la base Grist.

A l’IRD, nos activités de développement et d’analyse bio-informatiques s’appuient sur le plateau bioinformatique i-trop de l’IRD (https://bioinfo.ird.fr/) et la plate-forme bioinformatique Montpellieraine South Green (https://www.southgreen.fr/) et sont réalisées en lien étroit avec le service informatique de l’IRD  (Direction du Développement des Usages Numériques Innovants (DDUNI)).

Objectif

Les objectifs du stage seront (i) de mesurer les performances de la solution Grist afin d’identifier les potentielles limites de cet outil pour la gestion de données de recherche, (ii) de configurer plusieurs systèmes d’authentification via l’utilisation de containers Docker (Docker compose), (iii) de mettre en place un connecteur permettant la communication directe entre un serveur KoboToolBox et une instance Grist via l’intégration de n8n (https://n8n.io/integrations/grist/and/kobotoolbox/)

Profil souhaité

  • Licence Pro Informatique ou Master 2 Bioinformatique avec un intérêt pour les aspects DevOps, containerisation, développement web et ingénierie réseau
  • Connaissances et maitrise des concepts de bases de données relationnelles
  • Intérêt pour les systèmes de gestion et d’intégration de données
  • La maîtrise du langage de programmation python est un plus

 

Encadrement

Alexis Dereeper, Juliette Hayer

Candidature

Procédure :

Date limite : 20 décembre 2024

Contacts

Alexis Dereeper

 alNOSPAMexis.dereeper@ird.fr

Offre publiée le 29 novembre 2024, affichage jusqu'au 20 décembre 2024