Développement d’un outil intégré pour réaliser des analyses GWAS

 Stage · Stage M2  · 6 mois    Bac+5 / Master   INRAE, UR1052 GAFL, Equipe d’accueil : Informatique, Bio-analyses et Bio-statistiques (I2B) · Avignon (France)  Indemnités de stage selon grille : ~560EUR/mois

Mots-Clés

Bio-informatique bio-statistique développement pipeline reproductible GWAS

Description

Réaliser une étude d’association pangénomique vise à identifier par analyse statistique les variantes génétiques (génotype) associées à des traits spécifiques (phénotype). Cette méthodologie est fréquemment mise en œuvre dans notre unité pour les différentes espèces étudiées avec pour but d’identifier les zones du génome impliquées dans le contrôle de traits d’intérêt et leur effet sur les variations phénotypiques. Les populations étudiées, la densité et le type de marqueurs disponibles, les dispositifs expérimentaux (e.g. multi-environnement), la variabilité et la distribution des traits étudiés et les modèles mobilisés sont variables selon les espèces et les projets menés.

Jusqu’à présent nous avons réalisé ces études de façon indépendante sans construire un espace de travail collaboratif permettant de partager la méthodologie, les étapes à suivre et outils associés, les modèles et les scripts d’analyse.

L’objectif du projet est donc de capitaliser sur l’expérience et les méthodes disponibles dans l’unité pour construire un outil qui pourra être mobilisé par des non bio-informaticiens pour réaliser des analyses GWAS reproductibles et performantes.

 

Les étapes proposées sont :

- de construire un workflow représentant les étapes nécessaires à l’analyse, les données d’entrée, les outils dédiés et données produites en sortie

- de faire l’inventaire des modèles et scripts disponibles et de les caractériser de façon à réaliser un arbre de décision des modèles à privilégier en fonction des caractéristiques des jeux de données phénotypiques et génotypiques

- de développer un workflow reproductible et utilisable par des non informaticiens

- tester le workflow sur des jeux de données

- développer une interface en R Shiny (https://shiny.posit.co )

Ce pipeline sera in fine utilisé par des non bio-informaticiens.

L’étudiant.e aura accès au serveur Linux de calcul de l’unité GAFL et aux plateformes HPC d’INRAE.

Il/elle sera co-encadré.e par une directrice de recherche en génétique et un ingénieur en bio-informatique et interagira avec différents chercheurs et doctorants de l’unité.

 

Profil requis

Maîtrise de l'environnement Linux, du Bash, du langage R, utilisation et interprétation de logiciels d'analyse bio-informatique sont demandés.

Des notions de statistiques seront nécessaires pour interagir avec les chercheurs.

Des notions de base sur les outils de packaging et de conteneurisation (Singularity, https://sylabs.io/singularity/ ) et de management de workflow (Snakemake, https://snakemake.readthedocs.io ) seraient un plus.

 

References:

Bineau E, … Causse M. 2021. Breeding Tomato Hybrids for Flavour: Comparison of GWAS Results Obtained on Lines and F1 Hybrids. Genes. 12(9):1443. https://doi.org/10.3390/genes12091443

Desaint H, .. Causse M. 2023. Genome-Wide Association Study: A Powerful Approach to Map QTLs in Crop Plants. In: Raina, A., Wani, M.R., Laskar, R.A., Tomlekova, N., Khan, S. (eds) Advanced Crop Improvement, Volume 1. Springer, Cham. https://doi.org/10.1007/978-3-031-28146-4_15

McLeod L, .. Lefebvre V. 2023. Multi‐environment association study highlights candidate genes for robust agronomic quantitative trait loci in a novel worldwide Capsicum core collection. Plant Journal, 10.1111/tpj.16425. hal-04185847

Monnot S, .. Boissot N. 2022. Unravelling cucumber resistance to several viruses via genome-wide association studies highlighted resistance hotspots and new QTLs, Horticulture Research, Volume 9, 2022, https://doi.org/10.1093/hr/uhac184

Pérez de los Cobos F, .. Quilot-Turion B, … Duval H. 2023. Almond population genomics and non-additive GWAS reveal new insights into almond dissemination history and candidate genes for nut traits and blooming time, Horticulture Research, Volume 10, Issue 10, October 2023, https://doi.org/10.1093/hr/uhad193

 

Candidature

Procédure : Envoyer un mail avec CV et lettre de motivation à: Bénédicte Quilot (DR) et Jacques Lagnel (IE) email : benedicte.quilot@inrae, jacques.lagnel@inrae.fr

Date limite : 31 janvier 2025

Contacts

Jacques Lagnel (IE) Tel : 04 32 72 27 23

 jaNOSPAMcques.lagnel@inrae.fr

Offre publiée le 30 septembre 2024, affichage jusqu'au 31 janvier 2025