Développement d’un outil intégré pour réaliser des analyses GWAS
Stage · Stage M2 · 6 mois Bac+5 / Master INRAE, UR1052 GAFL, Equipe d’accueil : Informatique, Bio-analyses et Bio-statistiques (I2B) · Avignon (France) Indemnités de stage selon grille : ~560EUR/mois
Mots-Clés
Bio-informatique bio-statistique développement pipeline reproductible GWAS
Description
Réaliser une étude d’association pangénomique vise à identifier par analyse statistique les variantes génétiques (génotype) associées à des traits spécifiques (phénotype). Cette méthodologie est fréquemment mise en œuvre dans notre unité pour les différentes espèces étudiées avec pour but d’identifier les zones du génome impliquées dans le contrôle de traits d’intérêt et leur effet sur les variations phénotypiques. Les populations étudiées, la densité et le type de marqueurs disponibles, les dispositifs expérimentaux (e.g. multi-environnement), la variabilité et la distribution des traits étudiés et les modèles mobilisés sont variables selon les espèces et les projets menés.
Jusqu’à présent nous avons réalisé ces études de façon indépendante sans construire un espace de travail collaboratif permettant de partager la méthodologie, les étapes à suivre et outils associés, les modèles et les scripts d’analyse.
L’objectif du projet est donc de capitaliser sur l’expérience et les méthodes disponibles dans l’unité pour construire un outil qui pourra être mobilisé par des non bio-informaticiens pour réaliser des analyses GWAS reproductibles et performantes.
Les étapes proposées sont :
- de construire un workflow représentant les étapes nécessaires à l’analyse, les données d’entrée, les outils dédiés et données produites en sortie
- de faire l’inventaire des modèles et scripts disponibles et de les caractériser de façon à réaliser un arbre de décision des modèles à privilégier en fonction des caractéristiques des jeux de données phénotypiques et génotypiques
- de développer un workflow reproductible et utilisable par des non informaticiens
- tester le workflow sur des jeux de données
- développer une interface en R Shiny (https://shiny.posit.co )
Ce pipeline sera in fine utilisé par des non bio-informaticiens.
L’étudiant.e aura accès au serveur Linux de calcul de l’unité GAFL et aux plateformes HPC d’INRAE.
Il/elle sera co-encadré.e par une directrice de recherche en génétique et un ingénieur en bio-informatique et interagira avec différents chercheurs et doctorants de l’unité.
Profil requis
Maîtrise de l'environnement Linux, du Bash, du langage R, utilisation et interprétation de logiciels d'analyse bio-informatique sont demandés.
Des notions de statistiques seront nécessaires pour interagir avec les chercheurs.
Des notions de base sur les outils de packaging et de conteneurisation (Singularity, https://sylabs.io/singularity/ ) et de management de workflow (Snakemake, https://snakemake.readthedocs.io ) seraient un plus.
References:
Bineau E, … Causse M. 2021. Breeding Tomato Hybrids for Flavour: Comparison of GWAS Results Obtained on Lines and F1 Hybrids. Genes. 12(9):1443. https://doi.org/10.3390/genes12091443
Desaint H, .. Causse M. 2023. Genome-Wide Association Study: A Powerful Approach to Map QTLs in Crop Plants. In: Raina, A., Wani, M.R., Laskar, R.A., Tomlekova, N., Khan, S. (eds) Advanced Crop Improvement, Volume 1. Springer, Cham. https://doi.org/10.1007/978-3-031-28146-4_15
McLeod L, .. Lefebvre V. 2023. Multi‐environment association study highlights candidate genes for robust agronomic quantitative trait loci in a novel worldwide Capsicum core collection. Plant Journal, 〈10.1111/tpj.16425〉. 〈hal-04185847〉
Monnot S, .. Boissot N. 2022. Unravelling cucumber resistance to several viruses via genome-wide association studies highlighted resistance hotspots and new QTLs, Horticulture Research, Volume 9, 2022, https://doi.org/10.1093/hr/uhac184
Pérez de los Cobos F, .. Quilot-Turion B, … Duval H. 2023. Almond population genomics and non-additive GWAS reveal new insights into almond dissemination history and candidate genes for nut traits and blooming time, Horticulture Research, Volume 10, Issue 10, October 2023, https://doi.org/10.1093/hr/uhad193
Candidature
Procédure : Envoyer un mail avec CV et lettre de motivation à: Bénédicte Quilot (DR) et Jacques Lagnel (IE) email : benedicte.quilot@inrae, jacques.lagnel@inrae.fr
Date limite : 31 janvier 2025
Contacts
Jacques Lagnel (IE) Tel : 04 32 72 27 23
jaNOSPAMcques.lagnel@inrae.fr
Offre publiée le 30 septembre 2024, affichage jusqu'au 31 janvier 2025