Stage M2 en bioinfo

 Stage · Stage M2  · 6 mois    Bac+5 / Master   INRAE - Unité Génétique Animale et Biologie Intégrative · Jouy-en-Josas (France)

 Date de prise de poste : 1 janvier 2025

Mots-Clés

genome by sequencing, sequence génome entier, bioinfo

Description

Environnement du stage

Le stage se déroule sur le campus INRAE de Jouy-en-Josas (78) à 25 km au sud-ouest de Paris. L’UMR GABI comporte 7 équipes de recherche et une équipe Plateformes. Les orientations scientifiques de GABI visent à étudier la structure et le fonctionnement des génomes animaux, comprendre le déterminisme de caractères complexes (immunité et santé, qualité des produits, différenciation et croissance, adaptation) et proposer des stratégies de gestion, d'évaluation, d’amélioration et de valorisation des ressources génétiques animales contribuant au développement de systèmes de production innovants, compétitifs et durables. Le stage proposé sera co-encadré par des chercheurs de l’équipe « Genetics for Bovine Sustainability (GBoS

Contexte:

Depuis 2009, la sélection des bovins est devenue génomique. Cela signifie que les vaches et les taureaux sont sélectionnés sur la base de valeurs génétiques prédites à partir de leur information du génome. Les génotypes obtenus à partir de puces à SNP pour 50 000 à 100 000 polymorphismes sont très précis et le processus est peu coûteux. Plus de 300 000 bovins sont génotypés chaque année en France et ce nombre s’accroit régulièrement. Toutefois, il est probable que ce procédé soit remplacé d’ici quelques années par du génotypage par séquençage, à bas niveau de couverture (low pass) et il est nécessaire d’anticiper cette évolution qui peut remettre en cause fortement l’organisation de la sélection. Il est anticipé que le génotypage par séquençage sera mis en œuvre à bas niveau de couverture et que l’information manquante sera reconstituée par imputation. Pour cela, nous disposons d’une base contenant environ 6000 séquences de génome complet de haute qualité, base qui servira de référence pour l’imputation.

Objectifs:

L’objectif de ce projet de stage est de construire un pipeline permettant d’imputer précisément le maximum de variants du génome à partir de séquences faible couverture et de la base de référence disponible, en un temps compatible avec le volume anticipé ; d’estimer la couverture minimale (probablement de l’ordre de 0.1 à 0.5X) nécessaire pour une imputation précise, et d’estimer le nombre de variants imputables avec un haut niveau de confiance ; d’identifier les manques potentiels dans la population de référence ; éventuellement de réfléchir à un système de stockage de ces données à haut débit.

Le travail sera exclusivement bioinformatique et statistique, le séquençage low-pass sera mimé à partir de séquences génome complet récentes de profondeur 15X environ qui serviront également de population de validation.

Compétences techniques recherchées:

Connaissance en bio-informatique et statistique, connaissances de base en génétique et génomique

Candidature

Procédure : Par mail

Date limite : 31 octobre 2024

Contacts

Mekki Boussaha

 meNOSPAMkki.boussaha@inrae.fr

Offre publiée le 11 septembre 2024, affichage jusqu'au 31 octobre 2024