Stage de M1 Effet du génome de référence sur l’estimation de l’hétérozygotie résiduelle

 Stage · Stage M1  · 3 mois    Bac+3 / Licence   AGAP Institut · Montpellier (France)  Oui si plus de 3 mois

 Date de prise de poste : 1 mars 2025

Mots-Clés

Assemblage, Détection de variation génomique, Pangénomique

Description

Titre du stage : Effet du génome de référence sur l’estimation de l’hétérozygotie résiduelle

 

Encadrant(s) : Gautier SARAH / Laurène GAY / Nathalie CHANTRET

Laboratoire : AGAP - Amélioration Génétique et Adaptation des Plantes méditerranéennes et tropicales

Adresse mail : gautier.sarah@inrae.fr / laurene.gay@inrae.fr / nathalie.chantret@inrae.fr

Site web : https://umr-agap.cirad.fr/

 

Problématique générale 

Medicago truncatula est une espèce de la famille des légumineuses, pour laquelle elle est l’espèce modèle du fait de son petit génome (450Mb). Une séquence génomique de référence a été obtenue à partir d’un génotype australien appelé A17. M. truncatula a un mode de reproduction par autofécondation, ce qui implique un très fort taux d’homozygotie. Cependant, il reste de l’hétérozygotie résiduelle due à de rares évènements d’allofécondation, mais son ampleur à l’échelle du génome complet est mal connue.

L’hétérozygotie dans un individu peut être détectée à partir du mapping de séquences de type ‘short read’ de cet individu sur un génome de référence. Lors d’études précédentes sur des populations méditerranéennes, nous avons vu que le mapping sur la référence A17 présentait une forte hétérogénéité en terme de profondeur, ce qui peut avoir un impact sur l’estimation de l’hétérozygotie résiduelle. Cette hétérogénéité peut être due à des régions mal assemblées dans la référence ou à de fortes différences génomiques entre A17 et les populations que nous étudions. L’objectif principal de ce stage est de déterminer l’impact du choix du génome de référence dans la détection de l’hétérozygotie résiduelle.

 

 

Objectifs du stage :

1) Assembler un génome de référence pour chacune des 8 populations étudiées (les séquences seront disponibles au début du stage) .

2) Estimer le taux d’hétérozygotie résiduelle avec précision à partir du mapping dans chacune des populations.

3) Etudier l’impact du choix du génome de référence dans la détection d’hétérozygotie résiduelle.

4) Analyser les variations des taux d’hétérozygotie au niveau génomique (taille des zones, positions dans le génome, …) et entre populations (répartition géographique des populations).

5) Si le timing le permet, comparer ces 8 génomes entre eux et avec la référence A17, soit avec un outil comme Syri, soit avec la création d’un pangénome.

 

Rapide description des méthodes utilisées :

Assemblage de long reads (Snakemake, hifiasm)

Appel de variants (Snakemake, GATK, PAV)

Comparaison des résultats de mapping sur différents génomes de référence

Comparaison des génomes (Syri, PAV, PGGB, minigraph-cactus)

Utilisation d’un cluster de calcul (MesoLR, slurm)

Candidature

Procédure : Envoyer un mail à Gautier SARAH (gautier.sarah@inrae.fr), Laurene GAY (laurene.gay@inrae.fr) et Nathalie CHANTRET (nathalie.chantret@inrae.fr)

Date limite : None

Offre publiée le 21 octobre 2024, affichage jusqu'au 1 février 2025