Mots-Clés
pan-génome
séquençage
alignement
génotypage
Description
Un pangénome est une représentation de plusieurs génomes d'une même espèce. Ces pangénomes sont maintenant très utilisés afin de représenter la diversité génomique au sein d'une population. Dans le contexte agronomique moderne, la caractérisation de la biodiversité intra-espèce est crucial afin de connaître le réservoir de gènes potentiellement mobilisables afin de s'adapter au changement climatique à venir. Ainsi, des pangénomes de bovins, tomates, et pommes de terre ont déjà été publiés.
Plusieurs outils de création de pangénomes ont été proposé (VG, ODGI, minigraph, etc.), et se présentent, informatiquement, sous forme de graphe, où des chemins différents correspondent à des séquences trouvées uniquement dans une sous-population, comme une race bovine, ou un type de tomate. On peut supposer que l'ensemble des chemins qui sont propres à une sous-population permettent de la caractériser génétiquement.
Ces pangénomes peuvent ensuite être exploités afin de "génotyper" un individu. En l'occurrence, on peut séquencer un individu, aligner les lectures sur le graphe, et rechercher quels sont les chemins qui sont pris lors de l'alignement des lectures. Ces chemins peuvent ensuite être attribué à des sous-populations.
Le but de ce stage est de comprendre comment les lectures sont alignées par les différents logiciels (comme Giraffe), et comment exploiter les résultats afin d'attribuer les lectures à une sous-population.