Doctorant en Epidémiologie Génétique

 Autre · Thèse  · 36 mois    Bac+5 / Master   CNRGH / CEA · Evry (France)  ~ 2 200 brut

 Date de prise de poste : 2 octobre 2023

Mots-Clés

Génétique variants rares longévité

Description

Etude des variants rares chez des centenaires pour le développement de nouvelles stratégies ciblant les maladies du vieillissement

(Projet AGENOMICS)

Les maladies du vieillissement et du grand âge chez l’Homme sont très nombreuses et variées dans leurs formes et leurs évolutions. Elles touchent une grande partie de la population et diminuent de manière considérable l’espérance de vie en bonne santé. Elles posent un problème majeur de santé publique et il serait souhaitable de pouvoir les anticiper, les prévenir, et si possible les guérir. Les individus sont très inégaux face à ces maladies, et cela est lié à la fois à leur exposition, à l’environnement mais aussi à leur patrimoine génétique.

Les centenaires constituent un contre-exemple frappant avec une espérance de vie en bonne santé beaucoup plus longue. Le déterminisme génétique est clairement documenté par de nombreuses études, un exemple bien connu est celui du génotype homozygote ApoE4 de susceptibilité à la maladie d’Alzheimer qui est absent chez les centenaires. Les centenaires représentent donc un modèle pertinent de résistance face aux fragilités et aux maladies du grand âge (Fortney et al. (2015) PLOS Genetics). De nombreuses études précédentes ont étudié les facteurs génomiques de la longévité (Teo SP (2022) Qeios). La majorité d’entre elles sont basées sur des données de puces de génotypage (Sebastiani et al. (2017) J Gerontol A Biol Sci Med Sci, Zeng et al. (2016) Sci Rep). Récemment, Garagnani et al. (2021), Elife ont analysé les séquences génome-entier d’un peu moins d’une centaine de centenaires et ont trouvé des résultats encourageants.

C’est dans ce contexte que nous proposons ce sujet de thèse qui vise à exploiter à l’aide des tous les outils bioinformatiques disponibles les cohortes exceptionnelles du CEPH comme la cohorte Chronos incluant 1071 centenaires pour étudier les variants rares et trouver de nouvelles pistes biologiques pour la prévention et le traitement des maladies du grand âge. En effet, une étude génétique préliminaire avait été réalisée sur Chronos en 2014 avait retrouvé le rôle du locus d’ApoE. Cependant, les méthodes et bases de données ont beaucoup évolué depuis permettant d‘envisager d’exploiter davantage les échantillons de cette cohorte. D’autre part, en comparaison avec les variants dits communs dans la population qui ont le plus souvent des effets modérés sur les différentes pathologies humaines, les variants rares (<1%) peuvent avoir un impact important sur des phénotypes extrêmes. L’article publié par une équipe italienne déjà cité précédemment (Garagnani et al. (2021), Elife) regarde les variants rares de 80 centenaires et montre des résultats intéressants confirmant l’intérêt des variants rares pour le phénotype centenaire malgré un effectif faible. L’étude des variants rares dans la cohorte CHRONOS semble donc très prometteuse pour identifier de nouveaux gènes impliqués dans la longévité. 

Plus effectuer cette étude, le doctorant aura accès à  des données de séquençage génome-entier sur la totalité de la cohorte CHRONOS (pour le moment, les données sont disponibles pour une centaine de centenaires) et pourra utiliser pour les analyses les différentes cohortes en population générale (Constances, E3N/E4N, Milieu Intérieur, UKBiobank) mais aussi avec des cohortes de patients français atteints de maladies du vieillissement et du grand âge (Alzheimer, Parkinson, cancer, …). La thèse peut alors se scinder en 3 parties principales.

La première partie sera une étape de prétraitement et de contrôle qualité des différents jeux de données. En effet, ceux-ci ont été produits à des moments différents dans des laboratoires différents ce qui implique des technologies et des pipelines différents. La première partie réside donc dans l’uniformisation des données afin de permettre l’étude conjointe des variants rares. Le ou la doctorant(e) sera amené notamment à faire de l’imputation de données comme le logiciel GLIMPSE adapté à l’imputation de variants rares (Rubinacci et al. (2021) Nat Genet) pour les jeux de données produits sur des puces de génotypage ou à partir de séquençage faible profondeur. Il devra alors concaténer les différents jeux de données puis appliquer des métriques de contrôle qualité ainsi qu’introduire des filtres de bases de données extérieures afin d’assurer au mieux la fiabilité des résultats suivants. Cette partie sera l’occasion de tester différents pipelines publiés et de potentiellement en proposer un nouveau adapté dans l’analyse de variants rares sur différents types de jeux de données.

La seconde partie consistera en l’étude des variations de fréquences rares avec la longévité et la résistance aux maladies par séquençage génome-entier. Ce type d’analyses peut s’effectuer à différents niveaux :

  • au niveau des variants (les variations d’un seul nucléotide ainsi que les courtes insertions et délétions (Indels)) afin de déterminer si leur fréquence diffère entre les centenaires et les cohortes en population évoquées précédemment.
  • au niveau des gènes avec des méthodes d'agrégation de variants (Burden test et SNP-set Kernel Association Test, Ionita-Laza et al, 2013). Ces méthodes permettent de pallier le manque de puissance statistique inhérent à l’analyse d'événements rares, en agrégeant les effets des différents variants rares (et même éventuellement communs) au sein d’un même gène.
  • au niveau des pathways, les méthodes statistiques évoquées au point précédent peuvent également permettre de regarder l’effet d’un pathway (ensemble de gènes intervenant dans la même voie biologique).
  • au niveau du génome entier, le ou la doctorant(e) pourra également regarder la quantité de variants rares voire privés enfin être comparée entre les centenaires de la cohorte CHRONOS et les autres cohortes disponibles. 

Enfin, dans la dernière partie de la thèse, les résultats pourront être exploités dans la construction d’un score de risque polygénique (PRS) associé à la longévité et constitué uniquement de variants rares agrégés par gène pourra également être défini à partir des résultats de ces méthodes. Il conviendra alors d'évaluer si ce score génétique est véritablement prédictif de la longévité sur une cohorte indépendante.

Cette thèse aura lieu à Evry au Centre National de Recherche en Génomique Humaine (CNRGH) qui vise à répondre aux questions scientifiques nécessitant des besoins de séquençage et de génotypage à haut débit grâce au développement et à la mise en œuvre de technologies innovantes et intégrées. L'organisation du CNRGH permet d'optimiser la recherche en génétique et en génomique des maladies humaines, en créant les liens indispensables entre la constitution des cohortes (échantillons d'ADN), l'identification des gènes responsables, l'étude du transcriptome et de l'épigénome.

Plus précisément, cette thèse se déroulera au sein de l’équipe MathStats du CNRGH et sera dirigée par Jean-François Deleuze, le directeur du centre, et co-encadrée Claire Dandine-Roulland

Candidature

Procédure : Envoyer un mail à l'adresse indiquée avec un CV et une lettre de motivation.

Date limite : 31 mai 2023

Contacts

Claire dandine-Roulland

 daNOSPAMndine@cng.fr

Offre publiée le 6 avril 2023, affichage jusqu'au 31 mai 2023