Analyse des données RNA-seq et Protéomique à l'exposition aux rayonnements ionisants à Tchernobyl

 Stage · Stage M2  · 6 mois    Bac+5 / Master   Institute of Radioprotection and Nuclear Safety (IRSN) · Fontenay-aux-Roses (France)

 Date de prise de poste : 1 mars 2024

Mots-Clés

R, données multi-omiques, apprentissage automatique, Régression, Lasso, analyse statistique multivariée, biologie des systèmes

Description

L'IRSN, Etablissement Public à caractère Industriel et Commercial (EPIC) – dont les missions sont désormais définies par la Loi n° 2015-992 du 17 août 2015 relative à la transition énergétique pour la croissance verte (TECV) – est l'expert public national des risques nucléaires et radiologiques. L'IRSN concourt aux politiques publiques en matière de sûreté nucléaire et de protection de la santé et de l'environnement au regard des rayonnements ionisants. Organisme de recherche et d'expertise, il agit en concertation avec tous les acteurs concernés par ces politiques, tout en veillant à son indépendance de jugement.

Thématique:

Suite à l’accident de Tchernobyl en 1986, la radioprotection de l’environnement constitue une source de préoccupation majeure. Des études démontrent une sensibilité aux rayonnements ionisants (RI) accrue et un risque pour la santé. L’exposition à de faibles doses de RI déclenche un ensemble d’événements moléculaires et cellulaires, aboutissant à des effets physiologiques et épidémiologiques. Cependant les données dans les faibles doses sont encore contestées dû à un manque de puissance statistique et plus particulièrement dans la compréhension mécanistique des effets des RI. Pour cela, une approche multimodale est nécessaire.

 

Missions:

Nous étudions la génétique des populations et l’état physiologique d’une espèce d’amphibien (Hyla orientalis) par une approche multi-omics afin d’évaluer la trajectoire évolutive de cette espèce. Sur les différents sites de collecte des rainettes (ou : sites d’échantillonnage de populations de rainettes) autour de Tchernobyl, nous disposons de 87 sujets pour les données RNA-seq et protéomique. Le ou la candidat(e) sera impliqué en premier temps dans les analyses descriptives. Il/ elle étudiera l’effet de la dose en tenant en compte du l’effet du site comme un effet batch. Deux approches existent : la première est de « corriger » les effets batch en supprimant la variation associée au batch (par exemple la méthode de la partie résiduelle, ComBat_seq pour RNA-seq data…) et la seconde est de « prendre en compte » les effets en incluant la variable de groupe/site dans le modèle en tant que covariable (tel que MINT de mixOmix). Dans cette section, nous verrons aussi différents critères statistiques permettant d’évaluer la sélection des variables. On compare plusieurs méthodes qui permettent de ne retenir que les variables les plus pertinentes. Le ou la candidat(e) participera aussi à l’intégration multi-omics (RNA-seq et prétomique) par une analyse de données structurées en blocs, qui permet à la fois d'expliquer la variabilité de chacun des blocs (chaque modalité) et les liens entre les blocs.

Ce projet se situe dans le cadre d’un travail interdisciplinaire, en collaboration avec l’équipe d’Olivier Armant (Laboratoire de recherche sur les effets des radionucléides sur les écosystèmes) et Arthur TENENHAUS (CentraleSupelec ).

 

Profil : le stagiaire devra posséder une expérience en programmation R et une bonne connaissance des méthodes statistiques standards. Un bon niveau d’anglais est souhaitable.

Etudiant en M2 Bio-informatique (analyse et modélisation des données), Mathématiques appliquées ou Statistiques (parcours data).  Le/la candidat/e doit également avoir un intérêt pour l'application des méthodes statistiques à l'analyse de données biologiques, être autonome et enthousiaste de travaille dans une équipe interdisciplinaire.

Candidature

Procédure : Envoyez CV et lettre de motivation à GARALI ZINEDDINE Imene <imene.garalizineddine@irsn.fr>

Date limite : 18 décembre 2023

Contacts

Imene GARALI ZINEDDINE

 imNOSPAMene.garalizineddine@irsn.fr

Offre publiée le 6 octobre 2023, affichage jusqu'au 18 décembre 2023