Analyse de données Pore-C pour la détection d’interactions multiples de la chromatine
Stage · Stage M2 · 6 mois Bac+5 / Master CEA/CNRGH · Evry (France) Gratification de 700€ brut minimum, Indemnité de logement (~200€) hors Ile-de-France
Date de prise de poste : 1 février 2024
Mots-Clés
Pore-C, Nanopore, Chromatine, Interactions multiples
Description
Le contexte :
Le Centre National de Recherche en Génomique Humaine (CNRGH) est un département du CEA localisé à Evry. Les activités du centre sont principalement axées sur le développement de technologies de séquençage et de génotypage ainsi que l’avancée en recherche en génétique et génomique humaine.
Le projet est une collaboration entre le laboratoire de Bio-Analyse (LBA) et le laboratoire de Génomique Fonctionnelle (LGF) - équipe Chromatine et organisation 3D du génome au sein du CNRGH.
Le stage :
Le projet de stage de Master 2 en bio-informatique/bio-analyse que nous proposons pour une durée de 6 mois, correspond à l’analyse de données Pore-C par des méthodes bio-informatiques.
L’approche Pore-C permet de capturer les interactions multiples de la chromatine par séquençage long fragment avec la technologie Oxford Nanopore, c’est à dire de séquencer toutes les régions du génome qui sont en contact et qui sont impliquées dans un même groupe d’interaction.
L’objectif du stage sera de lancer un workflow bio-informatique sur des données Pore-C et d’analyser les interactions multiples de la chromatine.
Dans un premier temps, l’étudiant(e) devra faire une petite étude bibliographique afin de comprendre la thématique et ses enjeux. Par la suite, il faudra tester le lancement du workflow implémenté en Nextflow, proposé par le papier de référence de l’approche Pore-C (Deshpande et al., Nature Biotechnology, 2022). Le lancement du workflow sur plusieurs données publiques et également celles générées par le LGF nécessitera une étape d’automatisation afin de pouvoir facilement le lancer sur tous les échantillons en s’adaptant à l’architecture informatique du CNRGH. Un second objectif sera d’optimiser le lancement d’un package R (Chromunity) permettant l’analyse des interactions multiples obtenues à l’issue du workflow.
Pendant son stage, le candidat travaillera principalement dans un environnement Unix et devra lancer les analyses sur des clusters de calculs distants. Les langages utilisés seront Bash, R et Python. Une connaissance de git pour l’organisation et le partage de scripts ainsi que du langage Nextflow pour l’automatisation de workflow serait un plus.
Prérequis :
Connaissance bio-informatique, génomique et programmation (R, Bash, Python). Familiarité avec un travail en ligne de commande (Unix) et avec l’utilisation d’un cluster de calcul. Souhait de travailler au sein d’une équipe pluridisciplinaire (biologie / bio-informatique). Autonomie et prise d’initiation. Bonne pratique de l’anglais (lu, écrit, parlé).
Encadrantes:
- Solène Brohard, CEA/CNRGH/LBA
- Sophie Chantalat, CEA/CNRGH/LGF
Candidature
Procédure : Envoi du CV et de la lettre de motivation par mail.
Date limite : 31 octobre 2023
Contacts
Solène Brohard
brNOSPAMohard@cnrgh.fr
Offre publiée le 15 septembre 2023, affichage jusqu'au 31 octobre 2023