M2 : analyse de données snRNAseq
Stage · Stage M2 · 6 mois (renouvelable) Bac+5 / Master Inserm - Université Paris Cité (Institut Imagine - PARCC) · Paris (France)
Date de prise de poste : 1 février 2025
Mots-Clés
annotation de données de séquençage unicellulaire à haute dimension snRNAseq omics génétique maladie cardiovasculaire biomarqueurs
Description
Master 2 en Bioinformatique
Analyse de données de snRNAseq sur un modèle murin du syndrome d’Ehlers Danlos vasculaire
Introduction
Le syndrome d’Ehlers-Danlos vasculaire (SEDv) est une maladie rare (fréquence de l’ordre de 1/50 000), caractérisée par des complications spontanées sévères, en particulier des dissections et ruptures artérielles. Cette maladie génétique est due à des variants pathogènes du gène COL3A1, codant pour le collagène de type III, un composant essentiel de la paroi vasculaire. La physiopathologie de ce syndrome reste mal connue et l’étude de modèles murins permet de mieux comprendre les mécanismes moléculaires et cellulaires sous-jacents.
Le single-nuclei RNA sequencing (snRNAseq) permet d’obtenir une vue très fine de l’expression des gènes au niveau de chaque cellule. Cette approche est particulièrement utile pour analyser les populations cellulaires et les voies de signalisation spécifiques affectées dans des tissus complexes comme l’aorte thoracique, qui contient différentes couches de tissus (intima, media, adventice).
Objectifs du stage
L’objectif de ce stage, d’une durée de 6 mois, sera d'analyser des données de snRNAseq générées à partir de l’aorte thoracique descendante de souris C57BL/6 porteuses d’une mutation hétérozygote du gène COL3A1 dans plusieurs conditions expérimentales. Les données déjà produites à partir de noyaux isolés des cellules de l’aorte, permettront d'explorer les altérations transcriptionnelles et les voies de signalisation affectées dans ce modèle murin. Ce stage constitue une opportunité pour acquérir une expérience de recherche dans le domaine de la bioinformatique appliquée à l’étude de maladies génétiques dans un contexte de recherche translationnelle.
Les missions principales incluent :
- Les analyses (non supervisée puis supervisée) des différentes populations cellulaires présentes dans l’aorte thoracique descendante et comparaison entre les groupes de souris (mutées vs. contrôles).
- L’analyse transcriptionnelle identifiant les gènes différentiellement exprimés et étude de leur implication biologique.
- La détermination des voies de signalisation et des processus biologiques potentiellement impliqués dans le SEDv.
Prérequis
Ce stage s’adresse à un étudiant en Master 2 intéressé par la bio-informatique et les approches computationnelles en biologie. Une formation universitaire préalable en biologie moléculaire, génomique et bio-informatique est nécessaire. Le/la candidat.e doit posséder des compétences de base en programmation (Python ou R), ainsi qu’une familiarité avec l’environnement Linux. Une première expérience avec l’analyse de données omiques, particulièrement en transcriptomique, serait fortement appréciée. Une compréhension des concepts biologiques, tels que la transcription et les voies de signalisation, est également souhaitable. Une connaissance des approches d’annotation fonctionnelle (par exemple, enrichissement de pathways) et des bases de données biologiques de référence (telles que Ensembl, NCBI, KEGG ou Reactome) serait un atout important.
Compétences à développer durant le stage
Au cours de ce stage, l’étudiant.e développera des compétences avancées en analyse de données de snRNAseq, incluant des approches de clustering, d’identification de gènes différentiellement exprimés, et d’annotation fonctionnelle.
- Compétences en pré-traitement, intégration et annotation de données de séquençage unicellulaire à haute dimension.
- Expertise dans l’identification de biomarqueurs cellulaires clés et l’interprétation de leurs implications biologiques dans le contexte de maladies génétiques rares.
- Maîtrise des langages de programmation tels que Python et R pour l’analyse de données, l’apprentissage automatique et la visualisation.
- Expérience dans la gestion et l’analyse de grands jeux de données biologiques à l’aide d’outils comme NumPy, Pandas et Scanpy.
- Familiarité avec les frameworks de deep learning (par exemple, PyTorch) et les bibliothèques de machine learning (par exemple, Scikit-learn).
- Compréhension des environnements de calcul haute performance pour la mise à l’échelle des workflows d’analyse de données unicellulaires.
Encadrement
L’étudiant sera encadré par le laboratoire de bio-informatique clinique dirigé par le Dr Antonio Rausell à l’Institut Imagine (Paris) pour la partie technique et méthodologique de l’analyse des données. Un suivi et une coordination pour l’interprétation biologique des résultats seront assurés par une équipe du PARCC (Paris Centre de Recherche Cardiovasculaire) qui travaille sur la physiopathologie du SEDv.
Candidature et date du stage
CV et lettre de motivation à envoyer à antonio.rausell@aphp.fr + isabelle.jeru@aphp.fr en précisant votre expérience en bio-informatique et votre intérêt pour le projet. Ce stage, d’une durée de 6 mois pourra commencer à partir de février 2025 (date exacte à fixer avec l’étudiant.e).
Candidature
Procédure : CV et lettre de motivation à envoyer à antonio.rausell@aphp.fr + isabelle.jeru@aphp.fr en précisant votre expérience en bio-informatique et votre intérêt pour le projet. Ce stage, d’une durée de 6 mois pourra commencer à partir de février 2025 (date exacte à fixer avec l’étudiant.e).
Date limite : None
Contacts
Antonio Rausell - Isabelle Jéru
anNOSPAMtonio.rausell@aphp.fr
Offre publiée le 17 décembre 2024, affichage jusqu'au 15 février 2025