Stage Bioinformatique - Identification de mutations associées à des paramètres cliniques dans la LAM
Stage · Stage M2 · 6 mois Bac+5 / Master Centre de Recherche en Cancérologie de Toulouse · Toulouse (France)
Date de prise de poste : 6 janvier 2025
Mots-Clés
Bioinformatique Machine Learning RNAseq Cancer Métadonnées
Description
Equipe de recherche
Les événements post-transcriptionnels touchant les ARN permettent de contrôler
l’expression génique rapidement et à moindre cout énergétique pour la cellule. Ils sont
particulièrement sollicités lorsque les cellules sont soumises à un environnement stressé,
comme dans une tumeur maligne ou sous l’effet de traitements anti-tumoraux. Ils peuvent
alors contribuer aux processus d’adaptation nécessaires à la transformation maligne et/ou à
la résistance aux traitements.
Dans une perspective clinique, par des approches combinées de séquençage nouvelle
génération et haut débit des ARN (« bulk » ou « single-cell RNAseq ») et d’imagerie
cellulaire et tissulaire, notre équipe explore l’ensemble du répertoire des ARN (ARNm
codants et ARN régulateurs non codants incluant les miRNAs, lncRNAs et circRNAs) et son
hétérogénéité au sein de la tumeur, dans les cohortes de patients atteints de tumeurs
hématologiques (leucémies aiguës et lymphomes anaplasiques). L’objectif est l’identification
de nouvelles cibles thérapeutiques et/ou de sensibilisation aux traitements existants.
Sur un plan cognitif et mécanistique, l’équipe met ensuite en œuvre les approches
expérimentales moléculaires (gain/perte de fonction), cellulaires et in vivo (modèles
génétiques et avatars de tumeurs humaines ou PDX) permettant à la fois la caractérisation
fonctionnelle des cibles potentielles et la description de leurs mécanismes d’action. En
partenariat avec des industriels, la possibilité de les cibler par des molécules à potentiel
thérapeutique est également explorée.
Sujet de stage : Développement d'une approche d’identification et de
sélection de mutations associées à des paramètres cliniques dans la
leucémie aiguë myéloïde à partir de données RNAseq
Contexte :
L’accumulation d’altérations génétiques somatiques et/ou l’existence de mutations
germinales contribue à la transformation d’une cellule saine en une cellule cancéreuse, et il
apparaît également aujourd'hui un rôle crucial des mutations dans la réponse aux
traitements des cancers. L’étude du transcriptome, via le RNAseq, permet d’accéder à
l’ensemble des variations exprimées chez un patient ainsi qu’aux régulations transcriptionnelles et post-transcriptionnelles.
Pour pouvoir analyser le transcriptome de larges cohortes de patients, l’indexation de
données RNAseq basée sur les k-mers a prouvé son efficacité. Transipedia.org a
récemment été développé par nos collaborateurs (Bessière et al. Genome Biol. 2024) pour
faciliter l’accès et l’exploration de grands jeux de données RNAseq. Notre équipe
s’intéressant aux ARN dans les hémopathies malignes, nous développons un outil de
détection automatique de variants (mutations, fusions, épissage alternatif) s’appuyant sur les
k-mers. Cependant, sélectionner les mutations les plus pertinentes parmi un grand
ensemble de variations reste un défi.
Ce stage propose de développer un outil s’appuyant sur un modèle de machine learning
supervisé pour sélectionner les mutations ayant le plus d’intérêt clinique, notamment la
résistance aux traitements, en utilisant les données de RNAseq et cliniques de larges
cohortes de patients. L’application sera faite sur plus d’un millier de patients atteints de
Leucémie Myéloïde Aiguë (AML) distribués dans plusieurs cohortes (IUCT, BeatAML,
Leucegene).
Objectifs du stage :
1. Identifier et quantifier les mutations d’un panel de gènes : Extraire et quantifier
les mutations somatiques/germinales d’un panel de gènes à partir de données
RNAseq de patients atteints d’AML.
2. Développer un modèle de sélection de mutations pertinentes : Utiliser des
algorithmes de machine learning pour analyser ces mutations et sélectionner celles
qui sont corrélées à des paramètres d'intérêt (résistance aux traitements, survie des
patients, etc.).
3. Validation des candidats sélectionnés en tant que biomarqueurs : Comparer les
mutations sélectionnées avec les bases de données de mutations/variants connus et
avec les données cliniques des patients pour valider leur pertinence en tant que
biomarqueurs.
Compétences requises :
●Compétences en machine learning et en analyse de données.
●Maîtrise de l’environnement linux et d’au moins un langage de programmation
bioinformatique (Python, R).
Cadre du stage :
Le stage se déroulera en présentiel au CRCT (https://www.crct-inserm.fr/), au sein de
l’équipe R’n Blood (S. Pyronnet et F. Meggetto) et sera réalisé en collaboration avec l'équipe
Bio2M de l’Institut de Médecine Régénérative et Biothérapies (IRMB) à Montpellier.
‐ Encadrants : Sandra Dailhau (IE, Bioinformaticienne), Chloé Bessière (Post‐Doc,
Bioinformaticienne), Stéphane Pyronnet (DR INSERM, chef d’équipe).
Contact par mail : stephane.pyronnet@inserm.fr, chloe.bessiere@inserm.fr,
sandra.dailhau@inserm.fr
Candidature
Procédure : Envoyez CV et lettre de motivation par mail
Date limite : 13 décembre 2024
Contacts
Stephane Pyronnet
stNOSPAMephane.pyronnet@inserm.fr
Offre publiée le 25 octobre 2024, affichage jusqu'au 13 décembre 2024