Mots-Clés
ia
ai
intelligence artificielle
artificial intelligence
ecg
electrocardiogramme
research
fondation
foundation
model
ird
ummisco
Description
Conception D’un Modèle De Fondation Pour L’apprentissage De Représentations De Signaux D’électrocardiogrammes Afin De Mieux Stratifier Les Patients.
Durée : 6 mois
I. La structure que vous allez rejoindre
L’Unité Mixte Internationale de Modélisation Mathématique et Informatique des Systèmes Complexes (UMMISCO) est un laboratoire international qui rassemble des chercheurs, ingénieurs, enseignants-chercheurs et personnels administratifs dynamiques et passionnés qui développent et utilisent des approches de pointe en mathématiques (Systèmes Dynamiques, EDO, EDP, etc.) et en informatique (IA, Modélisation à base d’agents, Machine Learning, etc.) répondant à des questions liées à la science de la durabilité. Ce stage se déroulera principalement avec les équipes de chercheurs et ingénieurs d’intelligence artificielle et bio-informatique. Vous intégrez l’équipe de recherche axée sur les ECGs, cependant vous serez amené à interagir quotidiennement avec d’autres équipes de recherche de l’UMMISCO ce qui vous permettra d’étendre vos champs de connaissances en IA et en bio-informatique.
II. Objectif du stage
L’objectif de ce stage est de développer et d’évaluer un modèle de fondation, foundation model, basé sur l’apprentissage profond (deep learning) pour l’analyse des signaux d’électrocardiogramme (ECG). Il s’agira d’apprendre des représentations robustes et généralisables de l’ECG afin d’améliorer la stratification des patients. Le modèle sera entrainé sur de larges base de données d’ECG diversifiés afin de capturer des caractéristiques qui pourront être affinées pour des tâches cliniques spécifiques, telles que la prédiction de risque d’arythmie ou encore classification de maladies.
III. Vos activités seront les suivantes
-
Faire un état de l’art (literature review) :
o Méthodes d’analyse d’ECG avec des approches deep learning
o Modèles de fondation dans le domaine ECG, (eg : ViT) CNN, Transformer avec des méthodes d’apprentissage self-supervised, contrastive learning, masked learning
o Identifier des pistes d’améliorations des approches actuelles, particulièrement en généralisation, interprétabilité, robustesse au bruit d’enregistrement et à la fréquence cardiaque
-
Préparation des données d’expérimentation :
o Vous utiliserez des bases de données ECG publiques qui devront être nettoyée et structurée
o Concevoir une large base d’entrainement et de validation
-
Développement d’un modèle Fondation ECG :
o Concevoir et implémenter un modèle (CNN, Transformer, CNN+Transformer, SSM) foundation pour apprendre des représentations (embeddings) de signaux ECG, le modèle sera pré-entrainé avec des tâches d’apprentissage self-supervised
o Explorer des architectures hybrides permettant de capturer le domaine spatial et temporel de l’ECG
o Optimiser les hyperparamètres et l’architecture du modèle
o Écrire les programmes d’entrainement et les exécuter sur des environnements de calculs HPC (Kubernetes, SLURM)
-
Fine-Tuning et stratification des patients :
o Après pré-entrainement du modèle fondation, affiner (fine-tune) le modèle sur des tâches spécifiques : prédictions du risque d’arythmies, classification de maladies cardiaques
o Stratification des patients en catégories de risques à partir des représentations (embeddings) obtenues avec le modèle de fondation
-
Évaluation et validation :
o Évaluer le modèle de fondation et les modèles spécifiques sur d’autres base d’ECG afin d’évaluer leur capacité à généraliser
-
Interprétabilité des modèles spécifiques :
o Tester les méthodes d’état de l’art d’interprétabilité sur les modèles affinés afin d’identifier des patterns cliniques sur le signal ECG d’entrée
o Collaborer avec des cliniciens afin d’évaluer les méthodes d’interprétabilité
o Proposer une nouvelle méthode d’interprétabilité
Vous serez également amené à travailler sur divers thématiques simultanément, une organisation optimale du temps de travail et des priorités est primordiale.
IV. Le profil que nous recherchons
Vous terminez votre dernière année de master ou de cycle ingénieur, vous avez terminé votre master 2 ou diplôme d’ingénieur et êtes à la recherche d’un stage de 6 mois.
La recherche scientifique vous intéresse et vous envisagez de poursuivre votre parcourt en doctorat.
Vous êtes familier avec les méthodes de traitement du signal, des notions en signaux ECG sont un plus.
Vous avez des connaissances solides en :
- Apprentissage machine profond (Machine/Deep Learning)
- Data science et analyse statistiques
- Frameworks DL : PyTorch, CUDA
- Python
Vous avez des notions en :
- Science et traitement du signal
- En biologie cardiaque
- R
- Calcule HPC
Vous êtes à l’aise pour travailler en équipe, notamment avec des cliniciens, data scientists, des ingénieurs et chercheurs. Vous faites preuves des qualités suivantes : rigueur, forte motivation, bonne compréhension de la mission que nous vous proposons, esprit d’équipe et d’analyse, autonomie, organisation, proactivité et productivité.
V. Vous souhaitez candidater ?
Lieux :
- Bondy, centre Ile-de-France & Ouest IRD
- Hôpital de la Pitié Salpêtrière, faculté de médecine Sorbonne Université, Boulevard de L’Hôpital, Paris 13ème
Vous devrez envoyer votre CV et une lettre de motivation. Des lettres de recommandations de vos encadrants, enseignants seront appréciées.
Votre dossier est à envoyer à ahmad.fall @ ird.fr, alex.lence@ird.fr et edi.prifti@ird.fr.