Stage de M2 de génomique/bioinformatique

 Stage · Stage M2  · 6 mois    Bac+5 / Master   Laboratoire GBCM, Conservatoire National des Arts et Métiers / société Isoft · Paris (France)  Indemnité de stage voire salaire selon profil

 Date de prise de poste : 8 janvier 2024

Mots-Clés

Omics, bioinformatique, traitement des données, étiologie moléculaire, santé humaine, cible thérapeutique

Description

Proposition de stage de Master 2 :
Exploitation des données transcriptomiques et génomiques de l’infection Chikungunya avec le logiciel Amadea

Encadrants responsables du stage : Pr Jean-François Zagury (Laboratoire GBCM, Cnam), Dr Jean-Philippe Meyniel (ISoft).


Description :
L’équipe de bioinformatique du Laboratoire GBCM du CNAM, spécialisée dans l’étude des maladies humaines par la bioinformatique, a pour but une meilleure compréhension des mécanismes moléculaires des maladies et par conséquent, le développement rationnel de nouvelles approches diagnostiques ou thérapeutiques. Elle dispose des données génomiques et transcriptomiques de patients infectés par Chikungunya lors de la pandémie de 2006, et souhaitent comparer ceux qui ont des manifestations cliniques chroniques post-infection (n=120) avec ceux qui n’ont pas de symptômes au long cours (n=120).
Lors de ce stage, nous proposons d’utiliser Amadeome, la plateforme bioinformatique d’ISoft, dédiée à l’analyse multiomique et basée sur la technologie de Data Morphing, pour étudier les transcriptomes issus des PBMCs (cellules du sang périphérique) de ces sujets et les génomes de ces patients. L’étudiant devra se familiariser avec les techniques de comparaison de transcriptomes, et mettre en œuvre les méthodes pour retrouver les transcriptomes (“déconvoluer“ les données) selon les sous-types cellulaires présents dans les PBMCs (i.e. granulocytes, monocytes-macrophages, lymphocytes CD4, CD8, lymphos B etc...) et implémenter ces méthodes pour les utiliser de manière interactive grâce à la plateforme Amadeome. La technologie de Datamorphing utilisée par ce nouvel environnement a déjà permis de régler avec succès ce type de défis informatiques, sans avoir à se former à un mode de programmation particulier. En effet, elle permet de se focaliser sur l’analyse des données biologiques sans avoir à programmer de lignes de code, et en définissant des pipelines d’analyse qui conservent en permanence un lien avec l’interprétation biologique. Avec ce type d’approche, l’utilisateur peut suivre la transformation des données pas-à-pas, identifier et corriger immédiatement les anomalies et s’assurer ainsi des résultats d’un haut niveau de qualité, ayant un sens biologique évident.
Le Laboratoire GBCM a déjà débuté l’exploitation des données de transcriptomes et a trouvé plusieurs signaux très intéressants au niveau des PBMCs. En complément à ces résultats, il apparaît très intéressant de réaliser des analyses plus fines et de faire les analyses comparatives en fonction des sous-types cellulaires présents dans les PBMCs.
Au cours de son stage, le stagiaire aura pour premier objectif de bien comprendre le jeu de données (transcriptome, génomes) et s’approprier les résultats déjà obtenus. Dans un deuxième temps, il utilisera la plateforme Amadeome pour intégrer ces données, mettre en place le pipeline d’analyse, et exploiter les transcriptomes imputés au niveau des sous-types cellulaires. Si le temps le permet, il pourra ensuite réaliser l’exploitation des données génomiques en transposant de la même façon les approches conventionnelles pour traiter les données de manière interactive avec la plateforme Amadeome.
En pratique, il devra donc se familiariser avec l’environnement d’analyse fourni par la plateforme Amadeome, spécialement conçue pour l’exploitation rapide des données à grande échelle, et implémenter un pipeline de traitement des données omiques des patients infectés par Chikungunya et de leurs contrôles : nettoyage des données, tests sur différents groupes, et recherche de corrélations et déduction des gènes et variants impliqués dans la chronicité des symptômes post-infection.
A l’issue du stage, une thèse pourra être envisagée avec la poursuite du projet sur une base élargie à d’autres études omiques en cours dans les équipes.


Compétences à acquérir lors du stage :
Maitrise des techniques d’analyse intégrative à partir de l’ensemble des outils et données à disposition : acquisition d’un point de vue global
Capacité à rapidement créer des pipelines réutilisables et adaptés aux environnements de production.
Outils bioinformatiques pour l’analyse et la comparaison des génomes et des transcriptomes.

Profil du stagiaire :
Un bioinformaticien qui connaît bien la biologie ou un biologiste qui connaît la génétique et qui aime traiter les données sur ordinateur (capacité de scripts simples).

Contacts : Prof. J-F Zagury : zagury@cnam.fr, Dr J.Ph.Meyniel : meyniel@isoft.fr.


Adresse du stage :
Laboratoire GBCM, Conservatoire National des Arts et Métiers, 2 rue Conté, 75003 Paris
ISoft, Parc des Algorithmes, Bâtiment Euclide, Route de l’Orme, 91190 Saint-Aubin

Candidature

Procédure : Candidater par email auprès de Prof. J-F Zagury : zagury@cnam.fr, Dr J.Ph.Meyniel : meyniel@isoft.fr

Date limite : 23 décembre 2023

Contacts

Pr Zagury, Dr Meyniel

 meNOSPAMyniel@isoft.fr

Offre publiée le 17 novembre 2023, affichage jusqu'au 23 décembre 2023