Développement d’outils bioinformatiques dédiés à l’analyse de séquences d’anticorps.
Stage · Stage M2 · 6 mois Bac+5 / Master Laboratoire CRMSB (Centre de Résonance Magnétique des Systèmes Biologiques), Bordeaux · Bordeaux Cedex (France)
Date de prise de poste : 6 janvier 2025
Mots-Clés
Pathologies cardiaques, Thérapie ciblée et personnalisée, biostatistics, analyse séquence
Description
Titre : Développement d’outils bioinformatiques dédiés à l’analyse de séquences d’anticorps.
Localisation géographique du poste (adresse complète) : Laboratoire CRMSB
146 Rue Léo Saignât 33096 Bordeaux Cedex
Personne à contacter pour tout renseignement : Gisèle Clofent-Sanchez, gisele.clofent-sanchez@rmsb.u-bordeaux.fr
Contexte :
Le projet ABCardionostics vise à apporter de nouveaux outils pour la détection précoce des plaques d’athérome instables responsables de pathologies cardiaques telles que l’infarctus et accident vasculaire cérébrale, de façon à proposer pour une thérapie ciblée et personnalisée des patients.
Un des principaux objectifs du projet est d’apporter une thérapie personnalisée basée sur l’ingénierie d’anticorps humains. Les anticorps sous format scFv (VH+VL) ont été sélectionnés in vivo et séquencés à l'aide de la technologie NGS PacBio. Le stage vise à analyser les séquences générées pour identifier les scFv pertinents spécifiques des plaques d'athérome. Il s’agira de faire des analyses statistiques pour évaluer l’occurrence des séquences les plus représentées à partir des données NGS VH et VL selon deux items : 1) l’abondance des séquences VH, VL ou l’abondance de la combinaison VH-VL ; 2) l’abondance d’une séquence unique donnée d’un anticorps monoclonal identifié par des techniques biologiques classiques et de ses variants. Il s’agira ensuite de réaliser une classification des séquences les plus représentées. Les 100 séquences scFv uniques les plus enrichies seront sélectionnées.
En parallèle, il sera nécessaire de réaliser des analyses bioinformatiques et statistiques sur les données protéomiques obtenues via la spectrométrie de masse, ciblant les protéines surexprimées dans les plaques d'athérome. Ces analyses constitueront une base solide pour identifier les cibles des anticorps étudiés. Les fonctionnalités du logiciel Ingenuity Pathway Analysis (IPA) aideront à concevoir et développer des modules d'analyse pertinents pour les données protéiques, en explorant les réseaux moléculaires et les interactions biologiques.
Pour enrichir l’interprétation biologique des résultats, des requêtes seront réalisées via une API connectée à diverses bases de connaissances complémentaires. Par exemple, la base STRING, spécialisée dans les réseaux biologiques et notamment les interactions protéine-protéine (PPI), sera exploitée pour approfondir la compréhension des interactions fonctionnelles entre les protéines. De plus, les annotations issues de la Gene Ontology (GO) seront envisagées pour annoter les protéines candidates, afin de mieux cerner leurs fonctions biologiques.
Objectifs :
Ce projet consiste à développer un outil client, utilisant les nouvelles technologies de développement web, dédié à l’analyse de lectures de séquences d’environ 1000 paires de bases d’anticorps intégrant la caractérisation des régions variables d’après les standards IMGT _ https://www.imgt.org/HighV-QUEST/ (définition des CDR, FR, mutations ...). Plus spécifiquement, cet outil intégrera plusieurs fonctionnalités :
- Chargement et stockage des lectures de séquences.
- Alignement et comparaison des séquences via des algorithmes comme Smith-Waterman.
- Analyse statistique descriptive des séquences.
- Automatisation de requêtes vers des bases de connaissances pour obtenir des informations biologiques sur les protéines.
- Identification et analyse des régions hypervariables à l’aide de méthodes de l'algorithmique du texte à l'analyse des séquences nucléiques en bioinformatique,
L'objectif est de créer un environnement interactif et intuitif pour faciliter l’analyse des séquences génétiques à grande échelle. Une attention particulière sera également apportée à la visualisation de résultats pour faciliter l'annotation des séquences candidates en vue de futures analyses.
Profil recherché
Étudiant(e) en Master 2 Bioinformatique, vous disposez des compétences suivantes :
● Connaissances en (bio)statistique et biologie
● Maîtrise des langages R et/ou python
● Motivation pour évoluer dans un environnement pluridisciplinaire
● Rigueur et esprit de synthèse, capacité à travailler en équipe.
Contacts :
thebault@labri.fr
gisele.clofent-sanchez@rmsb.u-bordeaux.fr
marie-josee.jacobin-valat@rmsb.u-bordeaux.fr
Candidature
Procédure :
Date limite : None
Contacts
Gisèle Clofent-Sanchez
giNOSPAMsele.clofent-sanchez@rmsb.u-bordeaux.fr
Offre publiée le 11 octobre 2024, affichage jusqu'au 10 décembre 2024