Interview Anne Goelzer et Nadia Bessoltane
Bioinformatique et Mathématiques: outils complémentaires pour explorer la biologie des systèmes
Cartes d’identité
|
|
|
---|---|---|
|
|
Entretien
Comment a débuté votre collaboration ?
A INRAE mais aussi dans d’autres instituts, il existe des structures appelées CATI pour Centre Automatisé de Traitement de l’Information. Ce sont des lieux de production informatique ou de services en soutien à une communauté scientifique ciblée. En 2019, Anne a participé au montage du CATI SysMics (Systems Biology for Omics) autour des approches de biologie des systèmes pour l’analyse intégrative de données multi-”omiques”. Nadia a rejoint ce dernier afin de travailler sur le déploiement de méthodes statistiques exploitant des données “omiques” hétérogènes à l’aide des processus biologiques. C’est dans ce cadre que les premiers échanges entre Anne et Nadia ont eu lieu. Les premiers travaux conjoints et plus concrets ont émergé en 2021. Cette année (2024), Nadia a décidé de débuter une thèse et Anne fera partie de ses encadrants.
Quelle est la question scientifique vous ayant mené à collaborer ensemble ?
Anne et quelques équipes de l’IJPB s'intéressent à la modélisation multi-échelle des plantes intégrant des informations au niveau cellulaire, multi-cellulaire, tissulaire dans le but de mieux prédire les phénotypes de plantes en fonction des stades d'évolution ou des conditions environnementales (conditions normales qui vont servir de contrôle et conditions environnementales contraintes telles que des stress hydriques, des stress azotés et la combinaison des deux). Un des aspects de cette recherche consiste à analyser les données “omiques” générées dans ce cadre, dans le but de les intégrer entre elles et avec les informations fonctionnelles. C'est dans ce cadre que Nadia intervient avec ses collègues : Delphine Charif, bioinformaticienne et Audrey Hulot, statisticienne.
Quels sont vos domaines de recherche / d'expertise ?
Anne travaille sur la modélisation de cellules, en particulier leurs réseaux métaboliques par des approches déterministes. Elle travaille également sur l’intégration de données à travers les modèles (estimation de paramètres des modèles par exemple). Anne a initialement travaillé sur les bactéries et transite vers les plantes depuis quelques années. Elle modélise des populations de cellules de différents tissus de plantes afin de les interconnecter pour aller jusqu’à la modélisation de la plante entière.
Nadia est spécialiste dans l'analyse de données issues de séquençage haut-débit, notamment RNA-seq, DNA-seq ainsi que les données protéomique et métabolomique. Elle effectue ces analyses dans le but d'extraire et de combiner un maximum d'informations qu'elle enrichit par la suite grâce aux nombreuses bases de connaissances biologiques.
Quel type de travaux effectuez-vous dans le cadre de votre collaboration ?
Tout d'abord, pour situer le contexte, cette question scientifique a été abordée dans le cadre d'un premier projet exploratoire financé par l’INRAE, puis est maintenant approfondie dans un projet ANR multidisciplinaire regroupant des experts en biologie (IJPB, IPSiM), mathématiques (MaIAGE, MICS) et bioinformatique (IJPB, MaIAGE). Les objectifs de ce projet consistent à mieux comprendre la stratégie d’allocation de ressources de la plante Arabidopsis thaliana en combinant modélisation mathématique multi-échelle et expériences biologiques. En particulier, il s’agit de construire des modèles quantitatifs de plantes entières, de les valider expérimentalement, mais aussi de développer les outils logiciels et les algorithmes nécessaires à leur génération, calibration et simulation. Ce projet implique donc des échanges fréquents entre Anne et les expérimentalistes afin de définir le plan expérimental adéquat pour remplir les objectifs scientifiques et acquérir les données expérimentales pour la calibration et la validation du modèle.
Dans ce cadre, Anne construit, calibre et valide des modèles quantitatifs intégrant une reconstruction détaillée des processus cellulaires à partir de l’analyse de la littérature et de discussions avec des experts de l'organisme "modèle”. Les modèles représentent le fonctionnement de l'organisme et permettent ainsi la prédiction de leur phénotype (flux, concentrations de protéines, vitesse de croissance) dans une condition expérimentale donnée, et sont spécialisés par type de tissus (c'est-à-dire spécifier les processus par type de tissus ou par type de population de cellules en extrayant de l’information dans des bases de données par exemple, afin de trouver des gènes qui vont coder pour certains types de réactions).
Nadia est impliquée à plusieurs niveaux du projet tout d'abord en mettant en place les pipelines pour spécialiser les modèles en utilisant les données “omiques”. Elle travaille également à l'alignement des informations extraites sur des graphes de connaissances permettant de faire ressortir des traits pertinents non identifiés par l'utilisation des méthodes statistiques "classiques". Aussi, l'analyse et l'intégration de données multi-”omiques” (RNA-seq, métabolomique, protéomique) vont permettre une interprétation plus approfondie pour des conditions expérimentales données.
Votre environnement de travail est-il majoritairement formé de bioinformaticien·ne·s, de biologistes ou est-ce en proportion équivalente ? Est-ce une équipe plateforme, une équipe de recherche ou autre ?
Nadia travaille au sein d’une équipe proposant des services en bioinformatique. Elle travaille étroitement avec une collègue bioinformaticienne ayant le même profil qu’elle, Delphine Charif et une autre collègue statisticienne, Audrey Hulot. Elles interagissent beaucoup avec les autres équipes de recherche de l’Institut afin de leur apporter leur aide sur le volet bioinformatique dans le cadre de leurs projets de recherche.
Anne est quant à elle rattachée à une équipe de recherche, en région parisienne, spécialisée en biologie des systèmes travaillant sur des approches déterministes. Cette équipe est principalement composée de mathématiciens. Anne est en détachement au sein d’une équipe de recherche toulousaine depuis plusieurs mois, qui est composée d’informaticiens, de bioinformaticiens et de statisticiens travaillant sur des méthodes statistiques en lien avec l’Intelligence Artificielle.
Quelle est la clé pour des échanges facilités ?
Au début de cette collaboration, les échanges n’étaient pas si évidents car chaque collaborateur utilisait un vocabulaire différent, propre à son domaine de compétences. Par exemple, le terme “modèle” n’a pas le même sens pour un modélisateur, un statisticien et un bioinformaticien. Selon Anne, qui a l’habitude de travailler à l’interface de diverses disciplines depuis plusieurs années, la clé est de clarifier le vocabulaire assez tôt lors des échanges. De plus, il lui semble essentiel de s’intéresser aux questions de l’autre discipline, de rendre intelligibles ses propres questions d'intérêt aux non-spécialistes (les questions de biologistes doivent être compréhensibles -et intéressantes- pour les matheux, et inversement), et par conséquent d’être prêt à investir du temps afin de bien comprendre les avantages et limites des approches de chacun. L’idée est d’être capable de faire progresser simultanément les questions des deux disciplines, et d’éviter qu’une discipline ne soit qu’au service de l’autre.
Leurs messages
Informez-vous bien sur les divers cursus en bioinformatique proposés par les différentes structures d’enseignement. Faites bien la différence entre un diplôme en biologie avec des notions abordées en bioinformatique et un diplôme complet en bioinformatique, les notions abordées ne seront pas autant approfondies dans les deux cas. Montrez également un intérêt pour le développement de méthodes et les nouveautés !
En effet, soyez curieux et restez ouverts. Soyez sensibles à d’autres disciplines que la vôtre. N’ayez pas peur des mathématiques ! Un peu de culture en mathématiques vous permettra de mieux appréhender certains challenges et de favoriser les échanges avec vos collaborateurs dans certains projets.