Enseignant chercheur en simulation moléculaire et ingénierie des données : vers une recherche plus ouverte
Le 26/03/2025
Carte d'identité
Pierre Poulain |
---|
- statut : enseignant chercheur
- formation : diplôme d’ingénieur chimiste à l'Ecole Nationale Supérieure de Chimie de Montpellier (ENSCM), Master en Chimie-informatique à l'université de Manchester, doctorat de physique à l'Université Claude Bernard Lyon 1.
- poste : recherche effectuée au Laboratoire de Biochimie Théorique, à l’Institut de Biologie Physico-Chimique, à Paris.
|
Entretien
Quels sont vos domaines de recherche ou d’expertise, en quoi cela consiste ?
Mon parcours professionnel a été très varié et pluridisciplinaire. Dans mon projet de recherche actuel, je m’intéresse aux données de simulations de dynamique moléculaire. La dynamique moléculaire est une technique de simulation numérique qui modélise le mouvement des atomes d’un système moléculaire en fonction du temps. Cette méthode de simulation est très largement employée : depuis la biologie moléculaire jusqu’au drug design, en passant par la science des matériaux. Je m’intéresse particulièrement aux données produites par ces simulations, comment elles sont partagées et diffusées. Compte tenu du coût important, notamment en termes d’infrastructure de calcul et d’énergie, nécessaire pour produire de telles simulations, il me semble important de faire en sorte qu’elles soient partagées et réutilisées le plus possible.
Aussi enseignant, j’interviens dans des enseignements de programmation (Python), de modélisation et d’analyse de données. Je me suis formé à la pédagogie pour proposer à mes étudiant·e·s une expérience d’apprentissage qui soit la plus engageante et enrichissante possible.
À l'interface entre plusieurs disciplines, avec qui collaborez-vous ? Quel type de collaboration est-ce ?
J’ai souvent collaboré avec des biologistes ou des cliniciens dans des projets précédents. Actuellement, dans le cadre du projet européen LUMEN, je collabore avec des collègues des sciences humaines et sociales, des mathématiques et des sciences du système Terre qui ont des questions similaires sur le partage et la réutilisation des produits de la recherche. Concrètement, nous comparons nos pratiques de partage des produits de la recherche, comme les données, les publications, mais également les codes sources logiciels. Par exemple, la communauté des sciences du système Terre a mis en place de nombreux entrepôts de données dédiés pour leur discipline alors qu’en sciences humaines et sociales, la plateforme GoTriple facilite l’exploration des publications et des données du domaine. Dans un contexte de science ouverte, nous confrontons nos pratiques afin que chaque communauté puisse partager et réutiliser ses données, ses publications, ses codes sources, le plus largement et efficacement possible. Enfin, au-delà des disciplines, nous essayons aussi de faire en sorte que les produits de la recherche soient accessibles et utilisables par d’autres communautés que leur communauté d’origine.
Quel avenir imaginez-vous pour la bioinformatique ?
Produire des données est aujourd’hui relativement facile et peu (moins) coûteux. Leur exploitation reste toutefois un problème complexe, qui nécessite un dialogue constant entre plusieurs domaines d'expertise.
J’imagine que la bioinformatique va continuer à rester une science à l’interface, rassemblant des compétences variées et complémentaires, notamment pour mieux exploiter, analyser, partager les données produites.
Votre message à destination des étudiants/jeunes bioinformaticiens ?
Si l’exploitation des données est un défi, celui-ci nécessite des méthodologies, logiciels et infrastructures informatiques de plus en plus sophistiqués pour être relevé. Je conseillerai aux jeunes bioinformaticien.ne.s de développer de solides compétences en informatique et en gestion de données : contrôle de versions (git, GitHub), gestion d’environnements logiciels (uv, conda, pixi, docker…), développement logiciel (tests, documentation), programmation web, base de données, gestionnaire de workflow, plan de gestion de données.