Inférences ab-initio de voies métaboliques chez des eucaryotes marins

 Stage · Stage M2  · 6 mois    Bac+5 / Master   IRISA · Rennes (France)  Gratification de stage en vigueur

 Date de prise de poste : 1 janvier 2024

Mots-Clés

biologie des systèmes, transformations moléculaires, programmation par contraintes, chémoinformatique

Description

Contexte. Le séquençage de la diversité est en train de basculer du monde bactérien au monde eucaryote. En biologie marine, le programme Phaeoexplorer a permis de séquencer des dizaines de génomes de macro-algues. Il est précurseur du programme Atlasea qui vise à séquencer des milliers d’eucaryotes marins. Une question qui se pose est de développer des approches pour exploiter ces génomes. L’équipe Dyliss et la station biologique de Roscoff développent des approches pour caractériser la diversité des organismes marins en termes de capacité à produire des composés métaboliques. Différentes méthodes ont été développées pour interpréter les informations relatives aux séquences de gènes associées à des enzymes dans les génomes en cartes métaboliques pour avoir une première vue des voies de synthèse des espèces et leurs spécificités. Ces travaux ont permis de développer des briques méthodologiques pour créer des catalogues de cartes métaboliques pour des familles d’eucaryotes permettant de les comparer et d’en identifier les spécificités malgré l’hétérogénéité de la qualité de leurs génomes (Belcour et al., 2023).

Cependant, ces approches s’appuient principalement sur les fonctions déjà associées aux enzymes, et sont limitées pour l’identification de voies de synthèse découlant de fonctions enzymatiques inconnues ou spécifiques à certaines espèces : on aborde ainsi la question de l’exploration de la « matière noire génomique » (Zhang et Moore, 2015).

Une approche complémentaire à celle basée sur des génomes est d’exploiter les connaissances sur la composition chimique et la diversité des molécules identifiées chez différentes espèces proches pour caractériser les différentes chaines de synthèses qui sont possibles chez une espèce donnée. A titre de cas d’étude, nous avons observé lors de travaux sur la voie des stérols de l’algue rouge C. crispus (Belcour et al., 2020) que les constructions de cartes métaboliques basées sur les génomes ne permettent pas de rendre compte de la flexibilité adaptative des espèces dans certaines voies de synthèse. Pour cela, nous avions développé une approche, implémentée dans le programme pathmodel, qui consistait à générer manuellement un espace des transformations chimiques possibles à partir de connaissances sur une famille d’espèce, et ensuite de développer un raisonnement abductif (problèmes de satisfiabilité) pour identifier les chaines de transformation cohérentes avec les mesures expérimentales sur les molécules. Cela a permis de prédire que la voie de synthèse du cholestérol chez les algues rouges pourrait être constituée de blocs de transformations apparaissant chez la tomate et chez les algues brunes (Girard et al., 2021).

Objectifs

Le but du stage est de travailler à l’automatisation et à la généralisation de cette approche visant la prédiction de voies de synthèses métaboliques pour des eucaryotes en tenant compte de la composition chimique (spectrométrie de masse) et de la diversité des molécules identifiées chez différentes espèces proches (connaissances taxonomiques et phylogénétiques). Cette approche basée sur l’inférence de transformations moléculaires est bien connue en santé humaine, en particulier en toxicologie (Conan et al., 2021), et s’appuie sur un grand nombre de mesures réalisés dans différents contextes qui ne sont pas disponibles sur les organismes non modèles. Une autre approche est basée sur l’extraction de connaissances (Duigou et al., 2019) pour fournir des canevas de voies de synthèses mais ne tient pas compte des capacités enzymatiques des espèces. L’objectif du stage est d’utiliser en contrepartie les informations sur des organismes proches pour prédire des voies de synthèse.

Le cas d’étude concernera l’étude de la variabilité de la synthèse des oxylipines chez les algues brunes, en particulier les laminales et les ectocarpales, pour lesquelles la station biologique de Roscoff dispose à la fois de génomes, de listes de molécules identifiées chez différentes espèces, ainsi que de données métabolomiques (Ritter et al., 2008).

D’un point de vue méthodologique, l’objectif sera d’utiliser des approches basées sur des technologies du web sémantique pour extraire des sources de données publiques (ChEBI, Rhea, Retrorules) les informations sur les transformations chimiques existant dans le vivant et définir une banque de transformations moléculaires possibles dans le vivant. Il faudra ensuite classifier ces réactions en grande famille, comme cela est fait en santé humaine ou en biologie végétale (Conan et al., 2021, Elser et al., 2023), et associer à chaque réaction un score de faisabilité chez un organisme considéré, en tenant compte des informations connues chez des espèces proches. On pourra ainsi formuler sous la forme de problème d’optimisation la recherche d’une voie de synthèse en étendant l’approche développée dans pathmodel (Belcour et al., 2020) pour une validation sur les voies de synthèse des stérols puis des oxylipines chez les algues brunes.

Ces travaux ouvriront la possibilité de tenir compte dans le futur d’autres informations pour affiner les espaces de recherche : génomes ancestraux et leur métabolisme, structure des enzymes impliquées dans les chaines de transformation.

Le stage sera basé à l’IRISA Rennes avec des visites prévues à Roscoff : co-encadrement Anne Siegel pour l’équipe Dyliss et Gabriel Markov pour la station biologique de Roscoff.

Candidature

Procédure : Envoyer un mail à anne.siegel@irisa.fr et gabriel.markov@sb-roscoff.fr

Date limite : None

Contacts

Anne Siegel

 anNOSPAMne.siegel@irisa.fr

Offre publiée le 15 septembre 2023, affichage jusqu'au 1 novembre 2023