Algorithme pour la prédiction de structure 3D des ARN

 Stage · Stage M2  · 6 mois    Bac+4   IBISC. Université d'Evry, Université Paris-Saclay · Evry (France)

 Date de prise de poste : 1 février 2022

Mots-Clés

ARN structure 3D algorithme multi-objectif algorithmes génétiques

Description

Les ARN non codants sont des macro-molécules du vivant dont la fonction est liée à leur structure 3D (résultat du repliement de la séquence de nucléotides dans l’espace). La prise de conscience lors de la dernière décennie de la grande variété de ces ARN et des rôles importants qu’ils jouent à différents niveaux de la vie de la cellule, ainsi que de leur implication dans un grand nombre de maladies telles que le cancer donne lieu à un regain d’intérêt pour leur étude structurale. Par exemple, ils sont maintenant envisagés comme de possibles cibles thérapeutiques, comme le sont déjà différentes classes de protéines.

Notre équipe de recherche s’intéresse à la prédiction in-silico de la structure des ARN non codants. Récemment, un outil appelé MOARNA [1], a été développé, basé sur un algorithme multi-objectif, combinant différents critères ou objectifs : l’énergie de la structure 3D (modélisée en gros grain), l’énergie de la structure secondaire (structure intermédiaire composée uniquement de liaisons canoniques), des données expérimentales de type SHAPE, et des données statistiques sur les distances entres les nucléotides dans la structure, données générées notamment à partir de notre base de données RNANet [2], disponible sur la plateforme EvryRNA (http://EvryRNA.ibisc.univ-evry.fr.

L’objectif de ce stage est d’apporter des extensions et améliorations à cet outil. Notamment, deux aspects seront abordés :

  1. L'outil utilise l'algorithme génétique multiobjectif classique NSGA-III, mais les solutions générées ne sont pas suffisamment uniformément réparties le long de l'ensemble de Pareto.

Il s’agit ici de réaliser une étude bibliographique sur les différentes techniques permettant d'améliorer la diversité des solutions générées, et de tester expérimentalement ces approches. Plusieurs articles [3,4,5] serviront de point de départ. La méthode la plus adéquate sera ensuite éventuellement adaptée, puis implémentée.

  1. De nombreux algorithmes d'optimisation sont basés sur l'utilisation de voisinages pour explorer l'espace de solutions d'un problème. Dans la version actuelle de MOARNA, cet espace est exploré en effectuant des modifications des liaisons atomiques au niveau de la structure 3D, rendant l’espace d’exploration trop important et conduisant souvent à des solutions non réalistes. Dans ce stage nous souhaitons implémenter une méthode basée sur l’exploration de l’espace de solutions en effectuant des modifications sur la structure secondaire, et plus précisément sur ses appariements canoniques.

Il s’agira ensuite d’effectuer des benchmarks de l’outil final obtenu, en vue d’une publication dans une conférence ou revue internationale. L’outil obtenue sera mis à disposition de la communauté scientifique sur la plateforme EvryRNA (http://EvryRNA.ibisc.univ-evry.fr).

Bibliographie

[1] Louis Becquey, Algorithmes multicritères pour la prédiction de structures d’ARN, thèse de doctorat de l’université Paris-Saclay, 2021.

[2] L. Becquey, E. Angel et F. Tahi. RNANet: An automatically built dual-source dataset integrating homologous sequences and RNA structures, , Bioinformatics, 2020. https://doi.org/10.1093/bioinformatics/btaa944

 

Candidature

Procédure : Envoyer un mail à fariza.tahi@uiv-evry.fr

Date limite : 1 février 2022

Contacts

Fariza TAHI

 faNOSPAMriza.tahi@univ-evry.fr

Offre publiée le 23 décembre 2021, affichage jusqu'au 1 février 2022