Mots-Clés
Codes
Bioinformatique
Statistiques
Combinatoire
Graphe
Code génétique
Gènes.
Description
L'objectif de cette thèse est de poursuivre la théorie des codes circulaires dans les gènes selon deux orientations possibles: combinatoire ou bioinformatique-statistique.
L'approche combinatoire s'intéressera aux codes k-circulaires. Un code est k-circulaire si une concaténation d'au maximum k mots du code écrit sur un cercle retrouve la phase de lecture. Diverses propriétés combinatoires seront analysées sur les codes k-circulaires de trinucléotides (mots de longueur 3 sur un alphabet à 4 lettres), en particulier: fonctions de croissance, complémentarité, codes (k,k,k)-circulaires et définition d'une distance.
L'approche bioinformatique-statistique s'intéressera aux motifs (mots) de code circulaire. Ces motifs ont la propriété fondamentale de retrouver la phase de lecture dans les gènes. La définition et la programmation de fonctions de corrélation basées sur les motifs du code circulaire permettront de rechercher des périodicités et des maximum globaux et locaux dans les gènes. L'objectif est d'identifier de nouveaux codes circulaires. Cette approche permettra également d'étudier les motifs de code circulaire et leur évolution dans les gènes normaux, pathologiques associés à des maladies génétiques et dans les coronavirus, en particulier dans les différents variants du COVID-19.
L'étudiant pourra orienter sa thèse selon une approche combinatoire ou bioinformatique-statistique, en fonction de son intérêt et de sa formation universitaire.
Sites: https://dpt-info.di.unistra.fr/~c.michel/ et DIR_Sujet_C._MICHEL.pdf