Développement d’outil de prédiction de taille de génomes à partir de séquençage à faible couverture

 Stage · Stage M2  · 6 mois    Bac+5 / Master   Genoscope, CEA Institut François Jacob · Evry (France)  selon le profil (grille de rémunération CEA)

 Date de prise de poste : 1 mars 2022

Mots-Clés

génomique alignement développement

Description

Titre: Développement d’un outil de prédiction de taille de génomes à partir de séquençage à faible couverture Dominante: Analyse génomique, alignements, développement, statistiques, génomique comparative. Descriptif:  Dans le cadre du projet PhyloAlps portant sur la diversité de la Flore alpine, nous disposons de lectures génomiques (short reads) à faible couverture (1X en moyenne) sur plus de 5000 espèces de plantes. En raison de la faible couverture nous ne disposons pas d’assemblage génomique ni d’annotation pour ces espèces. Une méthode permettant de prédire la taille des génomes des plantes à partir de l’alignement de lectures sur un jeu de protéines provenant de gènes monocopies a été mise au point préalablement au laboratoire. Le stage proposé ici visera dans un premier temps à faire des développements sur cette méthode afin de créer un outil accessible et utilisable pour l’ensemble de la communauté (via un GitHub). Les prédictions de taille de génomes produites par cet outil chez les plantes alpines pourront par la suite être corrélées à divers traits de vie des espèces. Dans un deuxième temps, cet outil pourra être élargi à d’autres applications, en particulier dans le but de quantifier le nombre de copies dans des familles de gènes multigéniques, chez les plantes alpines mais également chez d’autres groupes d’espèces. Notamment, la méthode pourra être appliquée à des génomes d’algues brunes, séquencés dans le cadre du projet Phaeoexplorer (https://phaeoexplorer.sb-roscoff.fr/), afin de quantifier de façon homogène le nombre de gènes dans les familles, indépendamment de la qualité des assemblages et des annotations. Ces recherches pourront se poursuivre par une thèse.
 Compétences recherchées: Le.la candidat.e devra être familier.e avec l'environnement type unix, avoir des connaissances dans les langages de script (comme perl, python, bash, awk ou R), ainsi que sur les outils d’analyse génomique. Il.Elle aura idéalement une connaissance sur les gestionnaires de workflow (Snakemake, Nextflow ou autre) et sur les systèmes d’ordonnancement des tâches (slurm par exemple). L'étudiant.e devra faire preuve d'esprit d'équipe, de curiosité et d'adaptation dans le travail qui lui sera confié.
Laboratoire d'accueil:
Le Genoscope – Institut de Génomique, rattaché au CEA (Commissariat à l’Energie Atomique et aux Energies renouvelables) est une grande plateforme d’envergure et de réputation internationale dans le domaine de la génomique. Au-delà d’une mission de service à la communauté, il participe à de nombreux projets d’analyse de génomes (coraux, plantes, algues, ...) et coordonne la partie génomique de projets internationaux d’études des océans (Tara Océans, Tara Pacific). Le stage se déroulera dans le laboratoire bioinformatique pour la génomique et la biodiversité, du CEA/Institut François Jacob/Genoscope, à Evry. Il s’agit d’une équipe d’une quinzaine de personnes impliquées dans différentes thématiques bioinformatiques, allant du séquençage à l'analyse des génomes. Nous proposons un stage d’une durée de 6 mois à partir de février ou mars 2022, pour un étudiant de niveau M2 qui souhaiterait s’orienter plutôt vers la recherche.


Candidature

Procédure : Envoyer un mail à stage_rdbioseq@genoscope.cns.fr

Date limite : 30 janvier 2022

Contacts

France Denoeud

 stNOSPAMage_rdbioseq@genoscope.cns.fr

Offre publiée le 30 novembre 2021, affichage jusqu'au 28 février 2022