Data scientist, stage de fin d’étude master/ingénieur

 Stage · Stage M2  · 6 mois    Bac+5 / Master   Parean Biotechnologies · Saint-Malo (France)

 Date de prise de poste : 2 janvier 2023

Mots-Clés

bio-statistique TCR immunologie

Description

Parean Biotechnologies est une société experte en immunologie, contribuant aux développements de nouveaux biomarqueurs et cibles thérapeutiques. Sous l’impulsion de ces 3 associés fondateurs, Parean accompagne les équipes de recherche académique et privée, notamment dans leurs activités pré-cliniques. Le siège de Parean est à Saint-Malo, où réside notamment ses laboratoires de biologie cellulaire et moléculaire. L’unité de data science se distribue entre Paris et Saint-Malo.

Contexte

Dans le cadre de l’augmentation de ses activités de prestation de services, le lancement de plusieurs programmes de développement d’outils en oncologie, et le démarrage en fin 2022 d’un projet européen d’envergure, Parean souhaite recruter un/une stagiaire de fin d’étude biostatistique.

Description

Les lymphocytes T & B sont des composants importants du système immunitaire adaptatif qui protège l’organisme contre les pathogènes et maintient une tolérance du soi. L’analyse du répertoire immunitaire a pour but de quantifier la diversité des récepteurs d’antigènes (TCR) dans les situations physiopathologiques1. Depuis une décennie, les technologies du séquençage à haut débit ont permis de générer une quantité importante de données2–4. L’un de nos programmes de développement consiste à identifier des séquences TCR reconnaissant des antigènes connus à partir des données publiques. Cette collection de séquences TCR facilitera la modélisation de l’interaction récepteur-antigène5,6. Le stage consiste à (i) constituer une liste des jeux de données publiquement disponibles ; (ii) télécharger et pré-traiter des données de séquençage (QC, trim, alignement) ; (iii) mettre en place des processus d’analyse statistique afin d’identifier les TCR d’intérêt ; (iv) générer le rapport d’analyse utilisant le langage « markown » ; (v) intégrer les étapes ii à iv dans un processus automatique. Le/la stagiaire travaillera avec le Chief Data scientist Officer et co-fondateur de Parean.

Évolutions potentielles : Ce stage peut évoluer vers une thèse CIFRE

Formation souhaitée : L3 Mathématiques + M2 Statistique/Bio-Statistique ; École d’ingénieurs avec forte composante statistique.

Techniques / expériences obligatoire :

  • Une bonne maitrise de Bash et R/Python ;
  • Une connaissance en génomique/NGS, bases immunologies & répertoire immunitaire sont un plus ;
  • Rigueur et sens de l’organisation.

Langues : Français / Anglais

Lieu : Saint-Malo et/ou Paris

Bibliographie :

1.         Six, A., Mariotti-Ferrandiz, M.E., Chaara, W., Magadan, S., Pham, H.-P., Lefranc, M.-P., Mora, T., Thomas-Vaslin, V., Walczak, A.M., and Boudinot, P. (2013). The past, present, and future of immune repertoire biology - the rise of next-generation repertoire analysis. Front Immunol 4, 413. 10.3389/fimmu.2013.00413.

2.         Barennes, P., Quiniou, V., Shugay, M., Egorov, E.S., Davydov, A.N., Chudakov, D.M., Uddin, I., Ismail, M., Oakes, T., Chain, B., et al. (2021). Benchmarking of T cell receptor repertoire profiling methods reveals large systematic biases. Nat Biotechnol 39, 236–245. 10.1038/s41587-020-0656-3.

3.         Pai, J.A., and Satpathy, A.T. (2021). High-throughput and single-cell T cell receptor sequencing technologies. Nat Methods 18, 881–892. 10.1038/s41592-021-01201-8.

4.         Song, L., Cohen, D., Ouyang, Z., Cao, Y., Hu, X., and Liu, X.S. (2021). TRUST4: immune repertoire reconstruction from bulk and single-cell RNA-seq data. Nat Methods 18, 627–630. 10.1038/s41592-021-01142-2.

5.         Ehrlich, R., Kamga, L., Gil, A., Luzuriaga, K., Selin, L.K., and Ghersi, D. (2021). SwarmTCR: a computational approach to predict the specificity of T cell receptors. BMC Bioinformatics 22, 422. 10.1186/s12859-021-04335-w.

6.         Milighetti, M., Shawe-Taylor, J., and Chain, B. (2021). Predicting T Cell Receptor Antigen Specificity From Structural Features Derived From Homology Models of Receptor-Peptide-Major Histocompatibility Complexes. Front. Physiol. 12, 730908. 10.3389/fphys.2021.730908.

Candidature

Procédure : Envoyer une synthèse du parcours, objectifs de développement, et CV au talent@pareanbiotech.fr

Date limite : 30 décembre 2022

Contacts

Parean

 taNOSPAMlent@pareanbiotech.fr

Offre publiée le 14 octobre 2022, affichage jusqu'au 30 décembre 2022