Mots-Clés
bio-statistique
TCR
immunologie
Description
Parean Biotechnologies est une société experte en immunologie, contribuant aux développements de nouveaux biomarqueurs et cibles thérapeutiques. Sous l’impulsion de ces 3 associés fondateurs, Parean accompagne les équipes de recherche académique et privée, notamment dans leurs activités pré-cliniques. Le siège de Parean est à Saint-Malo, où réside notamment ses laboratoires de biologie cellulaire et moléculaire. L’unité de data science se distribue entre Paris et Saint-Malo.
Contexte
Dans le cadre de l’augmentation de ses activités de prestation de services, le lancement de plusieurs programmes de développement d’outils en oncologie, et le démarrage en fin 2022 d’un projet européen d’envergure, Parean souhaite recruter un/une stagiaire de fin d’étude biostatistique.
Description
Les lymphocytes T & B sont des composants importants du système immunitaire adaptatif qui protège l’organisme contre les pathogènes et maintient une tolérance du soi. L’analyse du répertoire immunitaire a pour but de quantifier la diversité des récepteurs d’antigènes (TCR) dans les situations physiopathologiques1. Depuis une décennie, les technologies du séquençage à haut débit ont permis de générer une quantité importante de données2–4. L’un de nos programmes de développement consiste à identifier des séquences TCR reconnaissant des antigènes connus à partir des données publiques. Cette collection de séquences TCR facilitera la modélisation de l’interaction récepteur-antigène5,6. Le stage consiste à (i) constituer une liste des jeux de données publiquement disponibles ; (ii) télécharger et pré-traiter des données de séquençage (QC, trim, alignement) ; (iii) mettre en place des processus d’analyse statistique afin d’identifier les TCR d’intérêt ; (iv) générer le rapport d’analyse utilisant le langage « markown » ; (v) intégrer les étapes ii à iv dans un processus automatique. Le/la stagiaire travaillera avec le Chief Data scientist Officer et co-fondateur de Parean.
Évolutions potentielles : Ce stage peut évoluer vers une thèse CIFRE
Formation souhaitée : L3 Mathématiques + M2 Statistique/Bio-Statistique ; École d’ingénieurs avec forte composante statistique.
Techniques / expériences obligatoire :
- Une bonne maitrise de Bash et R/Python ;
- Une connaissance en génomique/NGS, bases immunologies & répertoire immunitaire sont un plus ;
- Rigueur et sens de l’organisation.
Langues : Français / Anglais
Lieu : Saint-Malo et/ou Paris
Bibliographie :
1. Six, A., Mariotti-Ferrandiz, M.E., Chaara, W., Magadan, S., Pham, H.-P., Lefranc, M.-P., Mora, T., Thomas-Vaslin, V., Walczak, A.M., and Boudinot, P. (2013). The past, present, and future of immune repertoire biology - the rise of next-generation repertoire analysis. Front Immunol 4, 413. 10.3389/fimmu.2013.00413.
2. Barennes, P., Quiniou, V., Shugay, M., Egorov, E.S., Davydov, A.N., Chudakov, D.M., Uddin, I., Ismail, M., Oakes, T., Chain, B., et al. (2021). Benchmarking of T cell receptor repertoire profiling methods reveals large systematic biases. Nat Biotechnol 39, 236–245. 10.1038/s41587-020-0656-3.
3. Pai, J.A., and Satpathy, A.T. (2021). High-throughput and single-cell T cell receptor sequencing technologies. Nat Methods 18, 881–892. 10.1038/s41592-021-01201-8.
4. Song, L., Cohen, D., Ouyang, Z., Cao, Y., Hu, X., and Liu, X.S. (2021). TRUST4: immune repertoire reconstruction from bulk and single-cell RNA-seq data. Nat Methods 18, 627–630. 10.1038/s41592-021-01142-2.
5. Ehrlich, R., Kamga, L., Gil, A., Luzuriaga, K., Selin, L.K., and Ghersi, D. (2021). SwarmTCR: a computational approach to predict the specificity of T cell receptors. BMC Bioinformatics 22, 422. 10.1186/s12859-021-04335-w.
6. Milighetti, M., Shawe-Taylor, J., and Chain, B. (2021). Predicting T Cell Receptor Antigen Specificity From Structural Features Derived From Homology Models of Receptor-Peptide-Major Histocompatibility Complexes. Front. Physiol. 12, 730908. 10.3389/fphys.2021.730908.