Ingénieur·e en bio-informatique

 CDD · Ingénieur autre  · 18 mois    Bac+5 / Master   CEA / Institut de Biologie Intégrative de la Cellule (I2BC) · Gif-sur-Yvette (France)  salaire brut mensuel 2861,80€

 Date de prise de poste : 1 novembre 2024

Mots-Clés

Bio-informatique Science des données Structure macromoléculaire Intelligence artificielle

Description

Missions

Le CDD ingénieur est associé à deux projets collaboratifs visant à exploiter les méthodes de prédiction structurale reposant sur l’intelligence artificielle (telles qu’AlphaFold) dans le but de prédire des réseaux d’interactions complexes impliquant des protéines (régions globulaires, régions désordonnées, structures spécifiques de type coiled-coils ou anticorps) et des acides nucléiques (ADN et ARN, en particulier simple brin).

L'ingénieur·e aura pour première mission de réaliser le recueil, le traitement et le stockage de données structurales spécifiques (données publiques disponibles). Cette mission impliquera en particulier l’analyse des ressources disponibles par une veille technologique et bibliographique, la cartographie des données et leur croisement, et la préparation de ces données afin qu’elles soient exploitées par d’autres membres de l’équipe dans des stratégies prédictives. Les approches à utiliser ainsi que le plan d’étude et la structure des bases de données attendues seront définis à l’avance au sein de l’équipe.

L'ingénieur·e aura également pour mission d’assister l’équipe pour l’adaptation des programmes informatiques nécessaires au déroulement du projet (installation de programmes externes, développement de pipelines et de scripts Python), et pour la valorisation des résultats obtenus sous la forme de code partagé, de bases de données ouvertes et de ressources (de type serveur web) disponibles sur internet pour la communauté. Cette dernière partie pourra se faire en collaboration avec la plateforme de bio-informatique de l’I2BC, BIOI2. Les modèles mathématiques, les programmes informatiques à utiliser et la structure des outils seront définis à l’avance au sein de l’équipe.

L'ingénieur·e travaillera directement avec deux chercheurs CEA et trois doctorants de l’équipe de bio-informatique. L'ingénieur·e bénéficiera d'un environnement scientifique interdisciplinaire stimulant, de l'expertise de l'équipe et d'un accès aux moyens de calcul nécessaires. Le CDD est proposé pour 18 mois, avec une extension possible en fonction du profil de la/du candidat·e.

Contexte de travail

L'ingénieur·e sera affecté·e dans l'équipe « Assemblage moléculaire et intégrité du génome » de l'Institut de Biologie Intégrative de la Cellule (UMR 9198 I2BC, CNRS/CEA/Université Paris-Saclay).

L'équipe s'appuie sur un couplage fort entre approches bio-informatiques et expérimentales pour caractériser, prédire et inhiber les assemblages macromoléculaires. En bio-informatique, l’équipe a développé ces dernières années des approches originales pour la prédiction structurale des interactions entre protéines en utilisant l'information issue de l'évolution et possède une expertise reconnue dans le domaine de la bio-informatique structurale et de la prédiction d'interactions macromoléculaires [1,2]. Récemment, l’intelligence artificielle, en particulier l’apprentissage profond dans des méthodes telles qu’AlphaFold, a révolutionné la prédiction des structures de protéines et de complexes macromoléculaires. L’équipe a développé une expertise dans l’utilisation avancée de ces techniques pour traiter des problèmes de prédiction spécifiques, par exemple la prédiction des interactions médiées par des régions désordonnées [3]. L’équipe met également à profit ces techniques dans le cadre de collaborations avec des biologistes [4,5,6].

L'I2BC est un institut de recherche de l'Université Paris-Saclay, constitué d’une soixantaine d’équipes. La recherche à l'I2BC couvre une variété de thématiques de biologie intégrative (biophysique, biochimie, biologie structurale, biologie des génomes, biologie cellulaire, microbiologie, virologie, bio-informatique). L'équipe « Assemblage moléculaire et intégrité du génome » est rattachée au département de Biochimie, Biophysique et Biologie Structurale. L'équipe est localisée au sud de Paris ; elle se trouve pour l'instant sur le centre CEA de Saclay et doit rejoindre bientôt le campus CNRS de Gif-sur-Yvette (à moins d'une heure du centre de Paris).

Compétences attendues

  • Traitement des données, en particulier par le développement de scripts permettant de mettre en œuvre une succession d’opérations de traitement, et reporting associé
  • Maîtrise approfondie de Python
  • Maîtrise souhaitable de la mise en œuvre de calculs dans un environnement de calcul partagé (cluster de calcul)
  • Intérêt pour le travail en équipe, en interaction avec des biologistes et des informaticiens
  • Compétences ou intérêt pour les méthodes d’intelligence artificielle

Références des travaux de l’équipe

[1] Atomic-level evolutionary information improves protein-protein interface scoring. Quignot C, Granger P, Chacón P, Guerois R, Andreani J. Bioinformatics. 2021 Oct 11;37(19):3175-3181. doi: 10.1093/bioinformatics/btab254.

[2] InterEvDock3: a combined template-based and free docking server with increased performance through explicit modeling of complex homologs and integration of covariation-based contact maps. Quignot C, Postic G, Bret H, Rey J, Granger P, Murail S, Chacón P, Andreani J, Tufféry P, Guerois R. Nucleic Acids Res. 2021 Jul 2;49(W1):W277-W284. doi: 10.1093/nar/gkab358.

[3] From interaction networks to interfaces, scanning intrinsically disordered regions using AlphaFold2. Bret H, Gao J, Zea DJ, Andreani J, Guerois R. Nat Commun. 2024 Jan 18;15(1):597. doi: 10.1038/s41467-023-44288-7.

[4] Molecular insights into the activation of Mre11-Rad50 endonuclease activity by Sae2/CtIP. Nicolas Y, Bret H, Cannavo E, Acharya A, Cejka P, Borde V, Guerois R. Mol Cell. 2024 Jun 20;84(12):2223-2237.e4. doi: 10.1016/j.molcel.2024.05.019.

[5] Mechanism of DNA unwinding by MCM8-9 in complex with HROB. Acharya A, Bret H, Huang JW, Mütze M, Göse M, Kissling VM, Seidel R, Ciccia A, Guérois R, Cejka P. Nat Commun. 2024 Apr 27;15(1):3584. doi: 10.1038/s41467-024-47936-8.

[6] SMARCAL1 is a dual regulator of innate immune signaling and PD-L1 expression that promotes tumor immune evasion. Leuzzi G, Vasciaveo A, Taglialatela A, Chen X, Firestone TM, Hickman AR, Mao W, Thakar T, Vaitsiankova A, Huang JW, Cuella-Martin R, Hayward SB, Kesner JS, Ghasemzadeh A, Nambiar TS, Ho P, Rialdi A, Hebrard M, Li Y, Gao J, Gopinath S, Adeleke OA, Venters BJ, Drake CG, Baer R, Izar B, Guccione E, Keogh MC, Guerois R, Sun L, Lu C, Califano A, Ciccia A. Cell. 2024 Feb 15;187(4):861-881.e32. doi: 10.1016/j.cell.2024.01.008.

 

Candidature

Procédure : Envoyer un mail à jessica.andreani@cea.fr et guerois@cea.fr avec CV, motivation et les coordonnées de 2 références

Date limite : 30 septembre 2024

Contacts

Jessica Andreani & Raphael Guerois

 jeNOSPAMssica.andreani@cea.fr

Offre publiée le 19 juillet 2024, affichage jusqu'au 30 septembre 2024