Assistant ou Assistante de recherche H/F
Paris
â ïž We'll shut down after Aug 1st - try foođŠ for all jobs in tech â ïž
Sciences Po
Informations générales
Entité de rattachement
âComprendre son temps pour agir sur le mondeâ. Sciences Po est une universitĂ© de recherche internationale, ouverte sur le monde, qui se place parmi les meilleures en sciences humaines et sociales. PrĂ©sente depuis plus de 150 ans, elle dĂ©livre sur ses sept campus une formation fondamentale dans cinq disciplines : Ă©conomie, droit, histoire, sociologie, science politique. Pour contribuer Ă son essor, Sciences Po s'appuie sur des femmes et des hommes de talents dont la pluralitĂ© constitue une vĂ©ritable richesse. Cette communautĂ© de travail partage de profondes valeurs d'humanisme et des engagements affirmĂ©s en faveur de l'Ă©galitĂ© des chances, la diversitĂ© et la transition environnementale. Quelle que soit votre expertise, travailler Ă Sciences Po, c'est mener une mission qui a un impact, un sens et une utilitĂ© collective. Â
Référence
2025-1087 ÂDate de dĂ©but de diffusion
18/06/2025Description du poste
Intitulé du poste
Assistant ou Assistante de recherche H/F
Type de contrat
Durée déterminée
Durée du contrat
11
Temps contractuel
Temps plein
Présentation de l'entité
UnitĂ© mixte fondĂ©e par Sciences Po et le CNRS en 2005, le Centre de donnĂ©es socio-politiques (CDSP) est l'un des principaux centres français de production et de gestion de donnĂ©es pour les sciences sociales. Il remplit des missions essentielles de documentation, de mise Ă disposition et de production d'enquĂȘtes et de donnĂ©es de recherche. Fort d'une Ă©quipe d'environ vingt ingĂ©nieur·es spĂ©cialisé·es, le CDSP propose une offre de services complĂšte Ă la communautĂ© scientifique : collecte, traitement, diffusion des donnĂ©es, dĂ©veloppement de solutions numĂ©riques. Il contribue Ă©galement Ă la recherche mĂ©thodologique, tant qualitative que quantitative.
Le ou la Data Scientist recruté.e fera partie de l'équipe Documentation du CDSP et sera placé.e sous la responsabilité hiérarchique de la coordinatrice du WorkPackage 3 du projet FAIRwithDDI (https://www.sciencespo.fr/cdsp/fr/projets/projets-en-cours/fairwithddi/).
Il ou elle travaillera en lien avec les membres de l'équipe projet en charge de la réalisation de ce WorkPackage et avec la responsable du projet FAIRwDDI et de l'équipe Documentation.
Description de la mission
Le ou la Data Scientist recruté·e interviendra dans le cadre du troisiÚme volet du projet ANR FAIRwDDI : Upscaling metadata using AI.
L'objectif est de concevoir un protocole automatisĂ© de curation de mĂ©tadonnĂ©es reposant sur des techniques de traitement automatique du langage naturel (NLP) et d'apprentissage machine, en vue d'amĂ©liorer l'interopĂ©rabilitĂ© des donnĂ©es d'enquĂȘte en sciences humaines et sociales (SHS).
Ce travail s'inscrit Ă©galement dans le dĂ©veloppement de l'outil ReQuest, conçu pour explorer et comparer des questions d'enquĂȘtes en SHS. Le protocole Ă©laborĂ© dans le cadre de FAIRwDDI y sera intĂ©grĂ© pour enrichir les possibilitĂ©s de navigation. Les missions s'articuleront Ă©galement avec les travaux du projet ONTOLISST (https://www.sciencespo.fr/cdsp/fr/projets/projets-en-cours/ontolisst/), dans une dĂ©marche commune visant Ă favoriser l'harmonisation et l'interopĂ©rabilitĂ© des mĂ©tadonnĂ©es en SHS.
Le ou la Data Scientist aura pour mission principale le dĂ©veloppement et lâautomatisation du protocole de curation des mĂ©tadonnĂ©es des enquĂȘtes du CDSP et des partenaires du projet selon le standard de valorisation de donnĂ©es Data Documentation Initiative (DDI). Ce protocole de curation sera ensuite intĂ©grĂ© au processus de publication de mĂ©tadonnĂ©es sur l'outil ReQuest.
Â
Activités :
- DĂ©velopper un protocole de curation automatisĂ©e de mĂ©tadonnĂ©es XML DDI basĂ© sur le NLP et/ou lâapprentissage machine ;
- RĂ©aliser une analyse de lâĂ©tat des mĂ©tadonnĂ©es du CDSP et des partenaires (FSD, INSERM), identifier les Ă©carts, et proposer des rĂšgles dâharmonisation ;
- Contribuer à la modélisation, méta-modélisation et appariement de schémas de métadonnées du CDSP et des partenaires ;
- Concevoir et implémenter des rÚgles semi-automatiques de correspondance entre structures de données ;
- Produire des visualisations de lâinformation (ex. : graphe de connaissances) pour reprĂ©senter les liens entre mĂ©tadonnĂ©es ;
- Participer Ă lâintĂ©gration du protocole dans lâoutil ReQuest, en collaboration avec les membres de lâĂ©quipe Projets numĂ©riques du CDSP ;
- Documenter les méthodes et procédures mises en place dans une logique de transparence et de réutilisabilité ;
- Présenter les résultats en français et en anglais dans des événements scientifiques, ateliers et réunions de projets.
Profil
Compétences :
- Expérience en traitement automatique du langage naturel (NLP), la maßtrise des modÚles de référence comme BERT et ses dérivés serait un atout ;
MaĂźtrise des outils de gestion de versions (Git, GitLab) pour le travail collaboratif ;
- Maßtrise des outils de traitement et de visualisation de données avec Python (Pandas, spaCy, scikit-learn, networkx) ;
- Connaissances en modélisation de données, interopérabilité ou appariement de schémas ;
- Sensibilité aux standards et formats de métadonnées (ex. : DDI, RDF, XML) ;
- Capacité de communication écrite et orale en français (C1) et en anglais (B2).
Â
Savoirs comportementaux :
- Autonomie, rigueur et esprit dâĂ©quipe dans un environnement collaboratif.
Formation :Â
- Bac+5 (Master, Ă©cole dâingĂ©nieur ou Ă©quivalent) en science des donnĂ©es, humanitĂ©s numĂ©riques, informatique, ou disciplines connexes.
- Débutants acceptés.
Â
Un intĂ©rĂȘt pour les sciences sociales ou les donnĂ©es dâenquĂȘte est un atout.
Â
Â
Â
Localisation du poste
Localisation du poste
Paris
CritĂšres candidat
Niveau d'études min. requis
5- Master ou MBA
Niveau d'expérience min. requis
Inférieur à 2 ans
Procédure de recrutement
Entretiens prévus avec
Les entretiens auront lieu avec Lucie MARIE (Cheffe de projet Data, Responsable du WP3 de FAIRwDDI), William FERAUX (Développeur) et Lionel DEVEAUX (Responsable numérique / IT scientifique).
* Salary range is an estimate based on our AI, ML, Data Science Salary Index đ°
Tags: BERT Git GitLab NLP Pandas Python RDF Scikit-learn spaCy Vue XML
More jobs like this
Explore more career opportunities
Find even more open roles below ordered by popularity of job title or skills/products/technologies used.