Assistant ou Assistante de recherche H/F
Paris
Sciences Po
Informations générales
Entité de rattachement
“Comprendre son temps pour agir sur le monde”. Sciences Po est une université de recherche internationale, ouverte sur le monde, qui se place parmi les meilleures en sciences humaines et sociales. Présente depuis plus de 150 ans, elle délivre sur ses sept campus une formation fondamentale dans cinq disciplines : économie, droit, histoire, sociologie, science politique. Pour contribuer à son essor, Sciences Po s'appuie sur des femmes et des hommes de talents dont la pluralité constitue une véritable richesse. Cette communauté de travail partage de profondes valeurs d'humanisme et des engagements affirmés en faveur de l'égalité des chances, la diversité et la transition environnementale. Quelle que soit votre expertise, travailler à Sciences Po, c'est mener une mission qui a un impact, un sens et une utilité collective.Référence
2025-1087Date de début de diffusion
18/06/2025Description du poste
Intitulé du poste
Assistant ou Assistante de recherche H/F
Type de contrat
Durée déterminée
Durée du contrat
11
Temps contractuel
Temps plein
Présentation de l'entité
Unité mixte fondée par Sciences Po et le CNRS en 2005, le Centre de données socio-politiques (CDSP) est l'un des principaux centres français de production et de gestion de données pour les sciences sociales. Il remplit des missions essentielles de documentation, de mise à disposition et de production d'enquêtes et de données de recherche. Fort d'une équipe d'environ vingt ingénieur·es spécialisé·es, le CDSP propose une offre de services complète à la communauté scientifique : collecte, traitement, diffusion des données, développement de solutions numériques. Il contribue également à la recherche méthodologique, tant qualitative que quantitative.
Le ou la Data Scientist recruté.e fera partie de l'équipe Documentation du CDSP et sera placé.e sous la responsabilité hiérarchique de la coordinatrice du WorkPackage 3 du projet FAIRwithDDI (https://www.sciencespo.fr/cdsp/fr/projets/projets-en-cours/fairwithddi/).
Il ou elle travaillera en lien avec les membres de l'équipe projet en charge de la réalisation de ce WorkPackage et avec la responsable du projet FAIRwDDI et de l'équipe Documentation.
Description de la mission
Le ou la Data Scientist recruté·e interviendra dans le cadre du troisième volet du projet ANR FAIRwDDI : Upscaling metadata using AI.
L'objectif est de concevoir un protocole automatisé de curation de métadonnées reposant sur des techniques de traitement automatique du langage naturel (NLP) et d'apprentissage machine, en vue d'améliorer l'interopérabilité des données d'enquête en sciences humaines et sociales (SHS).
Ce travail s'inscrit également dans le développement de l'outil ReQuest, conçu pour explorer et comparer des questions d'enquêtes en SHS. Le protocole élaboré dans le cadre de FAIRwDDI y sera intégré pour enrichir les possibilités de navigation. Les missions s'articuleront également avec les travaux du projet ONTOLISST (https://www.sciencespo.fr/cdsp/fr/projets/projets-en-cours/ontolisst/), dans une démarche commune visant à favoriser l'harmonisation et l'interopérabilité des métadonnées en SHS.
Le ou la Data Scientist aura pour mission principale le développement et l’automatisation du protocole de curation des métadonnées des enquêtes du CDSP et des partenaires du projet selon le standard de valorisation de données Data Documentation Initiative (DDI). Ce protocole de curation sera ensuite intégré au processus de publication de métadonnées sur l'outil ReQuest.
Activités :
- Développer un protocole de curation automatisée de métadonnées XML DDI basé sur le NLP et/ou l’apprentissage machine ;
- Réaliser une analyse de l’état des métadonnées du CDSP et des partenaires (FSD, INSERM), identifier les écarts, et proposer des règles d’harmonisation ;
- Contribuer à la modélisation, méta-modélisation et appariement de schémas de métadonnées du CDSP et des partenaires ;
- Concevoir et implémenter des règles semi-automatiques de correspondance entre structures de données ;
- Produire des visualisations de l’information (ex. : graphe de connaissances) pour représenter les liens entre métadonnées ;
- Participer à l’intégration du protocole dans l’outil ReQuest, en collaboration avec les membres de l’équipe Projets numériques du CDSP ;
- Documenter les méthodes et procédures mises en place dans une logique de transparence et de réutilisabilité ;
- Présenter les résultats en français et en anglais dans des événements scientifiques, ateliers et réunions de projets.
Profil
Compétences :
- Expérience en traitement automatique du langage naturel (NLP), la maîtrise des modèles de référence comme BERT et ses dérivés serait un atout ;
Maîtrise des outils de gestion de versions (Git, GitLab) pour le travail collaboratif ;
- Maîtrise des outils de traitement et de visualisation de données avec Python (Pandas, spaCy, scikit-learn, networkx) ;
- Connaissances en modélisation de données, interopérabilité ou appariement de schémas ;
- Sensibilité aux standards et formats de métadonnées (ex. : DDI, RDF, XML) ;
- Capacité de communication écrite et orale en français (C1) et en anglais (B2).
Savoirs comportementaux :
- Autonomie, rigueur et esprit d’équipe dans un environnement collaboratif.
Formation :
- Bac+5 (Master, école d’ingénieur ou équivalent) en science des données, humanités numériques, informatique, ou disciplines connexes.
- Débutants acceptés.
Un intérêt pour les sciences sociales ou les données d’enquête est un atout.
Localisation du poste
Localisation du poste
Paris
Critères candidat
Niveau d'études min. requis
5- Master ou MBA
Niveau d'expérience min. requis
Inférieur à 2 ans
Procédure de recrutement
Entretiens prévus avec
Les entretiens auront lieu avec Lucie MARIE (Cheffe de projet Data, Responsable du WP3 de FAIRwDDI), William FERAUX (Développeur) et Lionel DEVEAUX (Responsable numérique / IT scientifique).
* Salary range is an estimate based on our AI, ML, Data Science Salary Index 💰
Tags: BERT Git GitLab NLP Pandas Python RDF Scikit-learn spaCy Vue XML
More jobs like this
Explore more career opportunities
Find even more open roles below ordered by popularity of job title or skills/products/technologies used.