Assistant ou Assistante de recherche H/F

Paris

⚠ We'll shut down after Aug 1st - try foo🩍 for all jobs in tech ⚠

Apply now Apply later

Informations générales

Entité de rattachement

“Comprendre son temps pour agir sur le monde”. Sciences Po est une universitĂ© de recherche internationale, ouverte sur le monde, qui se place parmi les meilleures en sciences humaines et sociales. PrĂ©sente depuis plus de 150 ans, elle dĂ©livre sur ses sept campus une formation fondamentale dans cinq disciplines : Ă©conomie, droit, histoire, sociologie, science politique. Pour contribuer Ă  son essor, Sciences Po s'appuie sur des femmes et des hommes de talents dont la pluralitĂ© constitue une vĂ©ritable richesse. Cette communautĂ© de travail partage de profondes valeurs d'humanisme et des engagements affirmĂ©s en faveur de l'Ă©galitĂ© des chances, la diversitĂ© et la transition environnementale. Quelle que soit votre expertise, travailler Ă  Sciences Po, c'est mener une mission qui a un impact, un sens et une utilitĂ© collective.

  

Référence

2025-1087  

Date de début de diffusion

18/06/2025

Description du poste

Intitulé du poste

Assistant ou Assistante de recherche H/F

Type de contrat

Durée déterminée

Durée du contrat

11

Temps contractuel

Temps plein

Présentation de l'entité

UnitĂ© mixte fondĂ©e par Sciences Po et le CNRS en 2005, le Centre de donnĂ©es socio-politiques (CDSP) est l'un des principaux centres français de production et de gestion de donnĂ©es pour les sciences sociales. Il remplit des missions essentielles de documentation, de mise Ă  disposition et de production d'enquĂȘtes et de donnĂ©es de recherche. Fort d'une Ă©quipe d'environ vingt ingĂ©nieur·es spĂ©cialisé·es, le CDSP propose une offre de services complĂšte Ă  la communautĂ© scientifique : collecte, traitement, diffusion des donnĂ©es, dĂ©veloppement de solutions numĂ©riques. Il contribue Ă©galement Ă  la recherche mĂ©thodologique, tant qualitative que quantitative.

Le ou la Data Scientist recruté.e fera partie de l'équipe Documentation du CDSP et sera placé.e sous la responsabilité hiérarchique de la coordinatrice du WorkPackage 3 du projet FAIRwithDDI (https://www.sciencespo.fr/cdsp/fr/projets/projets-en-cours/fairwithddi/).


Il ou elle travaillera en lien avec les membres de l'équipe projet en charge de la réalisation de ce WorkPackage et avec la responsable du projet FAIRwDDI et de l'équipe Documentation.

Description de la mission

Le ou la Data Scientist recruté·e interviendra dans le cadre du troisiÚme volet du projet ANR FAIRwDDI : Upscaling metadata using AI.

L'objectif est de concevoir un protocole automatisĂ© de curation de mĂ©tadonnĂ©es reposant sur des techniques de traitement automatique du langage naturel (NLP) et d'apprentissage machine, en vue d'amĂ©liorer l'interopĂ©rabilitĂ© des donnĂ©es d'enquĂȘte en sciences humaines et sociales (SHS).

Ce travail s'inscrit Ă©galement dans le dĂ©veloppement de l'outil ReQuest, conçu pour explorer et comparer des questions d'enquĂȘtes en SHS. Le protocole Ă©laborĂ© dans le cadre de FAIRwDDI y sera intĂ©grĂ© pour enrichir les possibilitĂ©s de navigation. Les missions s'articuleront Ă©galement avec les travaux du projet ONTOLISST (https://www.sciencespo.fr/cdsp/fr/projets/projets-en-cours/ontolisst/), dans une dĂ©marche commune visant Ă  favoriser l'harmonisation et l'interopĂ©rabilitĂ© des mĂ©tadonnĂ©es en SHS.

Le ou la Data Scientist aura pour mission principale le dĂ©veloppement et l’automatisation du protocole de curation des mĂ©tadonnĂ©es des enquĂȘtes du CDSP et des partenaires du projet selon le standard de valorisation de donnĂ©es Data Documentation Initiative (DDI). Ce protocole de curation sera ensuite intĂ©grĂ© au processus de publication de mĂ©tadonnĂ©es sur l'outil ReQuest.

 

Activités :

- DĂ©velopper un protocole de curation automatisĂ©e de mĂ©tadonnĂ©es XML DDI basĂ© sur le NLP et/ou l’apprentissage machine ;


- RĂ©aliser une analyse de l’état des mĂ©tadonnĂ©es du CDSP et des partenaires (FSD, INSERM), identifier les Ă©carts, et proposer des rĂšgles d’harmonisation ;


- Contribuer à la modélisation, méta-modélisation et appariement de schémas de métadonnées du CDSP et des partenaires ;


- Concevoir et implémenter des rÚgles semi-automatiques de correspondance entre structures de données ;


- Produire des visualisations de l’information (ex. : graphe de connaissances) pour reprĂ©senter les liens entre mĂ©tadonnĂ©es ;


- Participer Ă  l’intĂ©gration du protocole dans l’outil ReQuest, en collaboration avec les membres de l’équipe Projets numĂ©riques du CDSP ;


- Documenter les méthodes et procédures mises en place dans une logique de transparence et de réutilisabilité ;


- Présenter les résultats en français et en anglais dans des événements scientifiques, ateliers et réunions de projets.

Profil

Compétences :

- Expérience en traitement automatique du langage naturel (NLP), la maßtrise des modÚles de référence comme BERT et ses dérivés serait un atout ;
MaĂźtrise des outils de gestion de versions (Git, GitLab) pour le travail collaboratif ;


- Maßtrise des outils de traitement et de visualisation de données avec Python (Pandas, spaCy, scikit-learn, networkx) ;


- Connaissances en modélisation de données, interopérabilité ou appariement de schémas ;


- Sensibilité aux standards et formats de métadonnées (ex. : DDI, RDF, XML) ;


- Capacité de communication écrite et orale en français (C1) et en anglais (B2).

 

Savoirs comportementaux :

- Autonomie, rigueur et esprit d’équipe dans un environnement collaboratif.


Formation : 

- Bac+5 (Master, Ă©cole d’ingĂ©nieur ou Ă©quivalent) en science des donnĂ©es, humanitĂ©s numĂ©riques, informatique, ou disciplines connexes.

- Débutants acceptés.

 

Un intĂ©rĂȘt pour les sciences sociales ou les donnĂ©es d’enquĂȘte est un atout.

 

 

 

Localisation du poste

Localisation du poste

Paris

CritĂšres candidat

Niveau d'études min. requis

5- Master ou MBA

Niveau d'expérience min. requis

Inférieur à 2 ans

Procédure de recrutement

Entretiens prévus avec

Les entretiens auront lieu avec Lucie MARIE (Cheffe de projet Data, Responsable du WP3 de FAIRwDDI), William FERAUX (Développeur) et Lionel DEVEAUX (Responsable numérique / IT scientifique).

Apply now Apply later

* Salary range is an estimate based on our AI, ML, Data Science Salary Index 💰

Job stats:  4  0  0

Tags: BERT Git GitLab NLP Pandas Python RDF Scikit-learn spaCy Vue XML

Region: Europe
Country: France

More jobs like this