Stage PFE : Data engineering & RGPD
Paris, France
OCTO Technology
Description de l'entreprise
Premier cabinet d’architectes IT fondé en 1998, pionnier du delivery agile et véritable concentrateur de talents. Nous incarnons les nouvelles façons de faire du conseil et du Delivery. Digital Doers & Thinkers est notre marque de fabrique.
Nous privilégions aujourd'hui notre positionnement Agile & DeepTech et sommes engagés quant à notre responsabilité sociale et environnementale.
Description du poste
Conception et développement d’un système de surveillance pour garantir la souveraineté des flux de données analytiques
Le Why du stage:
Avec l'importance croissante des réglementations française et européenne sur la gestion des données (dont le RGPD), les entreprises et les organisations publiques seront amenées à garantir la souveraineté et la protection de leurs données.
Ce stage permet de répondre à cet enjeu dans le domaine particulier du data engineering pour la création de systèmes décisionnels ou d’IA en développant une preuve de concept qui assure la conformité des flux de données analytiques aux normes de sécurité et de protection des données.
Les missions du stage:
- Concevoir et développer un POC d’un système de surveillance des flux de données analytiques pour garantir leur souveraineté, en s’appuyant sur le framework de traçabilité openlinage https://openlineage.io/
- Inclure des processus de traçabilité des traitements de données et localisation géographique de données
- Ouvrir à des améliorations et capacités d’industrialisation de la solution développée
Le déroulement du stage:
Etape 1 : Découverte et cadrage
- Prise en main des outils DBT et openlineage
- Etude des réglementations en terme de souveraineté des données
- Analyse de l'état de l'art pour réaliser la traçabilité de la souveraineté des traitements de données
- Cadrage du POC et modélisation de la solution de traçabilité de la souveraineté
- Définition du référentiel de suivi de cette traçabilité
Etape 2 : Développement du POC
- Développement d’un flux de données analytique type avec DBT sur une plateforme du cloud
- Mise en place d'un système de traçabilité des flux de données avec openlinage. Démonstration de la conformité des données avec les exigences réglementaires via un tableau de bord
Etape 3: Partage
- Partage aux autres Octos et à la fin du stage, rédaction d'un article de blog
Etape 4: Ouverture
- Envisager les possibilités de généralisation dans d'autres environnements technologiques
Stack technique: Python, AWS, Azure ou GCP, DBT, Openlinage
Qualifications
- Vous préparez un BAC+5 et vous êtes à la recherche d'un stage de fin d'études (Formation en big data et software engineering)
- Vous maitrisez des langages de développement informatique et Python -
- Vous maîtrisez certaines bases de données et avez des connaissance en analyse de données et statistiques
- Vous êtes en capacité à travailler en équipe et à communiquer des résultats complexes de manière claire
Informations supplémentaires
OCTO Rewards
- 6 participations, 6 podiums au palmarès « Great Place To Work », le bien-être et la progression des Octos est vraiment au cœur de nos préoccupations ;
- “There is always a better way” : nous encourageons et soutenons l’innovation par la R&D. Au-delà d’une direction Scientifique dédiée, nous proposvalorisons le temps hors mission pour partager ses connaissances : blog OCTO, talks, meet-up, livre blanc, BBL… en bref de l’open source alimenté par tous les Octos ;
- Parce que ce ne sont pas que des mots, nous marquons au quotidien notre engagement en matière de numérique responsable : depuis 2021 OCTO est Certifié BCorp. Nous formons les Octos et nos clients à la fresque du climat et œuvrons pour la sobriété numérique en interne et auprès de nos clients ;
- Le management est un point central de notre culture. Les Octos managers sont formés pour vous accompagner dans le développement de votre carrière ;
- Parce qu’on n’a jamais fini d’apprendre, vous pourrez tirer parti de notre large offre de formations (softskills, et hardskills), avec un accompagnement personnalisé, pour affûter vos compétences et vous certifier ;
- Le sujet de la parentalité compte aussi beaucoup à nos yeux. C’est pourquoi nous avons mis à disposition des places en crèche, ainsi que d’une permanence parentalité pour les parents et futurs parents ;
- Last but not least, nous sommes également signataires de la Charte de l’Autre Cercle concernant l’inclusion des personnes LGBTQIA+ en entreprise, depuis juin 2022.
Sans oublier les fondamentaux :
- Matériel au choix : ordinateur (PC ou Mac) ;
- Télétravail ;
- RTT : 1 jour par mois travaillé ;
- Et bien sûr : carte Swile
OCTO priority
Collaborer avec des personnes talentueuses issues de différents horizons. Aussi, ce que nous cherchons avant tout, ce sont des personnalités qui enrichiront OCTO.
En respectant l'égalité des chances, les candidatures sont examinées sans aucun préjugé quant à l'âge, l'ethnie, l'identité de genre, l’expression de genre, le handicap, la nationalité, la religion ou l'orientation sexuelle.
Nous sommes également signataire de la Charte de l’Autre Cercle concernant l’inclusion des personnes LGBTQIA+ en entreprise, depuis juin 2022.
* Salary range is an estimate based on our AI, ML, Data Science Salary Index 💰
Tags: Agile AWS Azure Big Data dbt Engineering GCP Open Source Python R R&D Tableau
More jobs like this
Explore more career opportunities
Find even more open roles below ordered by popularity of job title or skills/products/technologies used.