Stage - Ingénieur de données

Saint-Sauveur, France

Syngenta Group

A leading agriculture company helping to improve global food security by enabling millions of farmers to make better use of available resources.

View all jobs at Syngenta Group

Apply now Apply later

Company Description

Syngenta Seeds est l'une des plus grandes entreprises de création variétale et de production de semences au monde ; pour les agriculteurs, les producteurs, les distributeurs et les petites sociétés semencières. Les semences Syngenta améliorent la qualité et le rendement des cultures. Ces semences de haute qualité garantissent de meilleures cultures plus productives ; c'est pourquoi les agriculteurs les choisissent. Les semences sélectionnées aident à atténuer les risques de maladies ou liés à la sécheresse et permettent aux agriculteurs de cultiver des végétaux en utilisant moins de terres, moins d'eau, de manière moins impactante.

Syngenta Seeds apporte aux agriculteurs des plantes plus vigoureuses, plus fortes et plus résistantes, notamment des variétés hybrides innovantes et des cultures biotechnologiques qui peuvent prospérer même dans des conditions de croissance difficiles.

Le siège de Syngenta Seeds est situé aux États-Unis. 

Job Description

L'équipe d'avancement et de placement joue un rôle très important au sein de Syngenta. Lors du développement de nouvelles variétés, la quantité de données collectées est considérable et doit être gérée de manière appropriée. En collaborant avec les data scientists de l'équipe ainsi qu'avec les propriétaires des données, vous jouerez un rôle clé dans la facilitation du traitement des données et veillerez à ce que les infrastructures et les solutions répondent à tous les besoins des utilisateurs.

Responsabilités :

- Élaborer un modèle de données et un pipeline de données pour permettre une analyse automatisée.

- Effectuer un contrôle qualité du processus de traitement des données.

- Mettre en place des tests unitaires.

- Améliorer les infrastructures existantes et proposer de nouvelles solutions si nécessaire.

- Coopérer avec différents acteurs aux profils variés.

Qualifications

- Actuellement inscrit(e) dans un programme de Licence ou de Master en Informatique / Ingénierie des données / Big Data / Science des données

- Avec une formation en ingénierie des données, capable de construire l'ossature de l'infrastructure de données et de contribuer à l'acquisition, la transformation et le nettoyage des données à grande échelle

- Capacité à construire, tester et maintenir des architectures robustes de pipeline de base de données

- Aptitude à intégrer diverses sources de données (bases de données, API, flux)

- Capable de développer et d'optimiser des tâches de traitement de données en utilisant les services AWS ou des solutions similaires

- Capacité à collaborer et à comprendre les besoins des propriétaires de données ainsi qu'à les traduire en vues simples - Solides connaissances en Python, en particulier pandas, numpy, pytest

- Une expérience en développement d'applications est préférable

- Familiarité avec les systèmes de contrôle de version (Git) et les dépôts de code (GitHub, GitLab)

- Compréhension de la modélisation des données, des processus ETL et des principes de qualité des données

- Excellentes compétences en résolution de problèmes et en débogage

Apply now Apply later
Job stats:  2  0  0

Tags: APIs Architecture AWS Big Data ETL Git GitHub GitLab NumPy Pandas Python

Region: Europe
Country: France

More jobs like this