Stage Innovation : Ingénieur Data Science

Valbonne, France

ALTEN

Leader in Engineering and IT Services, ALTEN supports its customers’ development strategies in the areas of innovation, R&D and technological information systems.

View all jobs at ALTEN

Apply now Apply later

Description du poste

A la Direction de l’Innovation, nous menons des projets de recherche sur des champs d’expérimentation très larges et multi-sectoriels.
Ces projets innovants, développés en équipes, sont encadrés par nos experts au sein des ALTEN Labs (IDF, Toulouse, Grenoble, Rennes et Sophia Antipolis), et tentent de répondre aux enjeux de nos clients en leur fournissant des solutions technologiques originales et disruptives.

Au sein de notre Lab de Sophia Antipolis, vous serez accompagné(e) par un Pilote Innovation (Chef de projet) pour vous permettre de développer vos compétences sur les activités d'un des projets suivants (plusieurs stages à pourvoir).

Projet : Développement d'une solution LLMOps

Vous serez impliqué dans l’évaluation de grands modèles de langage (LLM) dans des contextes spécifiques afin d'identifier leurs performances pour des taches comme le code, la génération de texte, la traduction, etc...
 - Réaliser une revue de littérature et un état de l’art sur les techniques d'évaluation des LLM.
- Concevoir des métriques et protocoles d'évaluation adaptés aux tâches spécifiques.
- Implémenter des expériences pour tester les modèles LLM dans différents contextes et scénarios.
- Analyser les résultats expérimentaux, identifier les forces et faiblesses des modèles, et proposer des axes d’amélioration.
- Documenter les processus et rédiger des rapports scientifiques détaillés.

Projet : Développement Plateforme MLOps

Vous serez impliqé(e)r dans la création d'une infrastructure robuste pour la gestion du cycle de vie des modèles de machine learning, allant de leur déploiement à leur surveillance en production.
- Collaborer avec l'équipe de développement pour concevoir et mettre en place des composants de la plateforme MLOps.
- Développer des pipelines de données et de modèles.
- Implémenter des outils de surveillance pour suivre les performances des modèles en production et détecter les dérives ou les problèmes de performance.
- Documenter les processus et résultats.

Projet : Démonstrateur Apprentissage Multi-Modal

- Réaliser un état de l’art sur l’apprentissage multi-modal et multi-tâches des modèles de deep learning​
- Développer en Python un démonstrateur pour l’apprentissage multi-modal et multi-tâches​
- Evaluer les méthodes et outils existants​
- Développer de nouveaux outils adaptés à notre plateforme​
- Concevoir et implémenter un scénario de démonstration​

Projet : Détection de domaine

Comprendre le métier de la donnée permet d’ouvrir de nouveaux axes pour vérifier si la donnée convient à la tache que le modèle devra exécuter une fois déployé ainsi que pour comprendre les limites des réponses obtenues.
C’est dans cette optique que nous définissons le domaine comme étant le cumul de l’aspect sémantique du métier (ex : un document pourrait être un « relevé de compte ») et l’aspect numérique du domaine de définition et des distributions (ex : dans un ensemble de relevés de compte, chaque entrée de chaque relevé contient un certain nombre de propriétés qui devraient respecter leur domaine de définition et leur distribution). Dans ces exemples, le montant de la transaction est un nombre rationnel (domaine de définition) et suit une certaine distribution.
Ces mesures de la qualité de la donnée permettent alors de détecter les erreurs et éventuellement de les corriger.
Dans ce contexte, les missions confiées sont :
- Etat de l’art
- Définition du cas d’utilisation de démonstration
- Comparaison des approches :

  • De représentation des domaines
  • De détection des domaines
  • De mesure de la qualité
  • D’amélioration de la qualité

- Implémentation d’une démonstration des approches sélectionnées
- (Si le temps le permet) Intégration dans la plateforme
- Synthèse des résultats

Qualifications

Vous êtes étudiant(e) en dernière année d’École d’Ingénieur à la recherche d’un stage de fin d’études et vous avez suivi une spécialité en Data Science ou Deep Learning.
Vous justifiez de solides connaissances en Python ainsi que l'utilisation de librairies comme Pandas, PyTorch, Transformers, ainsi que dans l’utilisation de Git et l'environnement Visual Studio Code, que vous avez su mettre en pratique lors de votre formation.

Réactif(ve), rigoureux(se), autonome et doté(e) du sens du service, vous souhaitez évoluer dans un environnement challengeant​.

Informations supplémentaires

Rejoindre nos ALTEN Labs, c’est être au cœur de la culture de l’innovation, et une promesse de monter en compétences sur des sujets concrets en équipe projet, avec à la clé une embauche en CDI en tant que consultant chez ALTEN !

Nos équipes d’experts vous accompagneront pour devenir acteur de votre projet au sein d’un environnement multiculturel et pluridisciplinaire, avec une possibilité d’évolution dans tous les secteurs de l’ingénierie en France et à l’international.

Vous vous reconnaissez dans ce descriptif ? Alors n’attendez plus !

Apply now Apply later
Job stats:  4  1  0

Tags: Deep Learning Git LLMOps LLMs Machine Learning MLOps Pandas Pipelines Python PyTorch R Transformers

Perks/benefits: Career development

Region: Europe
Country: France

More jobs like this