Stage Direction de l'Innovation : Ingénieur Intelligence Artificielle / NLP
Rennes, France
Applications have closed
ALTEN
Leader in Engineering and IT Services, ALTEN supports its customers’ development strategies in the areas of innovation, R&D and technological information systems.Description du poste
A la Direction de l’Innovation, nous menons des projets de recherche sur des champs d’expérimentation très larges et multi-sectoriels.
Ces projets innovants, développés en équipes, sont encadrés par nos experts au sein des ALTEN Labs (IDF, Toulouse, Grenoble, Rennes et Sophia Antipolis), et tentent de répondre aux enjeux de nos clients en leur fournissant des solutions technologiques originales et disruptives.
Au sein de notre Lab de Rennes, vous serez accompagné(e) par un Pilote Innovation (Chef de projet) pour vous permettre de développer vos compétences sur les activités d'un des projets suivants (plusieurs stages à pourvoir).
Projet : Illustrateur RAG (LLM) sur des données d'entreprises hétérogènes
Les entreprises possèdent beaucoup de données internes sous exploitées. En cause, les données sont souvent hétérogènes, volumineuses, multi-sources, de faible qualité et confidentielles/protégées.
Pourtant, rendre accessible ces données en une base de connaissances permettrait un gain de temps important pour les entreprises.
A partir des avancées récentes des modèles de langues LLM, et en s'appuyant sur l'expertise acquise via deux projets ALTEN, l'objectif sera de mettre en place un illustrateur permettant d'illustrer l'intérêt de construire une telle base de connaissances avec des données réelles internes et externes.
Le travail consistera notamment à :
- Intégrer/Améliorer des composants IA existants dans la plateforme (OCR, RAG, IA pour augmenter la qualité des données QoD)
- Construire un illustrateur à partir des plateformes et interfaces existantes
- Livrable final : une vidéo et un scénario démo live utilisant les composants
Projet : Pilotage en langage naturel dans un environnement multi-agents
Aujourd’hui il est possible de commander un appareil (un agent) à la voix via des instructions paramétrées. Or, pour faciliter la reconnaissance, ces instructions sont souvent simples et spécifiques à l’agent. Nous souhaitons mettre en place un environnement dans lequel plusieurs agents co-existent ensemble, et pour lequel un seul système de reconnaissance vocale permet de piloter l’ensemble de ces agents à partir de peu de données.
Dans ce contexte, l’objectif de ce stage sera de :
- Utiliser des modèles de NLP (LLM, NER, POS tagging) pour détecter des intentions et les champs associés
- Mettre en place un modèle de rejets pour filtrer l'information pertinente
- Programmer en langage naturel à partir de l'interprétation des instructions : "drone suis-moi !" = Détecter ma position + Avancer jusqu'à ma position tant qu'il n'y a pas de contre ordre
Projet : Exploration de la programmation en langage naturel vers un langage exécutable
ALTEN souhaite disposer d’une plateforme expérimentale donnant les moyens de montrer à ses clients de nouvelles approches en matière d’écriture et d’exécution de scénario en langage naturel (NLP).
Nous avons déjà posé l’approche à travers deux cas d’usage basics. Aujourd’hui nous voulons aller plus loin dans le passage de scripts en langage naturel vers leur équivalent en langage.
- Poursuivre l’état de l’art en la matière
- Explorer des pistes de réalisation (utilisation des outils du NLP : distance sémantique, IA génératives, Ontologies…)
- Expérimenter à travers un cas d’usage (exemple : l’automatisation des tests d’une application)
- Evaluer les différentes expérimentations (mesures, critiques et perspectives)
Projet : Extraction d'information dans les documents pour détecter le GreenWashing
Le développement durable devient un enjeu majeur pour la société publique et les entreprises. Les placements dans les ISR (Investissement Socialement Responsable) sont un moyen d' infléchir l'économie vers un développement plus durable. Néanmoins, la réglementation est floue et peu exigeante, ce qui laisse à certaines entreprises malveillantes la possibilité de tromper les investisseurs et consommateurs pour se présenter faussement en faveur de l'écologie (GreenWashing).
Dans ce contexte, les objectifs sont les suivants :
- Collecter des données publiques des entreprises indiquant leur stratégie de développement durable (RSE, Rapport Annuel …)
- Extraire les entités en lien avec la stratégie green et les contextualiser
- Définir des critères d'évaluation des stratégies green
Qualifications
Vous êtes étudiant(e) en dernière année d’École d’Ingénieur à la recherche d’un stage de fin d’étude et vous avez suivi une spécialité en Intelligence Artificielle / Data Science (deep learning, NLP, BERT, NER, BLOOM, GPT).
Vous justifiez de bonnes connaissances en IA/NLP, en développement (Python, Java) et avez des bases en IHM.
Vous maîtrisez plusieurs outils associés tels que Spacy, Flask, Pands, Hugging Face - Transformers, que vous avez su mettre en application lors de votre formation.
Une appétence à la recherche serait fortement appréciée.
Réactif(ve), rigoureux(se), autonome et doté(e) du sens du service, vous souhaitez évoluer dans un environnement challengeant.
Informations supplémentaires
Rejoindre nos ALTEN Labs, c’est être au cœur de la culture de l’innovation, et une promesse de monter en compétences sur des sujets concrets en équipe projet, avec à la clé une embauche en CDI en tant que consultant chez ALTEN !
Nos équipes d’experts vous accompagneront pour devenir acteur de votre projet au sein d’un environnement multiculturel et pluridisciplinaire, avec une possibilité d’évolution dans tous les secteurs de l’ingénierie en France et à l’international.
Vous vous reconnaissez dans ce descriptif ? Alors n’attendez plus !
Tags: BERT Deep Learning Flask GPT Java LLMs NLP OCR Python RAG spaCy Transformers
Perks/benefits: Career development
More jobs like this
Explore more career opportunities
Find even more open roles below ordered by popularity of job title or skills/products/technologies used.