Machine Learning Internship : Modèles d’Embedding Multimodaux H/F
Montreuil, France
Egis Group
An end-to-end global engineering and operating firm, Egis is creating a sustainable future for communities everywhere.Description de l'entreprise
Fondée en 2020, SustainEcho est la première plateforme qui utilise l’IA pour automatiser le calcul des analyses de cycle de vie des bâtiments directement à partir des métrés. Notre mission est de permettre à toutes les entreprises de la construction (promoteurs, constructeurs, bureaux d’études…) de s’engager sur la réduction de l’impact carbone de leurs projets, un secteur qui représente aujourd’hui 30% des émissions en France.
Nous mettons la Data Science et le Machine Learning au cœur de notre application pour démocratiser la réalisation de ces études complexes et essentielles. SustainEcho est utilisé par les plus grands acteurs du BTP en France tels que Bouygues Construction, Vinci Construction, Demathieu & Bard, Spie Batignolles, Egis, afin de réaliser des projets plus vertueux et définir leur stratégie carbone. Cela nous a permis d’être labellisés GreenTech Innovation par le Ministère de la Transition Écologique.
Pour accélérer notre développement, SustainEcho a rejoint le groupe Egis début 2023, ce qui nous permet de coupler nos capacités de développement logiciel agiles avec l’expertise métier et sectorielle du groupe Egis, leader de l'ingénierie en France.
Description du poste
Chez Egis, nous développons une solution utilisée par des milliers de collaborateurs afin d'améliorer leur quotidien. Notre travail couvre, entre autres, l'analyse de gros documents multilingues, l'extraction d'information et la réponse aux questions à grande échelle.
En tant que membre de l’équipe Machine Learning, vous serez chargé d'améliorer notre solution en utilisant les dernières technologies de l'intelligence artificielle. Votre travail portera spécifiquement sur les modèles d'embedding multimodal et multilingue pour la recherche d’information dans des documents. Ce travail contribuera également à améliorer notre système de RAG (Retrieval-Augmented Generation).
Vos missions principales seront :
- Étudier l’état de l’art des différentes solutions existantes et en sélectionner au moins une.
- Appliquer ces modèles pour la recherche d’information dans des documents.
- Préparer un jeu de données d’évaluation basé sur nos documents internes.
- Comparer les performances des modèles par rapport aux solutions actuelles.
- Étudier et optimiser le coût de déploiement (sur le cloud et en local).
Qualifications
Votre parcours
Issu(e) d’une formation Bac+5 en école d’ingénieur/université spécialisé(e) en sciences des données, mathématiques appliquées, ou domaine similaire à la recherche d’un stage de 6 mois.
Vos atouts
- Compréhension approfondie du Deep Learning (CNN/Transformers/Embedding).
- Solides compétences en Python et dans les bibliothèques utilisées (TensorFlow/PyTorch/Hugging Face).
- Bonne maîtrise de Linux et Git.
- Bonne compréhension de l'anglais.
- Une expérience sur Azure est un plus.
Nous recherchons un candidat passionné par l'intelligence artificielle et désireux de contribuer à des projets innovants. Si vous êtes motivé et prêt à relever ce défi, nous serions ravis de vous accueillir au sein de notre équipe.
Informations supplémentaires
Possibilité d'être basé.e sur un autre site de France avec des déplacements à Montreuil à prévoir.
Tags: Azure Bard Deep Learning Git Linux Machine Learning Python PyTorch RAG TensorFlow Transformers
More jobs like this
Explore more career opportunities
Find even more open roles below ordered by popularity of job title or skills/products/technologies used.