Machine Learning Internship : Evaluation du pipeline RAG H/F
Montreuil, France
Egis Group
An end-to-end global engineering and operating firm, Egis is creating a sustainable future for communities everywhere.Description de l'entreprise
Fondée en 2020, SustainEcho est la première plateforme qui utilise l’IA pour automatiser le calcul des analyses de cycle de vie des bâtiments directement à partir des métrés. Notre mission est de permettre à toutes les entreprises de la construction (promoteurs, constructeurs, bureaux d’études…) de s’engager sur la réduction de l’impact carbone de leurs projets, un secteur qui représente aujourd’hui 30% des émissions en France. Nous mettons la Data Science et le Machine Learning au cœur de notre application pour démocratiser la réalisation de ces études complexes et essentielles. SustainEcho est utilisé par les plus grands acteurs du BTP en France tels que Bouygues Construction, Vinci Construction, Demathieu & Bard, Spie Batignolles, Egis, afin de réaliser des projets plus vertueux et définir leur stratégie carbone. Cela nous a permis d’être labellisés GreenTech Innovation par le Ministère de la Transition Écologique. Pour accélérer notre développement, SustainEcho a rejoint le groupe Egis début 2023, ce qui nous permet de coupler nos capacités de développement logiciel agiles avec l’expertise métier et sectorielle du groupe Egis, leader de l'ingénierie en France.
Description du poste
Chez Egis, nous développons une solution utilisée par des milliers de collaborateurs afin d'améliorer leur quotidien. Notre travail couvre, entre autres, l'analyse de gros documents multilingues, l'extraction d'information et la réponse aux questions à grande échelle. Au sein de l’équipe Machine Learning, vous serez chargé(e) de travailler sur l’évaluation et l’amélioration de notre pipeline RAG (Retrieval-Augmented Generation). Ce pipeline, qui combine ingestion de documents, embedding, recherche d’information, et re-ranking, est au cœur de nos solutions d’IA.
L’objectif principal de ce stage est de garantir la qualité et la fiabilité des résultats produits par ce pipeline à travers une meilleure compréhension, évaluation, et optimisation de ses différentes étapes.
Encadré(e) par des experts en Machine Learning, vos responsabilités incluront :
· Étudier et comprendre chaque composant clé (document digestion, embedding, retriever, reranker, etc.) du pipeline RAG.
· Explorer l’état de l’art pour identifier les meilleures métriques adaptées à chaque étape du pipeline.
· Développer des datasets spécifiques pour évaluer les performances de nos modèles et méthodes.
· Construire une solution pour automatiser les tests dans une approche d’intégration et déploiement continus (CI/CD).
Qualifications
Issu(e) d’une formation Bac+5 en école d’ingénieur/université spécialisé(e) en sciences des données, mathématiques appliquées, ou domaine similaire à la recherche d’un stage de 6 mois. Vos atouts
· Bonne compréhension des systèmes RAG et de leurs composants.
· Maîtrise de Python et des bibliothèques associées (TensorFlow, PyTorch, Hugging Face).
· Familiarité avec les environnements Linux et les outils de versioning comme Git.
· Connaissance des métriques d’évaluation des modèles en Machine Learning.
· Compétence en anglais technique pour lire et interpréter des publications scientifiques.
· Une expérience avec Azure ou d’autres plateformes cloud est un plus.
Nous recherchons un candidat passionné par l'intelligence artificielle et désireux de contribuer à des projets innovants. Si vous êtes motivé et prêt à relever ce défi, nous serions ravis de vous accueillir au sein de notre équipe.
Informations supplémentaires
Nous vous offrons l'opportunité d'intégrer une société en croissance, reconnue pour la qualité de son expertise technique et de son engagement dans la transition énergétique, et d'évoluer dans un environnement dynamique et bienveillant.
Rémunération et avantages sociaux grand groupe attractifs, EGIS s'engage pour la Qualité de Vie au Travail, notamment par le biais de son accord en faveur du télétravail signé en 2013 et reconduit en 2019 puis en 2023.
Tags: Azure Bard CI/CD Git Linux Machine Learning Python PyTorch RAG TensorFlow
More jobs like this
Explore more career opportunities
Find even more open roles below ordered by popularity of job title or skills/products/technologies used.