Stage 2025 - Data Science et Machine Learning/AI practitionner - Sujet : LLM & Pattern Mining (H/F/N)
Paris
Ekimetrics
Ekimetrics is a pioneering leader in data science and AI-powered solutions for sustainable business performance.
Ekimetrics est leader en data science et fournisseur de solutions AI. Depuis 2006, nous utilisons la data science au service de l’optimisation de performance marketing, business et de la transition vers une performance plus durable. Si vous êtes passionné.e de data, ou de technologie en général, et que vous avez envie d’être acteur.rice de votre avenir professionnel, votre place est sûrement chez Ekimetrics ! 📊Et si nous vous présentions quelques datas ? • 400 expert.e.s en data science • 1000 projets divers et variés pour plus de 350 clients • 5 bureaux : Paris, Hong Kong, Shanghai, Londres et New York • 1 milliard de $ de profits générés pour nos clients depuis 2006 🌱Chez Ekimetrics nous avons l’ambition d’accompagner nos clients à repenser leur business model, en réconciliant performance économique et objectifs durables, grâce à la data science. C’est pourquoi nous avons en interne toutes les compétences nous permettant de répondre aux besoins de nos clients : Product Managers, Product Designers, Data Architects, Lead Tech, Data Engineers, DevOps Engineers, Data Scientists. 🤝 L’équipe Data Science que vous pourriez rejoindre Pourquoi recrutons-nous ? Au sein d’Ekimetrics, le département Innovation travaille sur des sujets de recherche en IA en collaboration avec nos partenaires industriels et académiques. Le département regroupe plusieurs docteurs experts dans le domaine de l’IA générative,du deep learning, de la vision par ordinateur, de la série temporelle, de l’explicabilité, et de la causalité. Deux thèses CIFRE sont en cours, et deux débuteront en 2025. Autour de chaque expert des équipes sont constituées en charge de tester les algorithmes état de l’art et les adapter à des problématiques business spécifiques, de créer de nouvelles méthodologies ou algorithmes répondant à un problème relevé, et d’’assurer la passation en vue d’une intégration dans l’écosystème industriel d’Ekimetrics.
Le stream NLP GenAI d'Ekimetrics se concentre sur l'exploitation et l'intégration des modèles de langage (LLM) dans des solutions industrielles. Notre équipe développe des approches innovantes pour optimiser l'utilisation des LLM dans des contextes variés, en mettant l'accent sur la fiabilité, la performance et l'efficacité des solutions déployées. Nous travaillons particulièrement sur l'adaptation de ces technologies aux contraintes spécifiques de nos clients, notamment en termes de confidentialité des données et de coûts d'exploitation.
Ce stage de recherche vise à réaliser une analyse approfondie des textes, allant au-delà de la simple classification pour extraire des motifs interprétables et exploitables par les utilisateurs. Ces motifs sont définis comme des ensembles de textes (par exemple, commentaires, retours d’expérience) les plus pertinents et sélectionnés selon des critères spécifiques définis par l’utilisateur, tels que la fréquence, le niveau de confiance ou la similarité.
Cette approche hybride innovante combine les modèles LLM, le pattern mining et le clustering, permettant de dépasser les méthodes traditionnelles qui se limitent souvent à l'extraction de mots-clés ou de thématiques (Rijcken et al., 2022 ; Mamdouh et al., 2023). Notre solution permet ainsi de révéler des informations cachées et d’identifier des corrélations complexes entre les textes en extrayant des motifs correspondant précisément aux critères du client, avec des applications concrètes pour améliorer les services et accroître la satisfaction des utilisateurs. Une attention particulière sera portée à l’intérêt et à l’interprétabilité des motifs extraits, ainsi qu’à l'efficacité de l’algorithme en matière de performances et d’optimisation de la mémoire.
Plus particulièrement vos responsabilités seront de : • Assurer une veille sur l’état de l’art dans le domaine du deep learning (plus spécialement de l’IA générative) et pattern mining• Effectuer un travail de recherche au sein du département Innovation sur llm, nlp et pattern mining, avec pour objectif de développer une approche hybride innovante permettant d’identifier des motifs interprétables et des corrélations entre les textes• Mener des expérimentations intégrant des analyses qualitatives et quantitatives afin de démontrer l'intérêt, la scalabilité et l'efficacité des modèles• Respecter les bonnes pratiques de code pour assurer l’industrialisation de ceux-ci avec nos experts Solution• Partager vos connaissances en interne en apportant un support d’expert• Documenter les modèles et les résultats de recherche de manière structurée et claire, avec des rapports détaillant les méthodologies employées et les résultats obtenus
Le profil et les compétences recherchées : • En stage de fin d’étude d’une grande école d’ingénieur ou de master 2, vous avez acquis de solides connaissances en deep learning, en NLP et en data mining• Expérience dans les méthodologies et bonnes pratiques de développement : Tests unitaires, versionning, CD/CI• Compréhension approfondie des algorithmes et capacité à développer des algorithmes depuis zéro• Compétences approfondies en Python• Maitrise des librairies Pytorch, numpy, sklearn, pandas• Forte capacité d'analyse et de résolution de problèmes• Connaissances approfondies en probabilités, mathématiques et statistiques• Anglais courant. 🤝 Pourquoi nous rejoindre ? Rejoindre Ekimetrics, c’est intégrer une entreprise dont les valeurs s’appliquent au quotidien :
• Evoluer dans un environnement type start-up et non traditionnel (#curiosité)• Être capable de prendre le feedback pour s’améliorer (#excellence)• Se former dès son arrivée et en continu grâce à une expérience apprenante unique et riche de nombreuses ressources (internes, externes, live et digital) alliant savoirs techniques, savoir-être et savoir-faire (#transmission)• Faire partie d’une communauté accueillante et soudée (#plaisir)• Imaginer des solutions inattendues & sortir de sa zone de confort (#créativité) En 2023, Ekimetrics a obtenu le statut d’entreprise à mission qui témoigne de notre ambition forte en matière de RSE. Nous sommes également certifiés Great Place to Work. 🤩Vous aurez accès à … • Au catalogue de formation EkiA qui contient des programmes qui vous feront monter en compétences sur nos solutions et nos métiers, des parcours apprenants sur notre plateforme digitale ainsi que des programmes dédiés à nos enjeux prioritaires, dont la sensibilisation aux sujets environnementaux avec la Climate School AXA.• Une vie sportive, artistique, musicale, ludique, caritative et engagée : de notre salle de sport privatisée à nos expositions d’art, en passant par des jeux vidéo et des concerts, ou encore les défis RSE sur la plateforme Vendredi ;• De nombreux évènements et séminaires pour rester proche de votre communauté ; • Des locaux modernes dans un quartier dynamique au cœur de Paris (Grands boulevards)• Une politique de télétravail flexible. 🔄 Notre processus recrutement 🔸 Un test technique sur HackerRank🔸 Un entretien RH avec un(e) Talent Acquisition🔸 Une étude de cas avec un(e) Consultant(e)🔸 Un entretien final avec un(e) Consultant(e) Senior Nous serions ravi.e.s de vous donner de plus amples informations lors d’un entretien et attendons votre candidature avec impatience !
Références :Rijcken, Emil, et al. "Topic modeling for interpretable text classification from EHRs." Frontiers in big Data 5 (2022): 846930.Mamdouh Farghaly, Heba, and Tarek Abd El-Hafeez. "A high-quality feature selection method based on frequent and correlated items for text classification." Soft Computing 27.16 (2023): 11259-11274. En tant qu’employeur, Ekimetrics offre à tous les mêmes opportunités d’accès à l’emploi sans distinction de genre, ethnicité, religion, orientation sexuelle, statut social, handicap et d’âge. Ekimetrics veille à développer un environnement de travail inclusif qui reflète la diversité dans ses équipes.
Le stream NLP GenAI d'Ekimetrics se concentre sur l'exploitation et l'intégration des modèles de langage (LLM) dans des solutions industrielles. Notre équipe développe des approches innovantes pour optimiser l'utilisation des LLM dans des contextes variés, en mettant l'accent sur la fiabilité, la performance et l'efficacité des solutions déployées. Nous travaillons particulièrement sur l'adaptation de ces technologies aux contraintes spécifiques de nos clients, notamment en termes de confidentialité des données et de coûts d'exploitation.
Ce stage de recherche vise à réaliser une analyse approfondie des textes, allant au-delà de la simple classification pour extraire des motifs interprétables et exploitables par les utilisateurs. Ces motifs sont définis comme des ensembles de textes (par exemple, commentaires, retours d’expérience) les plus pertinents et sélectionnés selon des critères spécifiques définis par l’utilisateur, tels que la fréquence, le niveau de confiance ou la similarité.
Cette approche hybride innovante combine les modèles LLM, le pattern mining et le clustering, permettant de dépasser les méthodes traditionnelles qui se limitent souvent à l'extraction de mots-clés ou de thématiques (Rijcken et al., 2022 ; Mamdouh et al., 2023). Notre solution permet ainsi de révéler des informations cachées et d’identifier des corrélations complexes entre les textes en extrayant des motifs correspondant précisément aux critères du client, avec des applications concrètes pour améliorer les services et accroître la satisfaction des utilisateurs. Une attention particulière sera portée à l’intérêt et à l’interprétabilité des motifs extraits, ainsi qu’à l'efficacité de l’algorithme en matière de performances et d’optimisation de la mémoire.
Plus particulièrement vos responsabilités seront de : • Assurer une veille sur l’état de l’art dans le domaine du deep learning (plus spécialement de l’IA générative) et pattern mining• Effectuer un travail de recherche au sein du département Innovation sur llm, nlp et pattern mining, avec pour objectif de développer une approche hybride innovante permettant d’identifier des motifs interprétables et des corrélations entre les textes• Mener des expérimentations intégrant des analyses qualitatives et quantitatives afin de démontrer l'intérêt, la scalabilité et l'efficacité des modèles• Respecter les bonnes pratiques de code pour assurer l’industrialisation de ceux-ci avec nos experts Solution• Partager vos connaissances en interne en apportant un support d’expert• Documenter les modèles et les résultats de recherche de manière structurée et claire, avec des rapports détaillant les méthodologies employées et les résultats obtenus
Le profil et les compétences recherchées : • En stage de fin d’étude d’une grande école d’ingénieur ou de master 2, vous avez acquis de solides connaissances en deep learning, en NLP et en data mining• Expérience dans les méthodologies et bonnes pratiques de développement : Tests unitaires, versionning, CD/CI• Compréhension approfondie des algorithmes et capacité à développer des algorithmes depuis zéro• Compétences approfondies en Python• Maitrise des librairies Pytorch, numpy, sklearn, pandas• Forte capacité d'analyse et de résolution de problèmes• Connaissances approfondies en probabilités, mathématiques et statistiques• Anglais courant. 🤝 Pourquoi nous rejoindre ? Rejoindre Ekimetrics, c’est intégrer une entreprise dont les valeurs s’appliquent au quotidien :
• Evoluer dans un environnement type start-up et non traditionnel (#curiosité)• Être capable de prendre le feedback pour s’améliorer (#excellence)• Se former dès son arrivée et en continu grâce à une expérience apprenante unique et riche de nombreuses ressources (internes, externes, live et digital) alliant savoirs techniques, savoir-être et savoir-faire (#transmission)• Faire partie d’une communauté accueillante et soudée (#plaisir)• Imaginer des solutions inattendues & sortir de sa zone de confort (#créativité) En 2023, Ekimetrics a obtenu le statut d’entreprise à mission qui témoigne de notre ambition forte en matière de RSE. Nous sommes également certifiés Great Place to Work. 🤩Vous aurez accès à … • Au catalogue de formation EkiA qui contient des programmes qui vous feront monter en compétences sur nos solutions et nos métiers, des parcours apprenants sur notre plateforme digitale ainsi que des programmes dédiés à nos enjeux prioritaires, dont la sensibilisation aux sujets environnementaux avec la Climate School AXA.• Une vie sportive, artistique, musicale, ludique, caritative et engagée : de notre salle de sport privatisée à nos expositions d’art, en passant par des jeux vidéo et des concerts, ou encore les défis RSE sur la plateforme Vendredi ;• De nombreux évènements et séminaires pour rester proche de votre communauté ; • Des locaux modernes dans un quartier dynamique au cœur de Paris (Grands boulevards)• Une politique de télétravail flexible. 🔄 Notre processus recrutement 🔸 Un test technique sur HackerRank🔸 Un entretien RH avec un(e) Talent Acquisition🔸 Une étude de cas avec un(e) Consultant(e)🔸 Un entretien final avec un(e) Consultant(e) Senior Nous serions ravi.e.s de vous donner de plus amples informations lors d’un entretien et attendons votre candidature avec impatience !
Références :Rijcken, Emil, et al. "Topic modeling for interpretable text classification from EHRs." Frontiers in big Data 5 (2022): 846930.Mamdouh Farghaly, Heba, and Tarek Abd El-Hafeez. "A high-quality feature selection method based on frequent and correlated items for text classification." Soft Computing 27.16 (2023): 11259-11274. En tant qu’employeur, Ekimetrics offre à tous les mêmes opportunités d’accès à l’emploi sans distinction de genre, ethnicité, religion, orientation sexuelle, statut social, handicap et d’âge. Ekimetrics veille à développer un environnement de travail inclusif qui reflète la diversité dans ses équipes.
* Salary range is an estimate based on our AI, ML, Data Science Salary Index 💰
Job stats:
0
0
0
Categories:
Deep Learning Jobs
Machine Learning Jobs
Tags: Big Data Classification Clustering Data Mining Deep Learning DevOps Generative AI LLMs Machine Learning NLP NumPy Pandas Python PyTorch Scikit-learn Topic modeling Vue
Perks/benefits: Flex hours
Region:
Europe
Country:
France
More jobs like this
Explore more career opportunities
Find even more open roles below ordered by popularity of job title or skills/products/technologies used.
Principal Data Scientist jobsPrincipal Data Engineer jobsData Scientist II jobsStaff Data Scientist jobsBI Developer jobsData Manager jobsJunior Data Analyst jobsResearch Scientist jobsData Science Manager jobsBusiness Data Analyst jobsLead Data Analyst jobsSenior AI Engineer jobsData Engineer III jobsData Science Intern jobsSr. Data Scientist jobsData Specialist jobsSoftware Engineer II jobsData Analyst Intern jobsSoftware Engineer, Machine Learning jobsJunior Data Engineer jobsData Analyst II jobsBI Analyst jobsSenior Data Scientist, Performance Marketing jobsSr Data Engineer jobsPrincipal Software Engineer jobs
Economics jobsSnowflake jobsLinux jobsHadoop jobsComputer Vision jobsOpen Source jobsJavaScript jobsMLOps jobsPhysics jobsBanking jobsRDBMS jobsKafka jobsAirflow jobsNoSQL jobsData Warehousing jobsScala jobsR&D jobsGoogle Cloud jobsKPIs jobsStreaming jobsData warehouse jobsClassification jobsGitHub jobsOracle jobsCX jobs
SAS jobsPostgreSQL jobsScikit-learn jobsData Mining jobsScrum jobsE-commerce jobsPandas jobsTerraform jobsDistributed Systems jobsPySpark jobsLooker jobsBigQuery jobsRobotics jobsJira jobsIndustrial jobsJenkins jobsUnstructured data jobsdbt jobsRedshift jobsReact jobsData strategy jobsMicroservices jobsMySQL jobsPharma jobsNumPy jobs