Stage 2025 - Data Science et Machine Learning/AI practitionner - Sujet : Probabilistic Gradient Boosted Trees (H/F/N)
Paris
Ekimetrics
Ekimetrics is a pioneering leader in data science and AI-powered solutions for sustainable business performance.
Ekimetrics est leader en data science et fournisseur de solutions AI. Depuis 2006, nous utilisons la data science au service de l’optimisation de performance marketing, business et de la transition vers une performance plus durable. Si vous êtes passionné.e de data, ou de technologie en général, et que vous avez envie d’être acteur.rice de votre avenir professionnel, votre place est sûrement chez Ekimetrics ! 📊Et si nous vous présentions quelques datas ? • 400 expert.e.s en data science • 1000 projets divers et variés pour plus de 350 clients • 5 bureaux : Paris, Hong Kong, Shanghai, Londres et New York • 1 milliard de $ de profits générés pour nos clients depuis 2006 🌱Chez Ekimetrics nous avons l’ambition d’accompagner nos clients à repenser leur business model, en réconciliant performance économique et objectifs durables, grâce à la data science. C’est pourquoi nous avons en interne toutes les compétences nous permettant de répondre aux besoins de nos clients : Product Managers, Product Designers, Data Architects, Lead Tech, Data Engineers, DevOps Engineers, Data Scientists. 🤝 L’équipe Data Science que vous pourriez rejoindre Pourquoi recrutons-nous ? Au sein d’Ekimetrics, le département Innovation travaille sur des sujets de recherche en IA en collaboration avec nos partenaires industriels et académiques. Le département regroupe plusieurs docteurs experts dans le domaine de l’IA générative,du deep learning, de la vision par ordinateur, de la série temporelle, de l’explicabilité, et de la causalité. Deux thèses CIFRE sont en cours, et deux débuteront en 2025. Autour de chaque expert des équipes sont constituées en charge de tester les algorithmes état de l’art et les adapter à des problématiques business spécifiques, de créer de nouvelles méthodologies ou algorithmes répondant à un problème relevé, et d’’assurer la passation en vue d’une intégration dans l’écosystème industriel d’Ekimetrics.
L'équipe de Forecasting au sein du Département d'Innovation d'Ekimetrics est dédiée à l'avancement des capacités prédictives grâce à une recherche de pointe en analyse de séries temporelles, prévision de la demande et prise de décision basée sur les données. Nous exploitons les techniques les plus récentes en intelligence artificielle et en modélisation statistique, incluant l'apprentissage automatique, l'inférence causale et la simulation de scénarios. En collaboration étroite avec des partenaires industriels et académiques, l'équipe s'attaque à des défis complexes de prévision dans divers secteurs, allant du commerce de détail et de la finance à la santé et aux télécommunications. En testant et en perfectionnant continuellement de nouveaux algorithmes et méthodologies, l'équipe de Prévision s'assure qu'Ekimetrics reste à la pointe de la production de prévisions exploitables et d'une grande précision, permettant aux entreprises de prendre des décisions plus éclairées et résilientes dans un marché dynamique.
Objectif du stage : Construire des modèles Probabilistic Gradient Boosting Machines
Pour les données tabulaires, les gradient boosted decision trees (GBDT), tels que XGBoost, LightGBM et CatBoost, se sont révélés essentiels pour diverses tâches, allant de la modélisation prédictive à la régression. Cependant, les GBDT existants présentent des limitations en termes de capacités de prévision probabiliste. Les Probabilistic Gradient Boosting Machines (PGBM) [1] visent à surmonter ces limitations en fournissant des prévisions probabilistes dans un cadre à modèle unique et évolutif. Ce stage se concentrera sur l’étude et l’amélioration des méthodologies PGBM afin de permettre desprévisions probabilistes de haute qualité avec une efficacité computationnelle, particulièrement adaptées aux applications à grande échelle.
Ce stage offre une opportunité de s'engager dans la recherche avancée en IA, avec la possibilité de poursuivre ensuite un programme de doctorat ou de rejoindre Ekimetrics en tant que Data Scientist en IA.
Plus particulièrement vos responsabilités seront de : • Réaliser une revue de littérature approfondie sur les Probabilistic Gradient Boosted Trees (PGBM) et leurs applications, en les comparant aux méthodes GBM traditionnelles et probabilistes.• Développer et expérimenter l’architecture PGBM, en se concentrant sur les techniques permettant d’obtenir des prédictions ponctuelles et probabilistes à l’aide de poids de feuilles stochastiques.• Explorer des moyens d’optimiser les estimations probabilistes après l’entraînement en ajustant les hyperparamètres et en explorant les choix de distribution afin de maximiser la précision des prévisions.• Collaborer avec votre N+1 pour valider et tester les modèles sur des ensembles de données à grande échelle.• Partager les résultats avec les équipes internes et contribuer au développement de stratégies à long terme pour le déploiement de solutions de gradient boosting probabilistes en production.
Le profil et les compétences recherchées : • Actuellement en dernière année de Master ou d'École d'Ingénieurs, avec une solide formation en apprentissage automatique, statistiques et programmation.• Expérience avec Python, les frameworks de gradient boosting (par exemple, LightGBM, XGBoost) et une familiarité avec les méthodes probabilistes.• Compétences analytiques et en résolution de problèmes, avec un fort intérêt pour le développement de modèles évolutifs et performants.• Maîtrise de l'anglais. 🤝 Pourquoi nous rejoindre ? Rejoindre Ekimetrics, c’est intégrer une entreprise dont les valeurs s’appliquent au quotidien :
• Evoluer dans un environnement type start-up et non traditionnel (#curiosité)• Être capable de prendre le feedback pour s’améliorer (#excellence)• Se former dès son arrivée et en continu grâce à une expérience apprenante unique et riche de nombreuses ressources (internes, externes, live et digital) alliant savoirs techniques, savoir-être et savoir-faire (#transmission)• Faire partie d’une communauté accueillante et soudée (#plaisir)• Imaginer des solutions inattendues & sortir de sa zone de confort (#créativité) En 2023, Ekimetrics a obtenu le statut d’entreprise à mission qui témoigne de notre ambition forte en matière de RSE. Nous sommes également certifiés Great Place to Work. 🤩Vous aurez accès à … • Au catalogue de formation EkiA qui contient des programmes qui vous feront monter en compétences sur nos solutions et nos métiers, des parcours apprenants sur notre plateforme digitale ainsi que des programmes dédiés à nos enjeux prioritaires, dont la sensibilisation aux sujets environnementaux avec la Climate School AXA.• Une vie sportive, artistique, musicale, ludique, caritative et engagée : de notre salle de sport privatisée à nos expositions d’art, en passant par des jeux vidéo et des concerts, ou encore les défis RSE sur la plateforme Vendredi ;• De nombreux évènements et séminaires pour rester proche de votre communauté ; • Des locaux modernes dans un quartier dynamique au cœur de Paris (Grands boulevards)• Une politique de télétravail flexible. 🔄 Notre processus recrutement 🔸 Un test technique sur HackerRank🔸 Un entretien RH avec un(e) Talent Acquisition🔸 Une étude de cas avec un(e) Consultant(e)🔸 Un entretien final avec un(e) Consultant(e) Senior Nous serions ravi.e.s de vous donner de plus amples informations lors d’un entretien et attendons votre candidature avec impatience !
References: [1] https://arxiv.org/pdf/2106.01682
En tant qu’employeur, Ekimetrics offre à tous les mêmes opportunités d’accès à l’emploi sans distinction de genre, ethnicité, religion, orientation sexuelle, statut social, handicap et d’âge. Ekimetrics veille à développer un environnement de travail inclusif qui reflète la diversité dans ses équipes.
L'équipe de Forecasting au sein du Département d'Innovation d'Ekimetrics est dédiée à l'avancement des capacités prédictives grâce à une recherche de pointe en analyse de séries temporelles, prévision de la demande et prise de décision basée sur les données. Nous exploitons les techniques les plus récentes en intelligence artificielle et en modélisation statistique, incluant l'apprentissage automatique, l'inférence causale et la simulation de scénarios. En collaboration étroite avec des partenaires industriels et académiques, l'équipe s'attaque à des défis complexes de prévision dans divers secteurs, allant du commerce de détail et de la finance à la santé et aux télécommunications. En testant et en perfectionnant continuellement de nouveaux algorithmes et méthodologies, l'équipe de Prévision s'assure qu'Ekimetrics reste à la pointe de la production de prévisions exploitables et d'une grande précision, permettant aux entreprises de prendre des décisions plus éclairées et résilientes dans un marché dynamique.
Objectif du stage : Construire des modèles Probabilistic Gradient Boosting Machines
Pour les données tabulaires, les gradient boosted decision trees (GBDT), tels que XGBoost, LightGBM et CatBoost, se sont révélés essentiels pour diverses tâches, allant de la modélisation prédictive à la régression. Cependant, les GBDT existants présentent des limitations en termes de capacités de prévision probabiliste. Les Probabilistic Gradient Boosting Machines (PGBM) [1] visent à surmonter ces limitations en fournissant des prévisions probabilistes dans un cadre à modèle unique et évolutif. Ce stage se concentrera sur l’étude et l’amélioration des méthodologies PGBM afin de permettre desprévisions probabilistes de haute qualité avec une efficacité computationnelle, particulièrement adaptées aux applications à grande échelle.
Ce stage offre une opportunité de s'engager dans la recherche avancée en IA, avec la possibilité de poursuivre ensuite un programme de doctorat ou de rejoindre Ekimetrics en tant que Data Scientist en IA.
Plus particulièrement vos responsabilités seront de : • Réaliser une revue de littérature approfondie sur les Probabilistic Gradient Boosted Trees (PGBM) et leurs applications, en les comparant aux méthodes GBM traditionnelles et probabilistes.• Développer et expérimenter l’architecture PGBM, en se concentrant sur les techniques permettant d’obtenir des prédictions ponctuelles et probabilistes à l’aide de poids de feuilles stochastiques.• Explorer des moyens d’optimiser les estimations probabilistes après l’entraînement en ajustant les hyperparamètres et en explorant les choix de distribution afin de maximiser la précision des prévisions.• Collaborer avec votre N+1 pour valider et tester les modèles sur des ensembles de données à grande échelle.• Partager les résultats avec les équipes internes et contribuer au développement de stratégies à long terme pour le déploiement de solutions de gradient boosting probabilistes en production.
Le profil et les compétences recherchées : • Actuellement en dernière année de Master ou d'École d'Ingénieurs, avec une solide formation en apprentissage automatique, statistiques et programmation.• Expérience avec Python, les frameworks de gradient boosting (par exemple, LightGBM, XGBoost) et une familiarité avec les méthodes probabilistes.• Compétences analytiques et en résolution de problèmes, avec un fort intérêt pour le développement de modèles évolutifs et performants.• Maîtrise de l'anglais. 🤝 Pourquoi nous rejoindre ? Rejoindre Ekimetrics, c’est intégrer une entreprise dont les valeurs s’appliquent au quotidien :
• Evoluer dans un environnement type start-up et non traditionnel (#curiosité)• Être capable de prendre le feedback pour s’améliorer (#excellence)• Se former dès son arrivée et en continu grâce à une expérience apprenante unique et riche de nombreuses ressources (internes, externes, live et digital) alliant savoirs techniques, savoir-être et savoir-faire (#transmission)• Faire partie d’une communauté accueillante et soudée (#plaisir)• Imaginer des solutions inattendues & sortir de sa zone de confort (#créativité) En 2023, Ekimetrics a obtenu le statut d’entreprise à mission qui témoigne de notre ambition forte en matière de RSE. Nous sommes également certifiés Great Place to Work. 🤩Vous aurez accès à … • Au catalogue de formation EkiA qui contient des programmes qui vous feront monter en compétences sur nos solutions et nos métiers, des parcours apprenants sur notre plateforme digitale ainsi que des programmes dédiés à nos enjeux prioritaires, dont la sensibilisation aux sujets environnementaux avec la Climate School AXA.• Une vie sportive, artistique, musicale, ludique, caritative et engagée : de notre salle de sport privatisée à nos expositions d’art, en passant par des jeux vidéo et des concerts, ou encore les défis RSE sur la plateforme Vendredi ;• De nombreux évènements et séminaires pour rester proche de votre communauté ; • Des locaux modernes dans un quartier dynamique au cœur de Paris (Grands boulevards)• Une politique de télétravail flexible. 🔄 Notre processus recrutement 🔸 Un test technique sur HackerRank🔸 Un entretien RH avec un(e) Talent Acquisition🔸 Une étude de cas avec un(e) Consultant(e)🔸 Un entretien final avec un(e) Consultant(e) Senior Nous serions ravi.e.s de vous donner de plus amples informations lors d’un entretien et attendons votre candidature avec impatience !
References: [1] https://arxiv.org/pdf/2106.01682
En tant qu’employeur, Ekimetrics offre à tous les mêmes opportunités d’accès à l’emploi sans distinction de genre, ethnicité, religion, orientation sexuelle, statut social, handicap et d’âge. Ekimetrics veille à développer un environnement de travail inclusif qui reflète la diversité dans ses équipes.
* Salary range is an estimate based on our AI, ML, Data Science Salary Index 💰
Job stats:
0
0
0
Categories:
Big Data Jobs
Deep Learning Jobs
Machine Learning Jobs
Tags: Architecture Deep Learning DevOps Finance LightGBM Machine Learning Python Vue XGBoost
Perks/benefits: Flex hours
Region:
Europe
Country:
France
More jobs like this
Explore more career opportunities
Find even more open roles below ordered by popularity of job title or skills/products/technologies used.
Data Engineer II jobsStaff Data Scientist jobsPrincipal Data Engineer jobsBI Developer jobsData Scientist II jobsData Manager jobsData Science Manager jobsJunior Data Analyst jobsResearch Scientist jobsBusiness Data Analyst jobsLead Data Analyst jobsData Science Intern jobsSr. Data Scientist jobsSenior AI Engineer jobsData Engineer III jobsSenior Data Scientist, Performance Marketing jobsBI Analyst jobsSoftware Engineer, Machine Learning jobsSr Data Engineer jobsData Specialist jobsJunior Data Scientist jobsJunior Data Engineer jobsSenior Artificial Intelligence/Machine Learning Engineer - Remote, Latin America jobsData Analyst Intern jobsData Engineering Manager jobs
Linux jobsSnowflake jobsEconomics jobsOpen Source jobsHadoop jobsPhysics jobsJavaScript jobsAirflow jobsComputer Vision jobsMLOps jobsRDBMS jobsKafka jobsNoSQL jobsScala jobsData Warehousing jobsBanking jobsGoogle Cloud jobsData warehouse jobsKPIs jobsGitHub jobsOracle jobsPostgreSQL jobsR&D jobsClassification jobsScikit-learn jobs
SAS jobsTerraform jobsCX jobsLooker jobsScrum jobsStreaming jobsDistributed Systems jobsPandas jobsData Mining jobsJenkins jobsRobotics jobsBigQuery jobsIndustrial jobsPySpark jobsJira jobsReact jobsMicroservices jobsdbt jobsRedshift jobsMatlab jobsUnstructured data jobsE-commerce jobsMySQL jobsGPU jobsData strategy jobs