Stage 2025 - Data Science et Machine Learning/AI practitionner - Sujet : Foundation models for tabular data (H/F/N)

Paris

Ekimetrics

Ekimetrics is a pioneering leader in data science and AI-powered solutions for sustainable business performance.

View all jobs at Ekimetrics

Apply now Apply later

Ekimetrics est leader en data science et fournisseur de solutions AI. Depuis 2006, nous utilisons la data science au service de l’optimisation de performance marketing, business et de la transition vers une performance plus durable. Si vous êtes passionné.e de data, ou de technologie en général, et que vous avez envie d’être acteur.rice de votre avenir professionnel, votre place est sûrement chez Ekimetrics ! 📊Et si nous vous présentions quelques datas ?  • 400 expert.e.s en data science • 1000 projets divers et variés pour plus de 350 clients • 5 bureaux : Paris, Hong Kong, Shanghai, Londres et New York • 1 milliard de $ de profits générés pour nos clients depuis 2006   🌱Chez Ekimetrics nous avons l’ambition d’accompagner nos clients à repenser leur business model, en réconciliant performance économique et objectifs durables, grâce à la data science.  C’est pourquoi nous avons en interne toutes les compétences nous permettant de répondre aux besoins de nos clients : Product Managers, Product Designers, Data Architects, Lead Tech, Data Engineers, DevOps Engineers, Data Scientists. 🤝 L’équipe Data Science que vous pourriez rejoindre  Pourquoi recrutons-nous ?  Au sein d’Ekimetrics, le département Innovation travaille sur des sujets de recherche en IA en collaboration avec nos partenaires industriels et académiques. Le département regroupe plusieurs docteurs experts dans le domaine de l’IA générative,du deep learning, de la vision par ordinateur, de la série temporelle, de l’explicabilité, et de la causalité. Deux thèses CIFRE sont en cours, et deux débuteront en 2025. Autour de chaque expert des équipes sont constituées en charge de tester les algorithmes état de l’art et les adapter à des problématiques business spécifiques, de créer de nouvelles méthodologies ou algorithmes répondant à un problème relevé, et d’’assurer la passation en vue d’une intégration dans l’écosystème industriel d’Ekimetrics. L'équipe de Forecasting au sein du Département d'Innovation d'Ekimetrics est dédiée à l'avancement des capacités prédictives grâce à une recherche de pointe en analyse de séries temporelles, prévision de la demande et prise de décision basée sur les données. Nous exploitons les techniques les plus récentes en intelligence artificielle et en modélisation statistique, incluant l'apprentissage automatique, l'inférence causale et la simulation de scénarios. En collaboration étroite avec des partenaires industriels et académiques, l'équipe s'attaque à des défis complexes de prévision dans divers secteurs, allant du commerce de détail et de la finance à la santé et aux télécommunications. En testant et en perfectionnant continuellement de nouveaux algorithmes et méthodologies, l'équipe de Prévision s'assure qu'Ekimetrics reste à la pointe de la production de prévisions exploitables et d'une grande précision, permettant aux entreprises de prendre des décisions plus éclairées et résilientes dans un marché dynamique. Objectif du stage : Construire des modèles de fondation pour les données tabulaires Au cours des dernières années, les modèles de fondation ont révolutionné des domaines comme le traitement du langage naturel (NLP en anglais) et la vision par ordinateur. Cependant, les données tabulaires, essentielles dans de nombreuses industries, n’ont pas encore connu des avancées similaires. Les modèles basés sur des arbres continuent de dominer ce domaine, car des défis liés à l'hétérogénéité des données et à leur intégration entravent l'application de techniques de deep learning aux données tabulaires. Ce stage se concentrera sur le développement de modèles de fondation pour les données tabulaires, en explorant des architectures et méthodes à la pointe de la technologie, telles que TabPFN [1], TabR [2] et CARTE [3], qui relèvent des défis clés grâce à l'apprentissage par transfert (transfer learning en anglais), au deep learning basé sur la récupération et à l'ajustement des données antérieures.
Ce stage offre une opportunité de s'engager dans la recherche avancée en IA, avec la possibilité de poursuivre ensuite un programme de doctorat ou de rejoindre Ekimetrics en tant que Data Scientist en IA.
Plus particulièrement vos responsabilités seront de : • Réaliser une revue de littérature sur les modèles et techniques de pointe dans le deep learning pour les données tabulaires, avec un accent particulier sur les modèles de fondation.• Développer et expérimenter des architectures comme CARTE, qui utilise des représentations en graphes pour contextualiser les entrées des tableaux, TabR, qui intègre des mécanismes de plus proches voisins, et TabPFN, un modèle basé sur des transformateurs pour une classification rapide des données tabulaires.• Collaborer avec votre N+1 pour concevoir, implémenter et évaluer des prototypes de modèles sur des jeux de données réels.• Partager les résultats avec l'équipe interne et contribuer au développement de stratégies à long terme pour le déploiement des modèles de fondation en production. 
Le profil et les compétences recherchées : • Actuellement en dernière année de Master ou d'École d'Ingénieurs, avec une solide formation en apprentissage automatique, statistiques et programmation.• Expérience avec Python, les frameworks de deep learning (PyTorch, TensorFlow), et familiarité avec l'analyse de données tabulaires.• Connaissance des techniques avancées de machine learning, incluant les transformateurs et les réseaux de neurones graphiques.• Solides compétences analytiques et en résolution de problèmes, avec un intérêt pour le développement de modèles d'IA évolutifs et performants.• Maîtrise de l'anglais. 🤝 Pourquoi nous rejoindre ? Rejoindre Ekimetrics, c’est intégrer une entreprise dont les valeurs s’appliquent au quotidien :
• Evoluer dans un environnement type start-up et non traditionnel (#curiosité)• Être capable de prendre le feedback pour s’améliorer (#excellence)• Se former dès son arrivée et en continu grâce à une expérience apprenante unique et riche de nombreuses ressources (internes, externes, live et digital) alliant savoirs techniques, savoir-être et savoir-faire (#transmission)• Faire partie d’une communauté accueillante et soudée (#plaisir)• Imaginer des solutions inattendues & sortir de sa zone de confort (#créativité)  En 2023, Ekimetrics a obtenu le statut d’entreprise à mission qui témoigne de notre ambition forte en matière de RSE. Nous sommes également certifiés Great Place to Work. 🤩Vous aurez accès à …  •  Au catalogue de formation EkiA qui contient des programmes qui vous feront monter en compétences sur nos solutions et nos métiers, des parcours apprenants sur notre plateforme digitale ainsi que des programmes dédiés à nos enjeux prioritaires, dont la sensibilisation aux sujets environnementaux avec la Climate School AXA.• Une vie sportive, artistique, musicale, ludique, caritative et engagée : de notre salle de sport privatisée à nos expositions d’art, en passant par des jeux vidéo et des concerts, ou encore les défis RSE sur la plateforme Vendredi ;•  De nombreux évènements et séminaires pour rester proche de votre communauté ; • Des locaux modernes dans un quartier dynamique au cœur de Paris (Grands boulevards)•  Une politique de télétravail flexible.  🔄 Notre processus recrutement  🔸 Un test technique sur HackerRank🔸 Un entretien RH avec un(e) Talent Acquisition🔸 Une étude de cas avec un(e) Consultant(e)🔸 Un entretien final avec un(e) Consultant(e) Senior Nous serions ravi.e.s de vous donner de plus amples informations lors d’un entretien et attendons votre candidature avec impatience !  References:[1] https://arxiv.org/pdf/2207.01848[2] https://arxiv.org/pdf/2307.14338[3] https://arxiv.org/pdf/2402.16785
En tant qu’employeur, Ekimetrics offre à tous les mêmes opportunités d’accès à l’emploi sans distinction de genre, ethnicité, religion, orientation sexuelle, statut social, handicap et d’âge. Ekimetrics veille à développer un environnement de travail inclusif qui reflète la diversité dans ses équipes.
Apply now Apply later

* Salary range is an estimate based on our AI, ML, Data Science Salary Index 💰

Job stats:  3  1  0

Tags: Architecture Classification Deep Learning DevOps Finance Machine Learning NLP Python PyTorch TensorFlow Vue

Perks/benefits: Flex hours

Region: Europe
Country: France

More jobs like this