Ingénieure de Données Staff | Staff Data Engineer
Montreal, Canada
MaintainX
MaintainX helps you track your reactive maintenance, preventive maintenance, and control the daily operations of your business. Get started for Free!MaintainX est la plus importante plateforme au monde en matière de gestion des actifs et d'intelligence du travail pour les environnements industriels et de première ligne. Nous sommes un outil moderne de type IdO et basé sur le réseau informatique en nuage pour la fiabilité, la sécurité et les opérations de l'équipement physique et des installations. MaintainX alimente l'excellence opérationnelle pour plus de 10 000 entreprises, notamment Duracell, Univar Solutions Inc, Titan America, McDonald's, Brenntag, Cintas, Xylem et Shell.
Nous avons levé 104 millions de dollars en capital de risque à la suite d'un récent cycle de financement de série C mené par Bain Capital Ventures, Bessemer Ventures, August Capital, Amity Ventures, Ridge Ventures ainsi que des chefs d'entreprise de GE, Twilio, Coupa, Toast et PagerDuty.
À propos du rôle:
MaintainX développe une plateforme de données moderne sur Databricks afin d’alimenter des fonctionnalités basées sur l’analytique et l’apprentissage machine (ML), permettant à nos utilisateurs de tirer un maximum de valeur de leurs données. Cette plateforme soutient également la prise de décision interne à tous les niveaux de l’organisation et accélère la transformation de MaintainX en une entreprise réellement axée sur les données.
Nous sommes à la recherche d’un·e Ingénieur·e de Données Senior II ou Staff pour diriger le développement de cette plateforme — une personne capable de penser comme un·e ingénieur·e de plateforme, de collaborer comme un·e tech lead, de promouvoir les meilleures pratiques auprès des ingénieurs de données, et de s’impliquer directement dans l’évolution de notre environnement Databricks, au service des équipes de développement logiciel, d’IA/ML, d’analytique, et de science des données.
L’Ingénieur·e de Données Staff fera partie d’une équipe en pleine croissance dédiée à bâtir une plateforme fiable, évolutive et facile à utiliser — non seulement pour les ingénieurs de données, mais pour toutes les personnes de l’organisation qui travaillent avec les données.
Ce que vous ferez:
- Agir à titre d’expert·e technique de la plateforme de données — concevoir l’architecture, améliorer les systèmes, et guider les décisions techniques au sein de l’équipe et des parties prenantes qui développent sur la plateforme
- Concevoir et développer des outils facilitant l’utilisation de Databricks par les utilisateurs internes (ex. bibliothèques, automatisations, gabarits, documentation)
- Établir et promouvoir les meilleures pratiques tout au long du cycle de vie des données (tests, CI/CD, contrats de données, traçabilité, gouvernance, coûts, performance, observabilité, maintenabilité, orchestration, etc.)
- Collaborer étroitement avec les développeur·euses logiciel, les ingénieur·es ML, et les analystes afin de comprendre leurs flux de travail et de livrer les jeux de données ou les outils nécessaires
- Encadrer, soutenir et faire évoluer les membres de l’équipe d’ingénierie des données
- Rester pragmatique et adaptable — livrer rapidement quand c’est nécessaire, tout en posant des bases solides pour l’avenir
À propos de vous:
- 8+ années d’expérience pertinente en ingénierie des données, développement logiciel, science des données, apprentissage automatique et/ou analytique
- Comprendre l’intersection entre ingénierie des données et ingénierie de plateforme — vous êtes à l’aise de penser en termes d’abstractions et d’outils internes
- Avoir une solide expérience dans la construction de plateformes ou d’outillage pour des utilisateurs internes (équipes de développement, ML ou analytique)
- Une bonne connaissance de Databricks et les technologies modernes de traitement de données
- Bonne maîtrise de Spark et Delta Lake, avec de l’expérience dans l’optimisation de pipelines de données distribuées en traitement par lots et en continu, ainsi que des formats de stockage à grande échelle
- Être à l’aise avec les outils et infrastructures cloud (nous utilisons AWS)
- Être motivé·e par le travail sur une stack technologique récente, avec de nombreuses opportunités pour orienter la direction technologique d la plateforme
- Avoir un esprit collaboratif et axé sur les résultats, avec une mentalité self-serve — vous rassemblez les gens autour de solutions évolutives et pragmatiques qui leur permettent de travailler de manière autonome avec les données
Une attention particulière est accordée aux candidats présentant les caractéristiques suivantes:
- Expérience en développement sur des plateformes de données en tant que développeur·euse logiciel ou ingénieur·e ML
- Connaissance de MLflow et des services de déploiement de modèles
- Expérience dans la conception de plateformes de données pour des cas d’usage en IA générative (LLM), incluant :
- L’intégration et la recherche d’embeddings vectoriels
- Le RAG (Retrieval-Augmented Generation)
- LangChain, LangGraph ou autres frameworks d’orchestration LLM
- Expérience de travail dans un modèle organisationnel en étoile (hub-and-spoke), en soutien à plusieurs équipes via une infrastructure de données centralisée
Qui sommes-nous:
Notre mission est de faciliter la vie des ouvriers dans le monde entier en créant des logiciels qui répondent à leurs besoins et à leurs réalités. Notre produit change véritablement la vie de 80% de la population active qui ne travaille pas derrière un bureau et qui a besoin d'un logiciel d'entreprise à portée de main.
MaintainX s'engage à créer un environnement diversifié. Tous les candidats qualifiés seront pris en considération pour un emploi sans considération de race, de couleur, de religion, de sexe, d'identité ou d'expression de genre, d'orientation sexuelle, d'origine nationale, de génétique, d'invalidité, d'âge ou de statut d'ancien combattant.
MaintainX is the world's leading Asset and Work Intelligence platform for industrial and frontline environments. We are a modern IoT-enabled cloud-based tool for reliability, safety, and operations on physical equipment and facilities. MaintainX powers operational excellence for 10,000+ businesses including Duracell, Univar Solutions Inc., Titan America, McDonald's, Brenntag, Cintas, Xylem, and Shell.
We've raised $104 million in venture capital following a recent Series C funding round led by Bain Capital Ventures, Bessemer Ventures, August Capital, Amity Ventures, Ridge Ventures as well as CEOs from GE, Twilio, Coupa, Toast and PagerDuty.
About the role:
MaintainX is building a modern data platform on Databricks to power ML- and analytics-driven features for users, helping them get maximum value from their data. The platform also powers internal decision-making at all levels of the organization, accelerating MaintainX’s journey to become a truly data-driven organization.
We’re looking for a Senior II or Staff Data Engineer to drive the development of this data platform — someone who can think like a platform engineer, collaborate like a tech lead, drive best practices among data engineers, and get hands on in the development of a Databricks platform that empowers software engineers, ML engineers, analytics engineers, and data analysts alike.
The Staff Data Engineer will be part of a growing team focused on building a platform that is reliable, scalable, and easy to use — not just for data engineers, but for anyone in the company who uses data.
What you’ll do:
- Act as technical expert for our data platform — shaping architecture, improving data systems, and guiding engineering decisions across the data engineering team and stakeholders developing on the platform
- Design and build tooling that improves how internal users interact with Databricks (e.g. libraries, patterns, automations, templates, documentation)
- Establish and promote best practices across the data lifecycle (testing, CI/CD, contracts, lineage, governance, cost, performance, observability, maintainability, orchestration, etc.)
- Collaborate closely with software engineers, ML engineers, and data analysts to understand their workflows and deliver the datasets and/or tooling they need
- Mentor and uplevel other data engineers
- Stay pragmatic and flexible — move fast when needed, but lay strong foundations for the future
About you:
- Have 8+ years of relevant experience across data engineering, software engineering, data science, ML, and/or analytics
- Understand the intersection between data engineering and platform engineering — you're comfortable thinking in abstractions and tooling
- Have strong experience building data platforms or tooling for internal users (SWE, ML, or analytics teams)
- Have strong knowledge of Databricks and the modern data stack
- Proficient in Spark and Delta Lake, with experience optimizing distributed batch and streaming data pipelines and storage formats at scale
- Comfortable with cloud-native data tools and infrastructure (we’re using AWS)
- Are excited to work with a new data stack, with lots of opportunity to drive the technical direction of the data platform
Extra consideration for candidates with the following:
- Development experience on data platforms as a software developer or ML engineer
- Knowledge of MLflow and model deployment services
- Experience in designing data platforms for generative AI (LLM) use cases, including :
- Integration and retrieval of vector embeddings
- Retrieval-Augmented Generation (RAG)
- LangChain, LangGraph or other LLM orchestration frameworks
- Experience of working in a hub-and-spoke organizational model, supporting multiple teams via a centralized data infrastructure
What’s in it for you:
- Competitive salary and meaningful equity opportunities.
- Healthcare, dental, and vision coverage.
- 401(k) / RRSP enrollment program.
- Take what you need PTO.
- A Work Culture where:
- You’ll work alongside folks across the globe that reflect the MaintainX values, Smart Humble Optimist
- We believe in meritocracy, where ideas and effort are publicly celebrated
About us:
Our mission is to make the life of blue-collar workers easier worldwide by creating software that meets their needs and realities. Our product is truly life-changing for 80% of the workforce that doesn’t work behind a desk and needs enterprise-grade software at their fingertips.
MaintainX is committed to creating a diverse environment. All qualified applicants will receive consideration for employment without regard to race, colour, religion, gender, gender identity or expression, sexual orientation, national origin, genetics, disability, age, or veteran status.
* Salary range is an estimate based on our AI, ML, Data Science Salary Index 💰
Tags: Architecture AWS CI/CD Databricks Data pipelines Engineering Generative AI Industrial LangChain LLMs Machine Learning MLFlow Model deployment Pipelines RAG Spark Streaming Testing
Perks/benefits: Career development Competitive pay Equity / stock options Flex hours Flex vacation Health care
More jobs like this
Explore more career opportunities
Find even more open roles below ordered by popularity of job title or skills/products/technologies used.