Intermediate Data Engineer | Ingénieur(se) de données intermédiaire

Montreal, Canada

MaintainX

MaintainX helps you track your reactive maintenance, preventive maintenance, and control the daily operations of your business. Get started for Free!

View all jobs at MaintainX

Apply now Apply later

MaintainX est la plus importante plateforme au monde en matière de gestion des actifs et d'intelligence du travail pour les environnements industriels et de première ligne. Nous sommes un outil moderne de type IdO et basé sur le réseau informatique en nuage pour la fiabilité, la sécurité et les opérations de l'équipement physique et des installations. MaintainX alimente l'excellence opérationnelle pour plus de 10 000 entreprises, notamment Duracell, Univar Solutions Inc, Titan America, McDonald's, Brenntag, Cintas, Xylem et Shell.

Nous avons levé 104 millions de dollars en capital de risque à la suite d'un récent cycle de financement de série C mené par Bain Capital Ventures, Bessemer Ventures, August Capital, Amity Ventures, Ridge Ventures ainsi que des chefs d'entreprise de GE, Twilio, Coupa, Toast et PagerDuty.

Nous sommes à la recherche d'un ingénieur de données intermédiaire pour rejoindre notre équipe en pleine croissance ! Vous aiderez à construire et à maintenir les pipelines de données qui alimentent directement les fonctionnalités clés du produit MaintainX, vous permettrez des décisions à l'échelle de l'entreprise chez MaintainX, et vous développerez des outils utilisés quotidiennement par nos consommateurs de données. Votre rôle se concentrera sur la construction de pipelines de données et la garantie de l'intégrité, de la qualité et de l'accessibilité des données, ainsi que sur l'application des meilleures pratiques d'ingénierie des données aux pipelines de données. Vous soutiendrez l'équipe de produits, d'ingénierie et d'analyse de MaintainX en permettant aux utilisateurs d'accéder à des données fiables et de haute qualité quand et où ils en ont besoin.

Ce que vous ferez:

  • Construire, maintenir et faire évoluer les pipelines de données à travers plusieurs piliers de l'entreprise, y compris l'extraction et le chargement à partir d'API tierces et de bases de données de nos produits.
  • Modéliser les données brutes en ensembles de données propres et fiables qui alimentent à la fois les fonctionnalités des produits et les analyses internes.
  • Améliorer l'observabilité, les tests et la surveillance pour garantir la fiabilité et les performances.
  • Gérer la sécurité des données, la conformité et l'accès
  • Collaborer avec les équipes d'ingénierie, d'apprentissage automatique, de produits et d'analyse pour soutenir leurs cas d'utilisation des données.
  • Aider à établir les fondations de la plateforme : CI/CD, documentation, meilleures pratiques.

À propos de vous:

  • 3+ ans d'expérience en tant qu'ingénieur de données utilisant Databricks.
  • Solides compétences en Python et SQL.
  • Vous êtes à l'aise dans des contextes internes et orientés produit.
  • Expérience de travail direct avec les parties prenantes des données et de traduction des besoins de l'entreprise en exigences de données, modèles et solutions techniques.
  • Expérience avec une plateforme cloud (nous utilisons AWS).
  • Expérience du développement et de la surveillance de pipelines ELT/ETL.
  • Expérience de travail dans un environnement agile.

Une attention particulière est accordée aux candidats présentant les caractéristiques suivantes:

  • Expérience avec dbt, AWS DMS, Fivetran, et/ou terraform
  • Expérience dans la construction de flux de travail CI/CD pour les pipelines de données Databricks (DAB, GitHub Actions, etc.)
  • Expérience dans l'optimisation des requêtes, l'allocation et la gestion des ressources, la gestion des coûts et la performance des lacs de données.
  • Expérience de l'infrastructure cloud (Kubernetes, Terraform, etc.).
  • Expérience avec des pipelines en temps réel ou de streaming de données.
  • Expérience du déploiement et de la mise à l'échelle de solutions ML à l'aide de frameworks open-source (MLFlow, etc.).
  • Expérience de la construction d'applications full-stack (Node.js, React, TypeScript).

Qui sommes-nous:

Notre mission est de faciliter la vie des ouvriers dans le monde entier en créant des logiciels qui répondent à leurs besoins et à leurs réalités. Notre produit change véritablement la vie de 80% de la population active qui ne travaille pas derrière un bureau et qui a besoin d'un logiciel d'entreprise à portée de main.

MaintainX s'engage à créer un environnement diversifié. Tous les candidats qualifiés seront pris en considération pour un emploi sans considération de race, de couleur, de religion, de sexe, d'identité ou d'expression de genre, d'orientation sexuelle, d'origine nationale, de génétique, d'invalidité, d'âge ou de statut d'ancien combattant.

 

MaintainX is the world's leading Asset and Work Intelligence platform for industrial and frontline environments. We are a modern IoT-enabled cloud-based tool for reliability, safety, and operations on physical equipment and facilities. MaintainX powers operational excellence for 10,000+ businesses including Duracell, Univar Solutions Inc., Titan America, McDonald's, Brenntag, Cintas, Xylem, and Shell.

We've raised $104 million in venture capital following a recent Series C funding round led by Bain Capital Ventures, Bessemer Ventures, August Capital, Amity Ventures, Ridge Ventures as well as CEOs from GE, Twilio, Coupa, Toast and PagerDuty.

We are seeking an Intermediate Data Engineer to join our growing team! You will help build and maintain the data pipelines that directly power key features of the MaintainX product, enable company-wide decisions at MaintainX, and develop tools used by our data consumers daily. Your role will focus on building data pipelines and ensuring data integrity, quality, and accessibility, and applying data engineering best practices to data pipelines. You’ll support MaintainX’s product, engineering, and analytics team by enabling users to reliable, high-quality data when and where they need it.

What you’ll do:

  • Build, maintain, and scale data pipelines across several business pillars, including extract and load from third party APIs and databases from our products.
  • Model raw data into clean, reliable datasets that power both product features and internal analytics.
  • Improve observability, testing, and monitoring to ensure reliability and performance
  • Manage data security, compliance and access.
  • Collaborate with engineering, machine learning, product, and analytics teams to support their data use cases.
  • Help establish platform foundations: CI/CD, documentation, best practices.

About you:

  • 3+ years of experience as a data engineer using Databricks
  • Strong Python and SQL skills
  • Comfortable working in both product-facing and internal contexts
  • Experience working directly with data stakeholders and translating business needs into data requirements, models and technical solutions
  • Experience with a cloud platform (We use AWS).
  • Experience developing and monitoring ELT/ETL pipelines
  • Experience working in an agile environment

Extra consideration for candidates with the following:

  • Experience with dbt, AWS DMS, Fivetran, and/or terraform
  • Experience building CI/CD workflows for Databricks data pipelines (DABs, GitHub Actions, etc.)
  • Experience in query optimization, resource allocation and management, cost management, and data lake performance
  • Experience with cloud infrastructure (Kubernetes, Terraform, etc.).
  • Experience with real-time or data-streaming pipelines
  • Experience deploying and scaling ML solutions using open-source frameworks (MLFlow, etc.)
  • Experience building full-stack applications (Node.js, React, TypeScript).

What’s in it for you:

  • Competitive salary and meaningful equity opportunities.
  • Healthcare, dental, and vision coverage.
  • 401(k) / RRSP enrollment program.
  • Take what you need PTO.
  • A Work Culture where:
    • You’ll work alongside folks across the globe that reflect the MaintainX values, Smart Humble Optimist
    • We believe in meritocracy, where ideas and effort are publicly celebrated

About us:

Our mission is to make the life of blue-collar workers easier worldwide by creating software that meets their needs and realities. Our product is truly life-changing for 80% of the workforce that doesn’t work behind a desk and needs enterprise-grade software at their fingertips.

MaintainX is committed to creating a diverse environment. All qualified applicants will receive consideration for employment without regard to race, colour, religion, gender, gender identity or expression, sexual orientation, national origin, genetics, disability, age, or veteran status.



Apply now Apply later

* Salary range is an estimate based on our AI, ML, Data Science Salary Index 💰

Job stats:  1  0  0

Tags: Agile APIs AWS CI/CD Databricks Data pipelines dbt ELT Engineering ETL FiveTran GitHub Industrial Kubernetes Machine Learning MLFlow Node.js Open Source Pipelines Python React Security SQL Streaming Terraform Testing TypeScript

Perks/benefits: Career development Competitive pay Equity / stock options Health care

Region: North America
Country: Canada

More jobs like this