Senior/Principal Software Engineer, AI/ML Data Systems

AMER - Canada - Ontario - Toronto - University Ave

Autodesk

Autodesk is a global leader in design and make technology, with expertise across architecture, engineering, construction, design, manufacturing, and entertainment.

View all jobs at Autodesk

Apply now Apply later

Job Requisition ID #

25WD90074

25WD90074, Senior/Principal Software Engineer, AI/ML Data Systems

French translation to follow!/Traduction française à suivre!

Position Overview

Join us to design the core data systems powering both traditional machine learning and cutting-edge generative AI/LLM workflows. As a Senior/Principal Software Engineer, you’ll specialize in one of two tracks:

  • Data & Feature Store Infrastructure: Build scalable backend systems for data ingestion, batch/streaming ETL pipelines, feature stores, vector-enabled APIs, and data compliance

  • Labeling & Human Feedback Systems: Design multimodal annotation platforms (text, image, audio, video, 3D), develop RLHF workflows (instruction tuning, output ranking), and drive LLM-assisted labeling innovations

You’ll work closely with ML engineers, MLOps, and product teams to deliver high-impact data and labeling solutions at scale. Reporting to the Head of AI & ML Platform, you’ll turn AI research into production-ready features that create real customer value.

Responsibilities
 Choose one track to focus on:

Data & Feature Store Infrastructure

  • Design and implement scalable feature engineering systems for both batch and streaming computation

  • Build and maintain low-latency online feature serving systems with consistency between training and inference

  • Develop and maintain monitoring systems for feature freshness, data drift, and data quality

  • Integrate feature management solutions with vector databases to support embeddings and retrieval-augmented generation (RAG) workflows

  • Ensure compliance, lineage, and best practices for infrastructure as code


Labeling & Human Feedback Systems

  • Build and scale annotation platforms for diverse data types: text, image, video, audio, and 3D

  • Develop workflows for LLM alignment, including instruction tuning and RLHF (Reinforcement Learning from Human Feedback) output ranking

  • Embed LLM-assisted labeling features such as auto-labeling, policy checking, and active learning

  • Drive annotation quality through processes such as inter-annotator agreement, gold standard samples, and anomaly detection

  • Manage and scale internal/external labeling teams while maintaining secure data integration

Minimum Qualifications

  • 5+ years of experience in data engineering, ML platform, or backend development roles

  • Proficiency in at least one modern programming language (Python preferred)

  • Experience developing and operating distributed backend APIs and SDKs

  • Experience working with cloud platforms (AWS, GCP, or Azure), containers (Docker/Kubernetes), and infrastructure-as-code tools (e.g., Terraform)

Plus, one of the following specialization experiences:

Feature Store Track: (At least have experience with TWO of the following)

  • Hands-on experience with feature store frameworks (e.g., SageMaker Feature Store, Feast, Tecton, Hopsworks), or operating vector database systems for serving LLM use cases

  • Experience with batch and/or streaming data pipelines (e.g., Kafka, Flink, Spark, Ray) and orchestration tools (e.g., Airflow, Argo Workflow)

  • Demonstrated experience at least in one the data areas: data catalog, data validation, versioning, lineage, and security/compliance

Labeling Track: (At least have experience with ONE of the following)

  • Proven working experience with labeling platforms (e.g., GroundTruth, Label Studio)

  • RLHF/instruction tuning, or annotation workflow development

Preferred Qualifications

  • Experience with LLM pipelines, including embeddings, retrieval-augmented generation (RAG), or prompt engineering

  • Familiarity with labeling copilot tools, active learning, or managing hybrid annotation teams

  • Knowledge of knowledge graphs or semantic data modeling

______________________________________________________________________________________________________________

25WD90074, Ingénieur logiciel senior/principal, SystÚmes de données IA/ML

Aperçu du poste

Rejoignez-nous pour concevoir les systÚmes de données centraux qui alimentent à la fois l'apprentissage automatique traditionnel et les workflows IA/LLM génératifs de pointe. En tant qu'ingénieur logiciel senior/principal, vous vous spécialiserez dans l'un des deux domaines suivants :

  • Infrastructure de stockage des donnĂ©es et des fonctionnalitĂ©s : vous construirez des systĂšmes backend Ă©volutifs pour l'ingestion de donnĂ©es, les pipelines ETL par lots/en continu, les magasins de fonctionnalitĂ©s, les API compatibles avec les vecteurs et la conformitĂ© des donnĂ©es
  • SystĂšmes d'Ă©tiquetage et de feedback humain : vous concevrez des plateformes d'annotation multimodales (texte, image, audio, vidĂ©o, 3D), dĂ©velopperez des workflows RLHF (ajustement des instructions, classement des rĂ©sultats) et piloterez des innovations en matiĂšre d'Ă©tiquetage assistĂ© par LLM

Vous travaillerez en Ă©troite collaboration avec les ingĂ©nieurs ML, les MLOps et les Ă©quipes produit afin de fournir des solutions de donnĂ©es et d'Ă©tiquetage Ă  fort impact et Ă  grande Ă©chelle. Sous la responsabilitĂ© du responsable de la plateforme IA et ML, vous transformerez la recherche en IA en fonctionnalitĂ©s prĂȘtes Ă  ĂȘtre mises en production et crĂ©ant une rĂ©elle valeur ajoutĂ©e pour les clients.

Responsabilités

Choisissez un domaine dans lequel vous souhaitez vous spécialiser:

Infrastructure de stockage des données et des fonctionnalités

  • Concevoir et mettre en Ɠuvre des systĂšmes d'ingĂ©nierie des fonctionnalitĂ©s Ă©volutifs pour le calcul par lots et en continu
  • Construire et maintenir des systĂšmes de service de fonctionnalitĂ©s en ligne Ă  faible latence, avec une cohĂ©rence entre l'entraĂźnement et l'infĂ©rence
  • DĂ©velopper et maintenir des systĂšmes de surveillance pour la fraĂźcheur des fonctionnalitĂ©s, la dĂ©rive des donnĂ©es et la qualitĂ© des donnĂ©es
  • IntĂ©grer des solutions de gestion des fonctionnalitĂ©s avec des bases de donnĂ©es vectorielles pour prendre en charge les workflows d'intĂ©gration et de gĂ©nĂ©ration augmentĂ©e par la rĂ©cupĂ©ration (RAG)
  • Garantir la conformitĂ©, la traçabilitĂ© et les meilleures pratiques pour l'infrastructure en tant que code

SystÚmes d'étiquetage et de feedback humain:

  • Construire et faire Ă©voluer des plateformes d'annotation pour divers types de donnĂ©es : texte, image, vidĂ©o, audio et 3D
  • DĂ©velopper des workflows pour l'alignement LLM, y compris le rĂ©glage des instructions et le classement des rĂ©sultats RLHF (apprentissage par renforcement Ă  partir du feedback humain)
  • IntĂ©grer des fonctionnalitĂ©s d'Ă©tiquetage assistĂ© par LLM telles que l'Ă©tiquetage automatique, la vĂ©rification des politiques et l'apprentissage actif
  • AmĂ©liorez la qualitĂ© des annotations grĂące Ă  des processus tels que la concordance entre annotateurs, les Ă©chantillons de rĂ©fĂ©rence et la dĂ©tection des anomalies
  • GĂ©rez et faites Ă©voluer les Ă©quipes d'Ă©tiquetage internes/externes tout en maintenant une intĂ©gration sĂ©curisĂ©e des donnĂ©es

Qualifications minimales

  • Au moins 5 ans d'expĂ©rience dans l'ingĂ©nierie des donnĂ©es, les plateformes ML ou le dĂ©veloppement backend
  • MaĂźtrise d'au moins un langage de programmation moderne (Python prĂ©fĂ©rĂ©).
  • ExpĂ©rience dans le dĂ©veloppement et l'exploitation d'API et de SDK backend distribuĂ©s
  • ExpĂ©rience de travail avec des plateformes cloud (AWS, GCP ou Azure), des conteneurs (Docker/Kubernetes) et des outils d'infrastructure en tant que code (par exemple, Terraform)

De plus, l'une des expériences de spécialisation suivantes:

Feature Store Track: (Au moins DEUX des éléments suivants)

  • ExpĂ©rience pratique des frameworks de magasins de fonctionnalitĂ©s (par exemple, SageMaker Feature Store, Feast, Tecton, Hopsworks) ou de l'exploitation de systĂšmes de bases de donnĂ©es vectorielles pour des cas d'utilisation LLM
  • ExpĂ©rience des pipelines de donnĂ©es par lots et/ou en streaming (par exemple, Kafka, Flink, Spark, Ray) et des outils d'orchestration (par exemple, Airflow, Argo Workflow)
  • ExpĂ©rience avĂ©rĂ©e dans au moins un des domaines suivants : catalogue de donnĂ©es, validation des donnĂ©es, gestion des versions, lignage et sĂ©curitĂ©/conformitĂ©

Labeling Track: (Au moins une expérience dans l'un des domaines suivants)

  • ExpĂ©rience professionnelle avĂ©rĂ©e avec des plateformes de labellisation (par exemple, GroundTruth, Label Studio)
  • RLHF/rĂ©glage des instructions ou dĂ©veloppement de workflows d'annotation

Qualifications souhaitées

  • ExpĂ©rience avec les pipelines LLM, y compris les intĂ©grations, la gĂ©nĂ©ration augmentĂ©e par la rĂ©cupĂ©ration (RAG) ou l'ingĂ©nierie de prompts
  • Connaissance des outils de copilotage de l'Ă©tiquetage, de l'apprentissage actif ou de la gestion d'Ă©quipes d'annotation hybrides
  • Connaissance des graphes de connaissances ou de la modĂ©lisation sĂ©mantique des donnĂ©es

Learn More / Plus d'information

About Autodesk / À propos d’Autodesk

Welcome to Autodesk! Amazing things are created every day with our software – from the greenest buildings and cleanest cars to the smartest factories and biggest hit movies. We help innovators turn their ideas into reality, transforming not only how things are made, but what can be made.

We take great pride in our culture here at Autodesk – our Culture Code is at the core of everything we do. Our values and ways of working help our people thrive and realize their potential, which leads to even better outcomes for our customers.

When you’re an Autodesker, you can be your whole, authentic self and do meaningful work that helps build a better future for all. Ready to shape the world and your future? Join us!

Bienvenue Ă  Autodesk ! Des choses incroyables sont créées chaque jour avec nos logiciels - des bĂątiments les plus Ă©cologiques et des voitures les plus propres aux usines les plus intelligentes et aux plus grands films Ă  succĂšs. Nous aidons les innovateurs Ă  transformer leurs idĂ©es en rĂ©alitĂ©, transformant non seulement la façon dont les choses sont faites, mais ce qui peut ĂȘtre fait.

Nous sommes trĂšs fiers de notre culture ici chez Autodesk - notre code en matiĂšre de culture est au cƓur de tout ce que nous faisons. Nos valeurs et nos mĂ©thodes de travail aident nos employĂ©s Ă  prospĂ©rer et Ă  rĂ©aliser leur potentiel, ce qui conduit Ă  des rĂ©sultats encore meilleurs pour nos clients.

Lorsque vous ĂȘtes un employĂ© Autodesk, vous pouvez ĂȘtre entier et authentique et effectuer un travail significatif qui aide Ă  construire un avenir meilleur pour tous. PrĂȘt Ă  façonner le monde et votre avenir? Joignez-vous Ă  nous !

Salary transparency / Transparence salariale

Salary is one part of Autodesk’s competitive compensation package. Offers are based on the candidate’s experience and geographic location. In addition to base salaries, we also have a significant emphasis on discretionary annual cash bonuses, commissions for sales roles, stock or long-term incentive cash grants, and a comprehensive benefits package.

Le salaire est l'un des éléments de l'offre compétitive d'Autodesk. Les offres sont basées sur l'expérience et la situation géographique du candidat. Outre les salaires de base, nous accordons également une grande importance aux primes annuelles discrétionnaires en espÚces, aux commissions pour les fonctions de vente, aux actions ou aux primes d'encouragement à long terme en espÚces, ainsi qu'à un ensemble complet d'avantages sociaux.

Diversity & Belonging / Diversité et appurtenance

We take pride in cultivating a culture of belonging and an equitable workplace where everyone can thrive. Learn more here: https://www.autodesk.com/company/diversity-and-belonging

Nous sommes fiers de cultiver une culture d’appartenance et un milieu de travail Ă©quitable oĂč tout le monde peut s’épanouir. Pour en savoir plus, cliquez ici : https://www.autodesk.com/company/diversity-and-belonging

Are you an existing contractor or consultant with Autodesk?

Êtes-vous un sous-traitant ou un consultant existant d’Autodesk ?

Please search for open jobs and apply internally (not on this external site).

Veuillez rechercher des emplois vacants et postuler à l’interne (pas sur ce site externe).

Apply now Apply later

* Salary range is an estimate based on our AI, ML, Data Science Salary Index 💰

Job stats:  0  0  0

Tags: Airflow APIs AWS Azure Copilot Data pipelines Data quality Docker Engineering ETL Feature engineering Flink GCP Generative AI Kafka Kubernetes LLMs Machine Learning MLOps Pipelines Prompt engineering Python RAG Reinforcement Learning Research RLHF SageMaker Security Spark Streaming Terraform

Perks/benefits: Career development Competitive pay Transparency

Region: North America
Country: Canada

More jobs like this