Sr Data Scientist/Data Engineer

Montreal

Full Time Senior-level / Expert CAD 168K - 312K * ^est.

nomic

Discover Omni 1000, the revolutionary proteomics platform offering 1000 high-fidelity proteins for cost-effective and rapid analysis in any study.

View all jobs at nomic

Apply now Apply later

Posted 3 weeks ago

About us:

Nomic was founded with a simple but ambitious goal: to make biology easier to measure. We’ve developed nELISA, the world’s highest throughput proteomic platform, by tackling some of the toughest challenges in protein profiling through a combination of DNA nanotechnology, high-dimensional flow cytometry, lab automation, and machine learning.

Since spinning out of McGill University, we’ve partnered with dozens of top-tier drug discovery groups, including 6 of the top 10 pharma companies, and have profiled over 60 million proteins from more than 400,000 samples to date.

Since closing a $42M Series B round, we recently scaled up the platform to meet rapidly growing demand. You can read more about this on our website here. Our state-of-the-art facility is capable of profiling over 2.5 million samples a year, generating 500 million protein assays.

We’re a diverse team of engineers, scientists, and problem-solvers who thrive on breaking down difficult challenges using first principles thinking, and we leverage the latest scientific and technological breakthroughs to drive our mission forward.

About the role:

The Data team at Nomic is responsible for designing, building, operating and improving the data pipelines, data infrastructure, and data tools needed for analyzing nELISA data at scale. Our development roadmap includes building more robust data pipelines for decoding nELISA datasets, and developing improved internal-facing tools that will let our scientists execute faster in the lab by extracting insights from our nELISA profiling and manufacturing QC data on-demand.

As a senior IC on the team, you will sit at the intersection of our in-lab technology development efforts, our efforts to improve our data processing algorithms and infrastructure, and our work to manually analyze complex experimental datasets as part of developing internal tools for our scientists to more automatically visualize and analyze datasets themselves.

As a jack of all trades when it comes to analyzing data and building tools for others to do the same, your day to day responsibilities will include:

Designing, building, iteratively improving, and fully automating the data pipelines and algorithms we use for processing raw flow cytometry data from our highly multiplexed bead-based assays into quantitative protein measurements. This will be done in close collaboration with your Data Engineering, Software Engineering, and Lab R&D teammates.
You will leverage your fundamental knowledge of biosensors, fluorescence data, and bioengineering R&D to act as an expert for the interpretation, and analysis of, nELISA experimental data coming from R&D and day-to-day Lab Operations, connecting the fundamentals of the science to the specific features or anomalies of the data.
You will also support R&D and Lab Operations teams through developing additional data support features and algorithms to support the growth of Nomic going forward. This will include any new data analysis pipelines to analyze nELISA data, including QC data from our daily manufacturing and profiling operations.
This role will involve substantial communication, teamwork, and attention to detail, especially when identifying and troubleshooting issues related to nELISA data and ensuring we build the right tools, and the right abstractions.
When tooling does not yet exist, you will be responsible for analyzing nELISA data using our suite of decoding and analysis tools, as well as leveraging your technical and bioscience domain expertise to develop new data analysis pipelines when needed.
Moreover, you will be relied on to support our R&D and Lab Operations teams with guidance on experimental design and analysis when needed, drawing on your previous experience doing the same.

What we’re looking for:

Graduate Degree - or equivalent experience in industry - in bioengineering or a related quantitative field of study in the biosciences, with a focus on biosensors, quantitative fluorescence data, or similar.
3+ years of experience specifically with analyzing bioscience data and developing improved data processing algorithms.
2+ years software engineering/development experience - you must be comfortable standing up new toolsets for non-programming users, and coding in a collaborative environment together with experienced data and software engineers.
Statistical skills including bayesian statistics, sampling methods, mixed models, and experience applying other statistical concepts.
Strong past experience working collaboratively on data science problems with wet lab scientists, ideally in a startup or equivalent fast paced environment.
Nice to Have: Understanding of the fundamentals of life science tools, technologies and lab methods. In particular you would be an expert on multiple of: immunoassays, nucleic acid amplification, DNA nanoarchitecture and design, separation-based techniques for biological samples and compounds, biophysics / fluorescence, and signal processing.
Nice to Have: First hand experience optimizing (alone or in a team): surface chemistry (passivation, functionalization, regeneration), DNA-based circuits and DNA biosensor designs, fluorophores/fluorescence and FRET, antibody-antigen interactions and ligand binding, or similar domains.
Excellent communication skills (written, verbal, and in a codebase) and an independent problem solver.
Fluency in English is required as our customers and vendors are primarily located in the USA. In addition, this position will interact with our team members within our USA entity.

Join us if you:

Connect deeply with our mission, ambition and sense of duty. Our mission isn’t marketing flash: we developed our technology to better measure biology and discover biomarkers for early disease detection. We firmly believe we will be successful in literally eradicating certain diseases by enabling them to be diagnosed earlier. We also believe that our hard work to bring this technology to its full potential is our duty.
Are up for a challenge and want to grow: We are a team of problem-solvers, and we continually put ourselves to the test and go into the unknown. We have a growth mindset, both on hard and soft skills, and we rely on each other to give critical and candid feedback to ensure that we can all reach our full potential.
Want to be at the cutting-edge of biotechnology. The nELISA is a new tool that leverages DNA nanotechnology to generate proteomic data more efficiently than ever before. You get to design and build the data pipelines and analysis tools that will support the scaling of this technology going forward.
Love writing code and analyzing biological data, and want to be responsible for driving improvements to data pipelines from a full-stack perspective.
Prefer working and communicating within a diverse cross-functional team. You would get to interface with your teammates from the broader Engineering, Operations, and Commercial teams on a daily basis, joining a collaborative, diverse, and inclusive team where your ideas will be valued.
Want the responsibility of addressing some of our hardest problems. Data is one of our core competencies, and researching and developing improvements to the way we analyze data has a compounding benefit on all other aspects of our company and our customers, most notably the scientists using the nELISA and patients that will ultimately benefit from nELISA data.

If you are passionate about analyzing data and building better data pipelines for biology, want to drive innovation in proteomics, and are eager to make a meaningful impact in the world, we invite you to apply and join us on our journey to redefine proteomics and the understanding of biology.

À propos de nous:

Nomic a été fondée avec un objectif simple mais ambitieux : rendre la biologie plus facile à mesurer. Nous avons développé nELISA, la plateforme protéomique la plus performante au monde, en relevant certains des défis les plus complexes du profilage des protéines grâce à une combinaison de nanotechnologie ADN, de cytométrie en flux haute dimension, d'automatisation de laboratoire et d'apprentissage automatique.

Depuis notre spin-off de l’Université McGill, nous avons collaboré avec des dizaines de groupes de découverte de médicaments de premier plan, dont 6 des 10 plus grandes sociétés pharmaceutiques, et avons profilé plus de 60 millions de protéines à partir de plus de 400 000 échantillons à ce jour.

Depuis la clôture d’un tour de financement de Série B de 42 M$, nous avons récemment étendu la plateforme pour répondre à une demande en forte croissance. Vous pouvez en lire davantage sur notre site web. Notre installation ultramoderne est capable de profiler plus de 2,5 millions d’échantillons par an, générant 500 millions d’analyses protéiques.

Nous sommes une équipe diversifiée d’ingénieurs, de scientifiques et de résolveurs de problèmes qui prospèrent en décomposant des défis complexes grâce à une réflexion fondée sur les premiers principes, et nous tirons parti des dernières avancées scientifiques et technologiques pour faire progresser notre mission.

À propos du poste:

L’équipe Data de Nomic est responsable de concevoir, construire, exploiter et améliorer les pipelines de données, l’infrastructure de données et les outils de données nécessaires à l’analyse des données nELISA à grande échelle. Notre feuille de route de développement comprend la création de pipelines de données plus robustes pour décoder les ensembles de données nELISA et le développement d’outils internes améliorés permettant à nos scientifiques de travailler plus rapidement au laboratoire en extrayant à la demande des informations issues de nos données de profilage nELISA et de contrôle qualité de fabrication.

En tant que contributeur senior au sein de l’équipe, vous serez à l’intersection de nos efforts de développement technologique en laboratoire, de nos travaux visant à améliorer nos algorithmes et infrastructures de traitement des données, et de notre travail d’analyse manuelle de jeux de données expérimentaux complexes dans le cadre du développement d’outils internes permettant à nos scientifiques de visualiser et d’analyser eux-mêmes les jeux de données de manière plus automatique.

En tant que généraliste de l’analyse de données et de la création d’outils destinés aux autres, vos responsabilités quotidiennes comprendront :

Concevoir, construire, améliorer de manière itérative et automatiser entièrement les pipelines de données et les algorithmes que nous utilisons pour traiter les données brutes de cytométrie en flux provenant de nos essais multiplexés à billes en mesures protéiques quantitatives. Ce travail se fera en étroite collaboration avec vos collègues en Data Engineering, Software Engineering et R&D en laboratoire.
Mettre à profit vos connaissances fondamentales en biosenseurs, données de fluorescence et R&D en bio-ingénierie pour jouer un rôle d’expert dans l’interprétation et l’analyse des données expérimentales nELISA provenant de la R&D et des opérations quotidiennes du laboratoire, en reliant les principes fondamentaux de la science aux caractéristiques ou anomalies spécifiques des données.
Soutenir les équipes R&D et Opérations Laboratoire en développant des fonctionnalités et des algorithmes supplémentaires de support aux données afin d’accompagner la croissance de Nomic. Cela inclura la création de nouveaux pipelines d’analyse pour les données nELISA, y compris les données de contrôle qualité issues de nos opérations quotidiennes de fabrication et de profilage.
Communiquer de façon intensive, travailler en équipe et prêter une grande attention aux détails, notamment lorsqu’il s’agit d’identifier et de résoudre des problèmes liés aux données nELISA et de s’assurer que nous construisons les bons outils et abstractions adaptés.
Lorsque les outils n’existent pas encore, analyser les données nELISA en utilisant notre suite d’outils de décodage et d’analyse, ainsi que développer de nouveaux pipelines d’analyse lorsque nécessaire grâce à votre expertise technique et scientifique.
Fournir un soutien aux équipes R&D et Opérations sur la conception et l’analyse expérimentales lorsque cela est requis, en s’appuyant sur votre expérience passée dans ce domaine.

Ce que nous recherchons :

Diplôme de troisième cycle - ou expérience équivalente en industrie - en bio-ingénierie ou dans un domaine quantitatif connexe des biosciences, avec une spécialisation en biocapteurs, données de fluorescence quantitatives, ou domaine similaire.
3+ années d'expérience spécifiquement dans l'analyse de données bioscientifiques et le développement d'algorithmes améliorés de traitement de données.
2+ années d'expérience en ingénierie/développement logiciel - vous devez être à l'aise pour mettre en place de nouveaux outils pour des utilisateurs non programmeurs, et coder dans un environnement collaboratif avec des ingénieurs expérimentés en données et en logiciels.
Compétences statistiques incluant les statistiques bayésiennes, les méthodes d’échantillonnage, les modèles mixtes, et l’application d’autres concepts statistiques.
Solide expérience passée de travail collaboratif sur des problématiques de science des données avec des scientifiques de laboratoire humide, idéalement dans une startup ou un environnement équivalent à rythme rapide.
Atout : Compréhension des fondamentaux des outils de sciences de la vie, des technologies et des méthodes de laboratoire. En particulier, vous seriez expert de plusieurs des domaines suivants : immunoessais, amplification des acides nucléiques, nanoarchitecture et conception de l'ADN, techniques de séparation pour les échantillons et composés biologiques, biophysique / fluorescence et traitement du signal.
Atout : Expérience directe d'optimisation (seul ou en équipe) de : chimie de surface (passivation, fonctionnalisation, régénération), circuits à base d’ADN et conceptions de biocapteurs ADN, fluorophores/fluorescence et FRET, interactions anticorps-antigène et liaison de ligands, ou domaines similaires.
Excellentes compétences en communication (écrite, orale et dans une base de code) et capacité à résoudre des problèmes de manière autonome.
La maîtrise de l'anglais est requise car nos clients et fournisseurs sont principalement situés aux États-Unis. De plus, ce poste interagira avec les membres de notre équipe au sein de notre entité américaine.

Joignez-vous à notre équipe si:

Partagez profondément notre mission, notre ambition et notre sens du devoir. Notre mission n’est pas un slogan marketing : nous avons développé notre technologie pour mieux mesurer la biologie et découvrir des biomarqueurs pour la détection précoce des maladies. Nous croyons fermement pouvoir éradiquer certaines maladies en permettant leur diagnostic précoce. Nous croyons également que c’est notre devoir de travailler dur pour exploiter tout le potentiel de cette technologie.
Êtes prêt à relever des défis et à progresser : nous sommes une équipe de résolveurs de problèmes qui se met constamment à l’épreuve et s’aventure dans l’inconnu. Nous avons un état d’esprit de croissance, tant sur les compétences techniques que comportementales, et nous comptons les uns sur les autres pour fournir des retours critiques et sincères permettant à chacun d’atteindre son plein potentiel.
Voulez travailler à la pointe de la biotechnologie. Le nELISA est un nouvel outil utilisant la nanotechnologie ADN pour générer des données protéomiques de façon plus efficace que jamais. Vous participerez à la conception et au développement des pipelines de données et des outils d’analyse qui accompagneront la montée en puissance de cette technologie.
Aimez coder et analyser des données biologiques, et souhaitez être responsable de l’amélioration des pipelines de données avec une approche full-stack.
Préférez travailler et communiquer au sein d’une équipe interdisciplinaire et diversifiée. Vous collaborerez quotidiennement avec vos collègues des équipes Engineering, Operations et Commerciales, en rejoignant une équipe collaborative, diversifiée et inclusive où vos idées seront valorisées.
Voulez avoir la responsabilité de résoudre certains de nos problèmes les plus complexes. La donnée est l’une de nos compétences clés, et la recherche et le développement d’améliorations de nos méthodes d’analyse ont un effet multiplicateur sur tous les autres aspects de notre entreprise et de nos clients, en particulier les scientifiques utilisant le nELISA et les patients qui bénéficieront in fine des données nELISA.

Si vous êtes passionné par le développement d’algorithmes et de pipelines de données en biologie, si vous souhaitez faire progresser l’innovation en protéomique et avez à cœur de faire une réelle différence dans le monde, nous vous invitons à postuler et à nous rejoindre dans notre mission de redéfinir la protéomique et la compréhension de la biologie.

Apply now Apply later

* Salary range is an estimate based on our AI, ML, Data Science Salary Index 💰

Job stats: 2 0 0

Categories: Data Science Jobs Engineering Jobs

Tags: Bayesian Biology Chemistry Data analysis Data pipelines Drug discovery Engineering Machine Learning Pharma Pipelines R R&D Statistics