Sr Data Scientist/Data Engineer
Montreal
nomic
Discover Omni 1000, the revolutionary proteomics platform offering 1000 high-fidelity proteins for cost-effective and rapid analysis in any study.About us:
Nomic was founded with a simple but ambitious goal: to make biology easier to measure. Weâve developed nELISA, the worldâs highest throughput proteomic platform, by tackling some of the toughest challenges in protein profiling through a combination of DNA nanotechnology, high-dimensional flow cytometry, lab automation, and machine learning.
Since spinning out of McGill University, weâve partnered with dozens of top-tier drug discovery groups, including 6 of the top 10 pharma companies, and have profiled over 60 million proteins from more than 400,000 samples to date.
Since closing a $42M Series B round, we recently scaled up the platform to meet rapidly growing demand. You can read more about this on our website here. Our state-of-the-art facility is capable of profiling over 2.5 million samples a year, generating 500 million protein assays.
Weâre a diverse team of engineers, scientists, and problem-solvers who thrive on breaking down difficult challenges using first principles thinking, and we leverage the latest scientific and technological breakthroughs to drive our mission forward.
About the role:
The Data team at Nomic is responsible for designing, building, operating and improving the data pipelines, data infrastructure, and data tools needed for analyzing nELISA data at scale. Our development roadmap includes building more robust data pipelines for decoding nELISA datasets, and developing improved internal-facing tools that will let our scientists execute faster in the lab by extracting insights from our nELISA profiling and manufacturing QC data on-demand.
As a senior IC on the team, you will sit at the intersection of our in-lab technology development efforts, our efforts to improve our data processing algorithms and infrastructure, and our work to manually analyze complex experimental datasets as part of developing internal tools for our scientists to more automatically visualize and analyze datasets themselves.
As a jack of all trades when it comes to analyzing data and building tools for others to do the same, your day to day responsibilities will include:
Designing, building, iteratively improving, and fully automating the data pipelines and algorithms we use for processing raw flow cytometry data from our highly multiplexed bead-based assays into quantitative protein measurements. This will be done in close collaboration with your Data Engineering, Software Engineering, and Lab R&D teammates.
You will leverage your fundamental knowledge of biosensors, fluorescence data, and bioengineering R&D to act as an expert for the interpretation, and analysis of, nELISA experimental data coming from R&D and day-to-day Lab Operations, connecting the fundamentals of the science to the specific features or anomalies of the data.
You will also support R&D and Lab Operations teams through developing additional data support features and algorithms to support the growth of Nomic going forward. This will include any new data analysis pipelines to analyze nELISA data, including QC data from our daily manufacturing and profiling operations.
This role will involve substantial communication, teamwork, and attention to detail, especially when identifying and troubleshooting issues related to nELISA data and ensuring we build the right tools, and the right abstractions.
When tooling does not yet exist, you will be responsible for analyzing nELISA data using our suite of decoding and analysis tools, as well as leveraging your technical and bioscience domain expertise to develop new data analysis pipelines when needed.
Moreover, you will be relied on to support our R&D and Lab Operations teams with guidance on experimental design and analysis when needed, drawing on your previous experience doing the same.
What weâre looking for:Â
Graduate Degree - or equivalent experience in industry - in bioengineering or a related quantitative field of study in the biosciences, with a focus on biosensors, quantitative fluorescence data, or similar.
3+ years of experience specifically with analyzing bioscience data and developing improved data processing algorithms.
2+ years software engineering/development experience - you must be comfortable standing up new toolsets for non-programming users, and coding in a collaborative environment together with experienced data and software engineers.
Statistical skills including bayesian statistics, sampling methods, mixed models, and experience applying other statistical concepts.
Strong past experience working collaboratively on data science problems with wet lab scientists, ideally in a startup or equivalent fast paced environment.
Nice to Have: Understanding of the fundamentals of life science tools, technologies and lab methods. In particular you would be an expert on multiple of: immunoassays, nucleic acid amplification, DNA nanoarchitecture and design, separation-based techniques for biological samples and compounds, biophysics / fluorescence, and signal processing.
Nice to Have: First hand experience optimizing (alone or in a team): surface chemistry (passivation, functionalization, regeneration), DNA-based circuits and DNA biosensor designs, fluorophores/fluorescence and FRET, antibody-antigen interactions and ligand binding, or similar domains.
Excellent communication skills (written, verbal, and in a codebase) and an independent problem solver.
Fluency in English is required as our customers and vendors are primarily located in the USA. In addition, this position will interact with our team members within our USA entity.
Join us if you:
Connect deeply with our mission, ambition and sense of duty. Our mission isnât marketing flash: we developed our technology to better measure biology and discover biomarkers for early disease detection. We firmly believe we will be successful in literally eradicating certain diseases by enabling them to be diagnosed earlier. We also believe that our hard work to bring this technology to its full potential is our duty.
Are up for a challenge and want to grow: We are a team of problem-solvers, and we continually put ourselves to the test and go into the unknown. We have a growth mindset, both on hard and soft skills, and we rely on each other to give critical and candid feedback to ensure that we can all reach our full potential.
Want to be at the cutting-edge of biotechnology. The nELISA is a new tool that leverages DNA nanotechnology to generate proteomic data more efficiently than ever before. You get to design and build the data pipelines and analysis tools that will support the scaling of this technology going forward.
Love writing code and analyzing biological data, and want to be responsible for driving improvements to data pipelines from a full-stack perspective.
Prefer working and communicating within a diverse cross-functional team. You would get to interface with your teammates from the broader Engineering, Operations, and Commercial teams on a daily basis, joining a collaborative, diverse, and inclusive team where your ideas will be valued.
Want the responsibility of addressing some of our hardest problems. Data is one of our core competencies, and researching and developing improvements to the way we analyze data has a compounding benefit on all other aspects of our company and our customers, most notably the scientists using the nELISA and patients that will ultimately benefit from nELISA data.
If you are passionate about analyzing data and building better data pipelines for biology, want to drive innovation in proteomics, and are eager to make a meaningful impact in the world, we invite you to apply and join us on our journey to redefine proteomics and the understanding of biology.
Ă propos de nous:
Nomic a été fondée avec un objectif simple mais ambitieux : rendre la biologie plus facile à mesurer. Nous avons développé nELISA, la plateforme protéomique la plus performante au monde, en relevant certains des défis les plus complexes du profilage des protéines grùce à une combinaison de nanotechnologie ADN, de cytométrie en flux haute dimension, d'automatisation de laboratoire et d'apprentissage automatique.
Depuis notre spin-off de lâUniversitĂ© McGill, nous avons collaborĂ© avec des dizaines de groupes de dĂ©couverte de mĂ©dicaments de premier plan, dont 6 des 10 plus grandes sociĂ©tĂ©s pharmaceutiques, et avons profilĂ© plus de 60 millions de protĂ©ines Ă partir de plus de 400 000 Ă©chantillons Ă ce jour.
Depuis la clĂŽture dâun tour de financement de SĂ©rie B de 42 M$, nous avons rĂ©cemment Ă©tendu la plateforme pour rĂ©pondre Ă une demande en forte croissance. Vous pouvez en lire davantage sur notre site web. Notre installation ultramoderne est capable de profiler plus de 2,5 millions dâĂ©chantillons par an, gĂ©nĂ©rant 500 millions dâanalyses protĂ©iques.
Nous sommes une Ă©quipe diversifiĂ©e dâingĂ©nieurs, de scientifiques et de rĂ©solveurs de problĂšmes qui prospĂšrent en dĂ©composant des dĂ©fis complexes grĂące Ă une rĂ©flexion fondĂ©e sur les premiers principes, et nous tirons parti des derniĂšres avancĂ©es scientifiques et technologiques pour faire progresser notre mission.
Ă propos du poste:
LâĂ©quipe Data de Nomic est responsable de concevoir, construire, exploiter et amĂ©liorer les pipelines de donnĂ©es, lâinfrastructure de donnĂ©es et les outils de donnĂ©es nĂ©cessaires Ă lâanalyse des donnĂ©es nELISA Ă grande Ă©chelle. Notre feuille de route de dĂ©veloppement comprend la crĂ©ation de pipelines de donnĂ©es plus robustes pour dĂ©coder les ensembles de donnĂ©es nELISA et le dĂ©veloppement dâoutils internes amĂ©liorĂ©s permettant Ă nos scientifiques de travailler plus rapidement au laboratoire en extrayant Ă la demande des informations issues de nos donnĂ©es de profilage nELISA et de contrĂŽle qualitĂ© de fabrication.
En tant que contributeur senior au sein de lâĂ©quipe, vous serez Ă lâintersection de nos efforts de dĂ©veloppement technologique en laboratoire, de nos travaux visant Ă amĂ©liorer nos algorithmes et infrastructures de traitement des donnĂ©es, et de notre travail dâanalyse manuelle de jeux de donnĂ©es expĂ©rimentaux complexes dans le cadre du dĂ©veloppement dâoutils internes permettant Ă nos scientifiques de visualiser et dâanalyser eux-mĂȘmes les jeux de donnĂ©es de maniĂšre plus automatique.
En tant que gĂ©nĂ©raliste de lâanalyse de donnĂ©es et de la crĂ©ation dâoutils destinĂ©s aux autres, vos responsabilitĂ©s quotidiennes comprendront :
Concevoir, construire, améliorer de maniÚre itérative et automatiser entiÚrement les pipelines de données et les algorithmes que nous utilisons pour traiter les données brutes de cytométrie en flux provenant de nos essais multiplexés à billes en mesures protéiques quantitatives. Ce travail se fera en étroite collaboration avec vos collÚgues en Data Engineering, Software Engineering et R&D en laboratoire.
Mettre Ă profit vos connaissances fondamentales en biosenseurs, donnĂ©es de fluorescence et R&D en bio-ingĂ©nierie pour jouer un rĂŽle dâexpert dans lâinterprĂ©tation et lâanalyse des donnĂ©es expĂ©rimentales nELISA provenant de la R&D et des opĂ©rations quotidiennes du laboratoire, en reliant les principes fondamentaux de la science aux caractĂ©ristiques ou anomalies spĂ©cifiques des donnĂ©es.
Soutenir les Ă©quipes R&D et OpĂ©rations Laboratoire en dĂ©veloppant des fonctionnalitĂ©s et des algorithmes supplĂ©mentaires de support aux donnĂ©es afin dâaccompagner la croissance de Nomic. Cela inclura la crĂ©ation de nouveaux pipelines dâanalyse pour les donnĂ©es nELISA, y compris les donnĂ©es de contrĂŽle qualitĂ© issues de nos opĂ©rations quotidiennes de fabrication et de profilage.
Communiquer de façon intensive, travailler en Ă©quipe et prĂȘter une grande attention aux dĂ©tails, notamment lorsquâil sâagit dâidentifier et de rĂ©soudre des problĂšmes liĂ©s aux donnĂ©es nELISA et de sâassurer que nous construisons les bons outils et abstractions adaptĂ©s.
Lorsque les outils nâexistent pas encore, analyser les donnĂ©es nELISA en utilisant notre suite dâoutils de dĂ©codage et dâanalyse, ainsi que dĂ©velopper de nouveaux pipelines dâanalyse lorsque nĂ©cessaire grĂące Ă votre expertise technique et scientifique.
Fournir un soutien aux Ă©quipes R&D et OpĂ©rations sur la conception et lâanalyse expĂ©rimentales lorsque cela est requis, en sâappuyant sur votre expĂ©rience passĂ©e dans ce domaine.
Ce que nous recherchons :
DiplÎme de troisiÚme cycle - ou expérience équivalente en industrie - en bio-ingénierie ou dans un domaine quantitatif connexe des biosciences, avec une spécialisation en biocapteurs, données de fluorescence quantitatives, ou domaine similaire.
3+ années d'expérience spécifiquement dans l'analyse de données bioscientifiques et le développement d'algorithmes améliorés de traitement de données.
2+ annĂ©es d'expĂ©rience en ingĂ©nierie/dĂ©veloppement logiciel - vous devez ĂȘtre Ă l'aise pour mettre en place de nouveaux outils pour des utilisateurs non programmeurs, et coder dans un environnement collaboratif avec des ingĂ©nieurs expĂ©rimentĂ©s en donnĂ©es et en logiciels.
CompĂ©tences statistiques incluant les statistiques bayĂ©siennes, les mĂ©thodes dâĂ©chantillonnage, les modĂšles mixtes, et lâapplication dâautres concepts statistiques.
Solide expérience passée de travail collaboratif sur des problématiques de science des données avec des scientifiques de laboratoire humide, idéalement dans une startup ou un environnement équivalent à rythme rapide.
Atout : Compréhension des fondamentaux des outils de sciences de la vie, des technologies et des méthodes de laboratoire. En particulier, vous seriez expert de plusieurs des domaines suivants : immunoessais, amplification des acides nucléiques, nanoarchitecture et conception de l'ADN, techniques de séparation pour les échantillons et composés biologiques, biophysique / fluorescence et traitement du signal.
Atout : ExpĂ©rience directe d'optimisation (seul ou en Ă©quipe) de : chimie de surface (passivation, fonctionnalisation, rĂ©gĂ©nĂ©ration), circuits Ă base dâADN et conceptions de biocapteurs ADN, fluorophores/fluorescence et FRET, interactions anticorps-antigĂšne et liaison de ligands, ou domaines similaires.
Excellentes compétences en communication (écrite, orale et dans une base de code) et capacité à résoudre des problÚmes de maniÚre autonome.
La maĂźtrise de l'anglais est requise car nos clients et fournisseurs sont principalement situĂ©s aux Ătats-Unis. De plus, ce poste interagira avec les membres de notre Ă©quipe au sein de notre entitĂ© amĂ©ricaine.
Joignez-vous à notre équipe si:
Partagez profondĂ©ment notre mission, notre ambition et notre sens du devoir. Notre mission nâest pas un slogan marketing : nous avons dĂ©veloppĂ© notre technologie pour mieux mesurer la biologie et dĂ©couvrir des biomarqueurs pour la dĂ©tection prĂ©coce des maladies. Nous croyons fermement pouvoir Ă©radiquer certaines maladies en permettant leur diagnostic prĂ©coce. Nous croyons Ă©galement que câest notre devoir de travailler dur pour exploiter tout le potentiel de cette technologie.
Ătes prĂȘt Ă relever des dĂ©fis et Ă progresser : nous sommes une Ă©quipe de rĂ©solveurs de problĂšmes qui se met constamment Ă lâĂ©preuve et sâaventure dans lâinconnu. Nous avons un Ă©tat dâesprit de croissance, tant sur les compĂ©tences techniques que comportementales, et nous comptons les uns sur les autres pour fournir des retours critiques et sincĂšres permettant Ă chacun dâatteindre son plein potentiel.
Voulez travailler Ă la pointe de la biotechnologie. Le nELISA est un nouvel outil utilisant la nanotechnologie ADN pour gĂ©nĂ©rer des donnĂ©es protĂ©omiques de façon plus efficace que jamais. Vous participerez Ă la conception et au dĂ©veloppement des pipelines de donnĂ©es et des outils dâanalyse qui accompagneront la montĂ©e en puissance de cette technologie.
Aimez coder et analyser des donnĂ©es biologiques, et souhaitez ĂȘtre responsable de lâamĂ©lioration des pipelines de donnĂ©es avec une approche full-stack.
PrĂ©fĂ©rez travailler et communiquer au sein dâune Ă©quipe interdisciplinaire et diversifiĂ©e. Vous collaborerez quotidiennement avec vos collĂšgues des Ă©quipes Engineering, Operations et Commerciales, en rejoignant une Ă©quipe collaborative, diversifiĂ©e et inclusive oĂč vos idĂ©es seront valorisĂ©es.
Voulez avoir la responsabilitĂ© de rĂ©soudre certains de nos problĂšmes les plus complexes. La donnĂ©e est lâune de nos compĂ©tences clĂ©s, et la recherche et le dĂ©veloppement dâamĂ©liorations de nos mĂ©thodes dâanalyse ont un effet multiplicateur sur tous les autres aspects de notre entreprise et de nos clients, en particulier les scientifiques utilisant le nELISA et les patients qui bĂ©nĂ©ficieront in fine des donnĂ©es nELISA.
Si vous ĂȘtes passionnĂ© par le dĂ©veloppement dâalgorithmes et de pipelines de donnĂ©es en biologie, si vous souhaitez faire progresser lâinnovation en protĂ©omique et avez Ă cĆur de faire une rĂ©elle diffĂ©rence dans le monde, nous vous invitons Ă postuler et Ă nous rejoindre dans notre mission de redĂ©finir la protĂ©omique et la comprĂ©hension de la biologie.
* Salary range is an estimate based on our AI, ML, Data Science Salary Index đ°
Tags: Bayesian Biology Chemistry Data analysis Data pipelines Drug discovery Engineering Machine Learning Pharma Pipelines R R&D Statistics
Perks/benefits: Career development Startup environment
More jobs like this
Explore more career opportunities
Find even more open roles below ordered by popularity of job title or skills/products/technologies used.