Find jobs in AI/ML, Data Science and Big Data

9 results for Flash Attention (Skill/Tech stack)

Senior ML Engineer (Token Factory) GBP 75K-130K

Attention | CI/CD | CUDA | Cutlass | FP8

Career growth and learning opportunities | Collaborative and innovative culture | Flexibility | International environment | Opportunity to work on impactful AI projects

Senior-level Full Time

Amsterdam, Netherlands; Berlin, Germany; Israel; London, … R

16d ago
Sr. Staff Machine Learning Researcher - Model Training & Optimization CAD 100K-500K

Deep learning | Distributed Training | Flash Attention | Inference Optimization | Kernel Fusion

Hybrid work

Senior-level Full Time

Toronto, Ontario, Canada

1mo ago
Applied Scientist 5.5 INR 2475K-4500K

3D Reconstruction | Adapters | CLIP | Computer Vision | ControlNet

Senior-level Full Time

Bangalore, India R

1mo ago
AI/ML ASIC Architect USD 163K-249K

ARM | ASIC | AXI | CUDA | CXL

Senior-level Full Time

Milpitas, CA, United States

1mo ago
AI/ML ASIC Architect USD 163K-249K

ARM | ASIC architecture | AXI interconnect | Area Optimization | Attention Mechanisms

Senior-level Full Time

Milpitas, CA, United States

1mo ago
AI Research Engineer (Model Compression & Quantization) - 100% Remote Worldwide USD 203K-330K

Compute Shaders | Diffusion Models | Distributed inference | Edge Computing | Expert parallelism

100 percent remote

Senior-level Full Time

Remote job R

1mo ago
AI Research Engineer (Kernel & Inference Optimization) USD 201K-332K

Computer Vision | Diffusion Models | Edge Computing | Expert parallelism | Flash Attention

Remote work

Senior-level Full Time

Remote job R

1mo ago
AI Research Engineer (Kernel & Inference Optimization) USD 201K-332K

Compute Shaders | Diffusion Models | Distributed inference | Edge Computing | Expert parallelism

English communication support | Remote work

Senior-level Full Time

Remote job R

1mo ago
AI Research Engineer (Kernel & Inference Optimization) - 100% Remote Worldwide USD 202K-325K

Diffusion Models | Distributed Inference Systems | Distributed inference | Expert parallelism | Flash Attention

100 percent remote | Worldwide remote

Senior-level Full Time

Remote job R

1mo ago