47 jobs for Pipeline parallelism

Senior Inference Runtime Engineer TWD 1900K-2500K

CUDA | CUDA profiling | Continuous batching | Distributed inference | GPU Memory Optimization

Flexible work culture | Inclusive environment | Training and mentoring

Senior-level Full Time

Singapore, SG / Penang, MY / …

1d ago

NLP AI Engineer USD 100K-150K

Adapters | DPO | Efficient Fine Tuning | Evaluation | FSDP

Senior-level Full Time

United States - Remote R

1d ago

Large Language Model Specialist USD 100K-150K

Adapter | Attention | Benchmarking | DPO | Data Curation

Senior-level Full Time

Tempe, AZ R

1d ago

LLM Engineer USD 100K-150K

Adapter modules | Attention Optimization | Benchmarking | DPO | Dataset Distillation

Senior-level Full Time

United States - Remote R

1d ago

LLM Engineer USD 100K-150K

Adapter Method | Attention Optimization | DPO | Distributed Training | Efficient Fine Tuning

Senior-level Full Time

United States - Remote R

1d ago

Model Optimization Engineer USD 100K-150K

C++ | CUDA | Continuous batching | Deep learning | DeepSpeed

Senior-level Full Time

United States - Remote R

1d ago

ML Performance Engineer USD 100K-150K

Benchmarking | C++ | Continuous batching | Cutlass | Deep learning

Career growth | Direct W2 employment | Remote work

Senior-level Full Time

Tempe, AZ R

1d ago

Foundation Model Engineer USD 100K-150K

Adapter Layers | DPO | Dataset curation | DeepSpeed ZeRO | Distributed Training

Senior-level Full Time

United States - Remote R

1d ago

Lead Machine Learning Engineer (Foundation Models) SGD 162K-238K

C++ | DPO | Deep learning | DeepSpeed | Distributed Training

Birthday leave | Employee assistance programme | FlexWork | Flexible benefits | Medical insurance

Senior-level Full Time

Singapore, Singapore

3d ago

Generative AI Engineer USD 100K-150K

Adapter-Tuning | Benchmarking | DPO | Direct Preference Optimization | Distributed Training

Senior-level Full Time

United States - Remote R

4d ago

Large Language Model Specialist USD 100K-150K

Adapter methods | Attention Optimization | DPO | Evaluation methodology | FSDP

Senior-level Full Time

85295, AZ R

4d ago

LLM Engineer USD 100K-150K

Adapter methods | Benchmarking | DPO | Distributed Training | Efficient Attention

Senior-level Full Time

United States - Remote R

4d ago

LLM Engineer USD 100K-150K

Adapters | DPO | Dataset curation | Deep reinforcement learning | Efficient Attention

Senior-level Full Time

United States - Remote R

4d ago

ML Performance Engineer USD 100K-150K

Attention Optimization | Benchmarking | C++ | Compiler optimization | Continuous batching

Mentorship | Remote work

Senior-level Full Time

Gilbert, AZ R

4d ago

AI Optimization Engineer USD 100K-150K

Benchmarking | C++ | Cache optimization | Compiler optimization | Continuous batching

Career growth

Senior-level Full Time

United States - Remote R

4d ago

Model Optimization Engineer USD 100K-150K

Benchmarking | C++ | CUDA | Continuous batching | Cutlass

Senior-level Full Time

United States - Remote R

5d ago

Foundation Model Engineer USD 100K-150K

Adapter methods | Attention Mechanisms | Dataset curation | Direct Preference Optimization | Distributed Training

Senior-level Full Time

United States - Remote R

5d ago

大模型推理架构师 CNY 144K-240K

Ascend C | C plus plus | C# | CUDA | CUDA kernel

Senior-level Full Time

上海

5d ago

Foundation AI Engineer (LLM) CAD 100K-110K

AI Feedback | Attention Mechanisms | Constitutional AI | Constitutional Safety Tuning | Data Curation

Annual health checkups | Healthcare insurance | Opportunity to collaborate with industry professionals | Performance bonuses | Preferential pricing for services

Mid-level Full Time

Hanoi, Vietnam

5d ago

NLP AI Engineer USD 100K-150K

Adapter-Tuning | DPO | Efficient Attention | FSDP | Fine Tuning

Mid-level Full Time

United States - Remote R

6d ago

ML Framework (MetalLM) Engineer USD 175K-312K

C# | C++ | CUDA | Compiler optimization | Compression

Senior-level Full Time

Cupertino

7d ago

优才-具身大模型训练框架工程师-觅蜂子公司 CNY 500K-500K

C++ | CPU Optimization | CUDA | CUDA graph | Communication overlap

Mid-level Full Time

上海 R

11d ago

Senior AI Infrastructure Engineer - Model Training USD 190K-260K

BF16 | C++ | CUDA | Data parallelism | DeepSpeed

401k | Dental and vision plans | Dependent care FSA | Dog-friendly office | FSA

Senior-level Full Time

Mountain View, CA

11d ago

Senior AI scientist INR 3715K-5449K

ALiBi | Adafactor Optimizer | AdamW | Attention Mechanisms | BF16

Senior-level Full Time

Remote - India R

12d ago

LLM Engineer USD 100K-150K

Adapters | Attention Optimization | DPO | Dataset curation | Evaluation methodology

Mid-level Full Time

United States - Remote R

13d ago

Tech Lead Manager, Inference USD 207K-300K

Autoscaling | Cache Management | Caching | Continuous batching | Deployment Pipelines

Senior-level Full Time

SF Bay Area, CA

13d ago

Sr. Engineering Manager, AI Runtime USD 228K-297K

Checkpointing | DeepSpeed | Distributed Systems | Elastic Training | FSDP

Senior-level Full Time

Mountain View, California; San Francisco, California

14d ago

Senior AI Scientist USD 123K-197K

ALiBi | Adafactor | AdamW | Attention | BF16

Annual bonus opportunity | Company RRSP contribution | Equity awards | Hybrid work | Insurance coverage

Senior-level Full Time

Remote - USA, United States R

15d ago

Gen AI Engineer USD 112K-167K

AWQ | AWS | AWS ECS | AWS EKS | Agile

401k match | Dental insurance | Life insurance | Medical insurance | Paid Holidays

Mid-level Full Time

GA-ATLANTA, 740 W PEACHTREE ST NW, …

15d ago

Senior Software Engineer, RL Post-Training Frameworks EUR 90K-140K

C# | C++ | CPUs | CUDA | Container lifecycle

Comprehensive benefits | Family benefits | Health insurance | Paid time off

Senior-level Full Time

Remote - Germany R

18d ago

Principal LLM Inference Engineer USD 195K-285K

Batching | C# | C++ | CUDA | CUDA kernel

Equity | Flexible working hours | Health insurance | Paid time off

Senior-level Full Time

Santa Clara

20d ago

Staff ML Engineer, Generative Model Performance & Efficiency USD 251K-310K

Data parallelism | Diffusion Models | Efficient Attention | Expert parallelism | Flax

Senior-level Full Time

Mountain View, California, United States, New …

21d ago

[AI Research Div.] Research Engineer - Foundation Models (2년 이상 / 계약직)

Checkpointing | Communication optimization | Data loading | Data parallelism | Deep learning

Entry-level Full Time

Seoul

26d ago

Senior Software Architect, AI Networking

C++ | CUDA | Cluster scheduling | Compute scheduling | Deep learning

Senior-level Full Time

Israel, Tel Aviv

27d ago

EDB-IPP Project: Advancing GPU Optimization for Large Language Models SGD 60K-120K

Continuous batching | Data parallelism | Deep learning | Distributed Training | Dynamic Memory

Computational resources access | Full sponsorship | Hired by Rakuten Asia after completion | Research exchanges

Mid-level Full Time

Crimson House Singapore

1mo ago

Software Engineer, Systems ML USD 141K-208K

C plus plus | CUDA | Co-design | Compiler optimization | Deep learning

Senior-level Full Time

Bellevue, WA | Menlo Park, CA …

1mo ago

Senior AI Infra Engineer - Large Model Inference Systems (Multimodal/LLM/VLM) USD 198K-368K

Attention Mechanisms | Batching | CUDA | Data parallelism | Distributed Systems

Senior-level Full Time

San Jose, California, United States

1mo ago

Senior AI Infra Engineer - Large Model Training Infrastructure (LLM/VLM /Agent RL) USD 207K-300K

Attention Mechanisms | Data parallelism | Deep learning | Distributed Training | Language Models

Senior-level Full Time

San Jose, California, United States

1mo ago

Staff Software Engineer, AI Runtime USD 190K-265K

Algorithms | Automatic Recovery | Checkpointing | Collective communication | Data Structures

Senior-level Full Time

Mountain View, California; San Francisco, California

1mo ago

LLM Inference Frameworks and Optimization Engineer USD 160K-230K

C++ | CUDA | CUDA graph | Cluster scheduling | Compiler

Equity | Health insurance

Mid-level Full Time

San Francisco, Singapore, Amsterdam

1mo ago

Senior Solutions Architect, GPU Cloud GenAI – Infrastructure INR 2200K-5000K

Ansible | C plus plus | CI/CD | Data parallelism | Device plugin

Senior-level Full Time

India, Mumbai

1mo ago

Research Scientist, Efficient Deep Learning - New College Grad 2026 USD 168K-264K

Architecture Search | C++ | CUDA | Computer Vision | Deep learning

Senior-level Full Time

US, CA, Santa Clara, United States

1mo ago

Senior Software Engineer, AI Runtime USD 160K-225K

Algorithms | Checkpointing | Collective communication | Data Structures | Data parallelism

Senior-level Full Time

Mountain View, California; San Francisco, California

1mo ago

Staff Machine Learning Engineer - ML Training Infrastructure USD 185K-335K

AWS | Azure | Debugging | Distributed Computing | FSDP

Company vehicle | Dental insurance | Flexible spending account | Health insurance | Health savings account

Senior-level Full Time

GM Automation - Sunnyvale - GM …

1mo ago

Staff Compiler Engineer - PyTorch + Kernel DSLPLATE USD 163K-253K

Autotuning | Collective Primitives | Cost Based Compilation | Custom ISA | Cutlass

401k | Adoption support stipend | Charitable giving match | Fertility care stipend | Flexible work environment

Senior-level Full Time

San Jose, California, United States

1mo ago

Data/AI Engineer Intern SGD 40K-57K

AI Job Scheduling | Automated testing | C++ | Checkpointing | DeepSpeed

Entry-level Full Time Internship

Singapore-CapitaSky

1mo ago

Ai基础架构工程师-大规模集群方向 CNY 240K-360K

Automation tools | CUDA | CUDNN | Ceph | Containerd

Senior-level Full Time

上海

1mo ago

Find jobs in AI/ML, Data Science and Big Data