Find jobs in AI/ML, Data Science and Big Data

26 results for PPO (Skill/Tech stack)

Staff R&D AI Engineer USD 146K-175K

AI Deployment | AWS | Attention Mechanisms | Azure | Computer Vision

401k match | Continuing education support | Equity options | Flexible time off | Free parking

Senior-level Full Time

Austin, TX

1d ago
Principal AI/ML Researcher USD 270K-300K

Artificial Intelligence | Context Parallelism | DPO | Data parallelism | Deep learning

Equity compensation | Health and wellness benefits | Relocation assistance

Senior-level Full Time

Boston, MA

3d ago
Senior Machine Learning Engineer INR 4000K-7000K

Adapters | Benchmarking | DORA | DPO | Dataset Preparation

Mid-level Full Time

Noida, Uttar Pradesh, India

5d ago
Foundation AI Engineer (LLM) CAD 100K-110K

AI Feedback | Attention Mechanisms | Constitutional AI | Constitutional Safety Tuning | Data Curation

Annual health checkups | Healthcare insurance | Opportunity to collaborate with industry professionals | Performance bonuses | Preferential pricing for services

Mid-level Full Time

Hanoi, Vietnam

5d ago
具身智能算法工程师-模型 CNY 500K-500K

Deep learning | Distributed Training | GPU Training | IQL | Isaac Sim

Entry-level Full Time

北京 R

6d ago
AI Research Engineer A BRL 113K-151K

Ablation Studies | Active Learning | Adversarial Testing | Attention Mechanisms | BPE

Flexible work arrangements | Fully remote | Inclusive collaborative environment | Professional growth

Mid-level Full Time

Brazil R

7d ago
Data Scientist SGD 120K-190K

Actor-critic | Amazon S3 | Apache Airflow | Apache Spark | Attention Mechanisms

Mid-level Full Time

Singapore - Suntec

12d ago
Machine Learning Engineer, Proactive USD 170K-300K

DPO | Deep learning | Efficient Fine Tuning | Factuality Evaluation | Fine Tuning

Senior-level Full Time

Cupertino

12d ago
Applied Reinforcement Learning Engineer USD 150K-300K

A2C | A3C | Actor-critic | Agent systems | BCQ

Collaborate with industry leaders | Equal opportunity employer | Hybrid remote work | Research publications support

Mid-level Full Time

Remote Work( USA), United States R

13d ago
具身智能算法工程师 CNY 25K-37K

Deep learning | Distributed Training | GPU Training | IQL | Inference Optimization

Internship

Entry-level Internship

北京 R

13d ago
Senior Research Scientist- Robotics AI USD 185K-215K

3D Scene | 3D Scene Understanding | BEV Feature Representation | C++ | Computer Vision

401k matching | Disability protection | Health coverage | Life insurance | Paid time off

Senior-level Full Time

Sunnyvale, CA, United States

14d ago
大模型算法工程师（开放域对话） CNY 180K-300K

Data Deduplication | Data cleaning | DeepSpeed | Dialogue State Tracking | Distributed Training

Mid-level Internship

上海、北京

14d ago
大语言模型后训练/Agentic算法工程师 CNY 180K-360K

Distributed Training | Function Calling | Java | Language Models | Language Processing

Entry-level Full Time

上海、北京

14d ago
机器人全栈算法实习生（Robotics Full-Stack Algorithm Engineer） CNY 25K-37K

Behavior Cloning | C++ | Cloud processing | Control | Dagger

Entry-level Internship

北京、上海 R

20d ago
Specialist Healthcare Enrollment USD 74K-108K

ACA Compliance | Charity Care | Data entry | Data interchange | EDI

403b retirement plan options | Employee assistance program | Federal Student Loan Forgiveness | Health and wellness programs | Life insurance

Mid-level Part Time

Paterson, NJ, United States

21d ago
Software Dev Engineer II, Stores Foundational AI -SFAI USD 165K-223K

Async Rollouts | Batching | C++ | CUDA | Cluster computing

401k matching | Adoption reimbursement | Dental insurance | Employee assistance program | Flexible spending accounts

Mid-level Full Time

Palo Alto, California, USA

22d ago
Software Dev Engineer II, Stores Foundational AI -SFAI USD 143K-194K

CUDA | Data Pipelines | Distributed Training | Dynamo | Experiment tracking

401k matching | Employee assistance program | Health insurance | Paid time off | Parental leave

Mid-level Full Time

Seattle, Washington, USA

22d ago
Software Dev Engineer II, Stores Foundational AI -SFAI USD 143K-194K

Async Rollouts | Batching | C++ | CUDA | Data Delivery

401k matching | Health insurance | Paid time off | Parental leave

Mid-level Full Time

Seattle, Washington, USA

22d ago
Director, Reinforcement Learning & Agentic Post-Training EUR 151K-200K

AI Feedback | API Integration | Distributed Training | Environment Design | Evaluation

Executive-level Full Time

Paris, France

27d ago
AI Research Scientist, New Grad – Agents & Reinforcement Learning USD 176K-230K

Agent systems | DPO | Distributed Training | Fine Tuning | JAX

Entry-level Full Time

US-WA-Bellevue

1mo ago
Research Scientist- Robotics AI USD 165K-185K

3D Scene | 3D Scene Understanding | BEV | Behavior planning | C++

401k matching | Financial planning support | Health insurance | Life and disability protection | Paid time off

Mid-level Full Time

Sunnyvale, CA, United States

1mo ago
Senior Research Scientist- Robotics AI USD 185K-215K

3D Scene | 3D Scene Understanding | Autonomous Planning | BEV grid | Behavioral Planning

401k matching | Disability insurance | Financial planning support | Health insurance | Life insurance

Senior-level Full Time

Sunnyvale, CA, United States

1mo ago
Research Engineer - LLM Training & Alignment Systems CAD 127K-225K

Automation | Benchmarking | C# | C++ | Data Curation

Mid-level Contract Full Time

Kingston, Ontario, Canada

1mo ago
Principal Machine Learning Engineer

Apache Arrow | Apache Spark | DPO | Deep learning | DeepSpeed

Senior-level Full Time

Seoul, Korea

1mo ago
Principal AI Research Scientist Post-Training Alignment CAD 123K-180K

Agentic AI | Alignment research | DPO | Deep learning | Distributed Training

Senior-level Full Time

AMER - Canada - Ontario - …

1mo ago
Senior AI Researcher (Foundation AI) USD 190K-230K

CI/CD | Cloud Computing | Context Parallelism | DPO | Data parallelism

Senior-level Full Time

Boston, MA

1mo ago