18 jobs for Proximal Policy Optimization

Super Sparks-校招-具身智能/机器人研究员（Embodied AI / Robotics Researcher） CNY 500K-500K

Actor-critic | C++ | Computer Vision | Deep learning | Diffusion Models

Entry-level Full Time

上海

5d ago

Machine Learning Research Engineer (Foundational Research) GBP 80K-127K

CI/CD | ClearML | Containerization | Continuous integration | Curriculum learning

Flexible work arrangement | Hybrid work model | Learning opportunities | On-the-job coaching | Work-life balance

Mid-level Full Time

United Kingdom, London R

7d ago

Machine Learning Research Engineer | Kilby Labs USD 137K-238K

C# | C++ | Deep learning | Direct Preference Optimization | Embeddings

Career development | Employee wellbeing

Mid-level Full Time

United States

7d ago

Machine Learning Engineer (Reinforcement Learning for UAV) A UAH 327K-360K

AIMet | Actor-critic | Airsim | Domain Randomization | IMU

Coffee | Conference sponsorship | Corporate library | Flexible work hours | Health insurance

Entry-level Full Time

Kyiv | Київ, UA

9d ago

Applied Reinforcement Learning Engineer USD 150K-300K

A2C | A3C | Actor-critic | Agent systems | BCQ

Collaborate with industry leaders | Equal opportunity employer | Hybrid remote work | Research publications support

Mid-level Full Time

Remote Work( USA), United States R

13d ago

Sr AI/ML Engineer USD 143K-197K

Actor-critic | C# | C++ | CUDA | Cybersecurity

401k matching | Health, dental & vision plans | Hybrid work environment | Life insurance | Occasional travel

Senior-level Full Time

Englewood, CO - CO RMN, United …

15d ago

真机强化学习实习生 CNY 25K-37K

Actor-critic | Deep Q Networks | Embodied Foundation Model | Foundation Model | Isaac-Gym

Entry-level Internship

上海

20d ago

Sr Software Dev Engineer, Stores Foundational AI -SFAI USD 168K-227K

Async Rollouts | Batching | Distributed Systems | Experiment tracking | GPU Utilization

401k matching | Dental insurance | EAP | Flexible spending accounts | Health insurance

Senior-level Full Time

Seattle, Washington, USA

22d ago

Senior Software Machine Learning Engineer (Teradyne, North Reading, MA) USD 133K-223K

Actor-critic | Computer Vision | Computer Vision Defect Detection | Data Ingestion | Defect Detection

Dental insurance | Flexible spending accounts | Life and disability insurance | Medical insurance | Paid vacation and holidays

Senior-level Full Time

North Reading, MA, US

26d ago

Staff Software Engineer, AI/ML USD 216K-271K

AI Feedback | Agentic AI | Data Pipelines | Direct Preference Optimization | Experimentation platforms

Conference reimbursement | Education reimbursement | Employee assistance program | Employee stock purchase program | Equity compensation

Senior-level Full Time

Seattle

27d ago

Senior Software Engineer - Model Training & AI Evals INR 3500K-5000K

AI Feedback | Ablation Studies | Benchmarking | CI/CD | Data Generation

Senior-level Full Time

Remote (India) R

1mo ago

Research Engineer/Scientist - Machine Learning RL & Optimisation (Contractor) GBP 70K-70K

Bayesian optimization | Data Generation | Debugging | DeepSpeed | Distributed Systems

Additional time off for learning and development | Annual leave | Cycle to work scheme | Employee assistance program | Group personal pension

Entry-level Contract

London, United Kingdom

1mo ago

Research Scientist, LLM Evaluation & Post-Training USD 150K-300K

AI Feedback | Alignment | Benchmarking | Context evaluation | Deep learning

Mid-level Full Time

Remote Work( USA), United States R

1mo ago

Machine Learning Engineer, LLM Post-Training USD 150K-230K

Attention Mechanisms | Data-parallel | DeepSpeed | Fully Sharded Data Parallel | Hugging Face

401k match | Commuter benefits | Dental insurance | FSA | HSA

Mid-level Full Time

Mountain View, California, United States

1mo ago

Software Machine Learning Engineer USD 116K-186K

Applied AI | Attention Mechanism | Explainable AI | Graph Machine Learning | Interpretability

Dental insurance | Disability insurance | Discretionary bonuses | Flexible spending accounts | Life insurance

Entry-level Full Time

North Reading, MA, US

1mo ago

具身智能-强化学习(灵巧操作方向) 实习生 CNY 25K-37K

Actor-critic | Diffusion Models | Distributed Training | Embodied intelligence | Flow matching

Entry-level Full Time Internship

深圳

1mo ago

Senior Staff AI Engineer USD 180K-240K

A3C | Actor-critic | Adaptive computation | Benchmarks | C plus plus

Senior-level Full Time

Los Altos, California,

1mo ago

Principal AI Research Scientist Post-Training · Alignment · Reinforcement Learning Autodesk AI Lab: London · San Francisco · Toronto · Remote (US/CA/EU USD 152K-269K

AI Feedback | Agentic Systems | Direct Preference Optimization | Distributed Training | Evaluation

Senior-level Full Time

AMER - United States - California … R

1mo ago

Find jobs in AI/ML, Data Science and Big Data