29 jobs for Policy Optimization

Principal Machine Learning Engineer INR 4000K-5500K

AWS | Amazon SageMaker | Azure | Cloud platform | Deep learning

Senior-level Full Time

India - Hyderabad

1d ago

Super Sparks-校招-具身智能/机器人研究员（Embodied AI / Robotics Researcher） CNY 500K-500K

Actor-critic | C++ | Computer Vision | Deep learning | Diffusion Models

Entry-level Full Time

上海

5d ago

Machine Learning Manager, Search & Knowledge Platforms USD 175K-301K

Cloud compute | Hallucination reduction | Inference Optimization | Information Retrieval | Language Models

Mid-level Full Time

Santa Clara; Seattle

5d ago

Machine Learning Manager, Search & Knowledge Platforms USD 175K-301K

AI Feedback | Hallucination reduction | High Availability | Human Feedback | Language Models

Mid-level Full Time

Santa Clara; Seattle

5d ago

Machine Learning Research Engineer (Foundational Research) GBP 80K-127K

CI/CD | ClearML | Containerization | Continuous integration | Curriculum learning

Flexible work arrangement | Hybrid work model | Learning opportunities | On-the-job coaching | Work-life balance

Mid-level Full Time

United Kingdom, London R

7d ago

Senior Software Machine Learning Engineer (Teradyne, North Reading, MA) USD 133K-223K

Actor-critic | Computer Vision | Data Ingestion | Deep learning | Distributed Systems

Senior-level Full Time

North Reading, MA, US

7d ago

Machine Learning Research Engineer | Kilby Labs USD 137K-238K

C# | C++ | Deep learning | Direct Preference Optimization | Embeddings

Career development | Employee wellbeing

Mid-level Full Time

United States

7d ago

Machine Learning Engineer (Reinforcement Learning for UAV) A UAH 327K-360K

AIMet | Actor-critic | Airsim | Domain Randomization | IMU

Coffee | Conference sponsorship | Corporate library | Flexible work hours | Health insurance

Entry-level Full Time

Kyiv | Київ, UA

9d ago

Applied Reinforcement Learning Engineer USD 150K-300K

A2C | A3C | Actor-critic | Agent systems | BCQ

Collaborate with industry leaders | Equal opportunity employer | Hybrid remote work | Research publications support

Mid-level Full Time

Remote Work( USA), United States R

13d ago

Sr AI/ML Engineer USD 143K-197K

Actor-critic | C# | C++ | CUDA | Cybersecurity

401k matching | Health, dental & vision plans | Hybrid work environment | Life insurance | Occasional travel

Senior-level Full Time

Englewood, CO - CO RMN, United …

15d ago

真机强化学习实习生 CNY 25K-37K

Actor-critic | Deep Q Networks | Embodied Foundation Model | Foundation Model | Isaac-Gym

Entry-level Internship

上海

20d ago

Principal Research Engineer, Model Training & Post-Training USD 400K-550K

AI Feedback | Checkpointing | Cost Performance | Cost-performance tradeoffs | Data Decontamination

401k matching | Country specific visa support | Flexible work arrangements | Medical, dental, and vision options | Parental leave

Senior-level Full Time

Palo Alto, California, United States

21d ago

Sr Software Dev Engineer, Stores Foundational AI -SFAI USD 168K-227K

Async Rollouts | Batching | Distributed Systems | Experiment tracking | GPU Utilization

401k matching | Dental insurance | EAP | Flexible spending accounts | Health insurance

Senior-level Full Time

Seattle, Washington, USA

22d ago

Machine Learning Engineer - Reinforcement Learning EUR 54K-75K

Data Pipelines | Evaluation | Fine Tuning | Human Feedback | LLM Fine-tuning

Senior-level Full Time

Paris, France

26d ago

Senior Software Machine Learning Engineer (Teradyne, North Reading, MA) USD 133K-223K

Actor-critic | Computer Vision | Computer Vision Defect Detection | Data Ingestion | Defect Detection

Dental insurance | Flexible spending accounts | Life and disability insurance | Medical insurance | Paid vacation and holidays

Senior-level Full Time

North Reading, MA, US

26d ago

Staff Software Engineer, AI/ML USD 216K-271K

AI Feedback | Agentic AI | Data Pipelines | Direct Preference Optimization | Experimentation platforms

Conference reimbursement | Education reimbursement | Employee assistance program | Employee stock purchase program | Equity compensation

Senior-level Full Time

Seattle

27d ago

Director, Reinforcement Learning & Agentic Post-Training EUR 151K-200K

AI Feedback | API Integration | Distributed Training | Environment Design | Evaluation

Executive-level Full Time

Paris, France

27d ago

Engineering Manager, MLE USD 293K-385K

Algorithms | Data Pipelines | Data Structures | Deep learning | Fine Tuning

Mid-level Full Time

San Francisco

27d ago

Research Scientist Intern (TikTok Recommendation-LLMs, RL, GenAI) - 2026 Start (PhD) USD 136K-221K

Bandit Algorithms | Data Analysis | Deep learning | Generative AI | Language Models

Career growth opportunities | Hands-on project experience | Research mentorship

Entry-level Internship

San Jose, California, United States

27d ago

Senior Software Engineer - Model Training & AI Evals INR 3500K-5000K

AI Feedback | Ablation Studies | Benchmarking | CI/CD | Data Generation

Senior-level Full Time

Remote (India) R

1mo ago

Research Engineer/Scientist - Machine Learning RL & Optimisation (Contractor) GBP 70K-70K

Bayesian optimization | Data Generation | Debugging | DeepSpeed | Distributed Systems

Additional time off for learning and development | Annual leave | Cycle to work scheme | Employee assistance program | Group personal pension

Entry-level Contract

London, United Kingdom

1mo ago

Research Scientist, LLM Evaluation & Post-Training USD 150K-300K

AI Feedback | Alignment | Benchmarking | Context evaluation | Deep learning

Mid-level Full Time

Remote Work( USA), United States R

1mo ago

Data Scientist (Remote) USD 120K-180K

Abuse Resistance | Agent safety | Agentic Planning | Data scaling | DeepSpeed

Employee networks | Great Place to Work certified | Office culture | Paid adoption leave | Paid parental leave

Mid-level Full Time

USA VA Remote, United States R

1mo ago

Machine Learning Engineer, LLM Post-Training USD 150K-230K

Attention Mechanisms | Data-parallel | DeepSpeed | Fully Sharded Data Parallel | Hugging Face

401k match | Commuter benefits | Dental insurance | FSA | HSA

Mid-level Full Time

Mountain View, California, United States

1mo ago

Software Machine Learning Engineer USD 116K-186K

Applied AI | Attention Mechanism | Explainable AI | Graph Machine Learning | Interpretability

Dental insurance | Disability insurance | Discretionary bonuses | Flexible spending accounts | Life insurance

Entry-level Full Time

North Reading, MA, US

1mo ago

具身智能-强化学习(灵巧操作方向) 实习生 CNY 25K-37K

Actor-critic | Diffusion Models | Distributed Training | Embodied intelligence | Flow matching

Entry-level Full Time Internship

深圳

1mo ago

Applied Machine Learning Scientist - Vice President USD 107K-160K

A/B | A/B Testing | AdaLoRA | Agent Orchestration | B testing

Backup childcare | Financial coaching | Health and wellness programs | Health insurance | Mental health support

Executive-level Full Time

Palo Alto, CA, United States

1mo ago

Senior Staff AI Engineer USD 180K-240K

A3C | Actor-critic | Adaptive computation | Benchmarks | C plus plus

Senior-level Full Time

Los Altos, California,

1mo ago

Principal AI Research Scientist Post-Training · Alignment · Reinforcement Learning Autodesk AI Lab: London · San Francisco · Toronto · Remote (US/CA/EU USD 152K-269K

AI Feedback | Agentic Systems | Direct Preference Optimization | Distributed Training | Evaluation

Senior-level Full Time

AMER - United States - California … R

1mo ago

Find jobs in AI/ML, Data Science and Big Data