44 jobs for Reward Modeling

Senior AI Engineer (Closed-loop Simulation & RL) KRW 30000K-30000K

3DGS | Agent simulation | Autonomous Driving | CARLA | Counterfactual Simulation

Senior-level Full Time

Pangyo (Software Dream Center), South Korea

1d ago

[MS/PhD Intern] AI Engineer (정규직 전환형) KRW 25284K-25754K

Ablation Studies | Auto-labeling | Autonomous Driving | Benchmarking | Critical Systems

Entry-level Internship

Pangyo (Software Dream Center), South Korea

1d ago

Senior Machine Learning Engineer INR 4000K-7000K

Adapters | Benchmarking | DORA | DPO | Dataset Preparation

Mid-level Full Time

Noida, Uttar Pradesh, India

5d ago

强化学习算法工程师 CNY 180K-300K

A/B | A/B Testing | B testing | Data pipeline | Deep learning

Entry-level Full Time

上海

5d ago

Machine Learning Manager, Search & Knowledge Platforms USD 175K-301K

Cloud compute | Hallucination reduction | Inference Optimization | Information Retrieval | Language Models

Mid-level Full Time

Santa Clara; Seattle

5d ago

Machine Learning Manager, Search & Knowledge Platforms USD 175K-301K

AI Feedback | Hallucination reduction | High Availability | Human Feedback | Language Models

Mid-level Full Time

Santa Clara; Seattle

5d ago

Foundation AI Engineer (LLM) CAD 100K-110K

AI Feedback | Attention Mechanisms | Constitutional AI | Constitutional Safety Tuning | Data Curation

Annual health checkups | Healthcare insurance | Opportunity to collaborate with industry professionals | Performance bonuses | Preferential pricing for services

Mid-level Full Time

Hanoi, Vietnam

5d ago

Senior Machine Learning Engineer, Agent Oversight USD 216K-270K

Agent Orchestration | Anomaly Detection | Drift Detection | Evaluation Methodologies | Experimentation

Dental insurance | Health insurance | Learning and development stipend | Paid time off | Retirement benefits

Senior-level Full Time

San Francisco, CA; New York, NY

6d ago

AIML - Applied Research Engineer, Machine Translation EUR 90K-103K

Amazon Web Services | C++ | Cloud platform | Dask | Data Generation

Senior-level Full Time

Aachen

7d ago

Multimodal Reinforcement Learning Algorithm Researcher

Autoregressive models | CPU GPU | CPU/GPU acceleration | Deep Learning Systems | Deep learning

Senior-level Full Time

Singapore-CapitaSky

8d ago

Senior Software Engineer, Machine Learning Infrastructure USD 176K-220K

AWS | Airflow | Apache Beam | Apache Spark | Autoscaling

401k match | Equity | Fertility benefits | Flexible PTO | Learning stipend

Senior-level Full Time

San Francisco, CA

10d ago

LLM Agent Research Scientist 大模型智能体研究科学家 CNY 144K-240K

Agent systems | Benchmarking | Cloud Computing | DeepSpeed | GPU Computing

Internship opportunity | Open to all experience levels

Entry-level Full Time

Beijing, Beijing, China

11d ago

Machine Learning Engineer, Proactive USD 170K-300K

DPO | Deep learning | Efficient Fine Tuning | Factuality Evaluation | Fine Tuning

Senior-level Full Time

Cupertino

12d ago

Research Engineer BRL 200K-240K

Ablation Studies | Computer Vision | Data Decontamination | Data Deduplication | Data Generation

Autonomy | Rapid iteration | Remote work flexibility | Talent dense team

Mid-level Full Time

Brazil

13d ago

大模型算法工程师（开放域对话） CNY 180K-300K

Data Deduplication | Data cleaning | DeepSpeed | Dialogue State Tracking | Distributed Training

Mid-level Internship

上海、北京

14d ago

大语言模型后训练/Agentic算法工程师 CNY 180K-360K

Distributed Training | Function Calling | Java | Language Models | Language Processing

Entry-level Full Time

上海、北京

14d ago

LLM & Agent Algorithm Expert - TikTok Search SGD 150K-191K

Agent Orchestration | Agent systems | Automated Machine Learning | Benchmarking | Causal reasoning

Senior-level Full Time

Singapore, Singapore

18d ago

ML Engineer, Apple Foundation Models USD 166K-296K

Benchmarking | Data Curation | Data Generation | Data Governance | Data Pipelines

Mid-level Full Time

Cupertino

18d ago

Software Engineer, Research Acceleration USD 350K-475K

Distributed Systems | Evaluation Frameworks | Experiment tracking | JAX | Machine Learning

Dental insurance | Health insurance | Paid parental leave | Relocation support | Unlimited PTO

Senior-level Full Time

San Francisco

20d ago

Software Engineer - Machine Learning USD 190K-220K

Accelerate | Adversarial Data | Adversarial Data Generation | Adversarial Training | Content Moderation

Mid-level Contract

Mountain View, CA

20d ago

Applied Scientist / Machine Learning Engineer USD 311K-370K

Action models | Active Learning | Data Curation | Data Deduplication | Data Processing

Hybrid work policy

Mid-level Full Time

Sunnyvale

20d ago

Principal Research Engineer, Model Training & Post-Training USD 400K-550K

AI Feedback | Checkpointing | Cost Performance | Cost-performance tradeoffs | Data Decontamination

401k matching | Country specific visa support | Flexible work arrangements | Medical, dental, and vision options | Parental leave

Senior-level Full Time

Palo Alto, California, United States

21d ago

Agent Post-Training, Computer Use Research USD 295K-445K

Data pipeline | Evaluation | Experimentation | Grader Development | Machine Learning

Senior-level Full Time

San Francisco

24d ago

Agent Post-Training, Connectors Research USD 295K-445K

Data Pipelines | Deep learning | Experimentation | Language Models | Language Processing

Senior-level Full Time

San Francisco

24d ago

Agent Post-Training, Context Research USD 295K-445K

Data Pipelines | Deep learning | Experimentation | Grading | Language Models

Mid-level Full Time

San Francisco

24d ago

LLM & Agent Algorithm Project Intern (Search) - 2026 Start (PhD) SGD 40K-52K

Agent Orchestration | Agent systems | Automated testing | Context modeling | Data Quality

Entry-level Internship

Singapore, Singapore

26d ago

Machine Learning Engineer - Reinforcement Learning EUR 54K-75K

Data Pipelines | Evaluation | Fine Tuning | Human Feedback | LLM Fine-tuning

Senior-level Full Time

Paris, France

26d ago

Staff Software Engineer, AI/ML USD 216K-271K

AI Feedback | Agentic AI | Data Pipelines | Direct Preference Optimization | Experimentation platforms

Conference reimbursement | Education reimbursement | Employee assistance program | Employee stock purchase program | Equity compensation

Senior-level Full Time

Seattle

27d ago

Senior Applied Scientist USD 142K-270K

Data Pipelines | Diffusion Models | Direct Preference Optimization | Evaluation metrics | Fine Tuning

Senior-level Full Time

Seattle, United States R

27d ago

Director, Reinforcement Learning & Agentic Post-Training EUR 151K-200K

AI Feedback | API Integration | Distributed Training | Environment Design | Evaluation

Executive-level Full Time

Paris, France

27d ago

Research Scientist, Gemini Data, DeepMind EUR 104K-107K

Fine Tuning | JAX | Language Models | Large Language Models | Machine Learning

Mid-level Full Time

Paris, France

28d ago

Staff Machine Learning Engineer GBP 155K-163K

Data Processing | Deep learning | Distributed Training | Generative AI | Human Feedback

Company benefits program | Discretionary annual bonus | Equity incentive plan

Senior-level Full Time

London, UK

29d ago

Senior Software Engineer - Model Training & AI Evals INR 3500K-5000K

AI Feedback | Ablation Studies | Benchmarking | CI/CD | Data Generation

Senior-level Full Time

Remote (India) R

1mo ago

Sr. Staff, Machine Learning Engineer (Ads Engineering)

AI Feedback | Agent Orchestration | Agent systems | Agentic AI | Autonomous Reasoning

Senior-level Full Time

Seoul, South Korea

1mo ago

Staff Data Scientist: Semantic Substrate Incubation USD 206K-271K

AWS CDK | AWS CloudFormation | AWS EC2 | AWS Lambda | AWS Neptune

Conference and publication support | Continuous learning stipend | Dedicated growth time | Flexible time off | Health and dental insurance

Senior-level Full Time

Seattle, Washington, United States

1mo ago

Machine Learning Engineer USD 170K-315K

Data Preprocessing | Deep learning | Evaluation benchmarks | Fine Tuning | GPU Profiling

Health benefits | Hybrid work model | Retirement benefits | Vacation time

Mid-level Full Time

USA - CA - Santa Clara, …

1mo ago

Data Scientist (Remote) USD 120K-180K

Abuse Resistance | Agent safety | Agentic Planning | Data scaling | DeepSpeed

Employee networks | Great Place to Work certified | Office culture | Paid adoption leave | Paid parental leave

Mid-level Full Time

USA VA Remote, United States R

1mo ago

Machine Learning Engineer, PhD Intern (Fall) USD 100K-125K

Algorithms | Data Management | Distillation | Feedback learning | Generative AI

Remote work flexibility

Entry-level Internship

United States - Remote R

1mo ago

Intern Engineer – RL Post-Training for LLMs CAD 58K-104K

Data Generation | Deep learning | DeepSpeed | Distributed Training | GRPO

Internship

Entry-level Internship

Vancouver, British Columbia, Canada

1mo ago

Sr. Physical AI Research Scientist CAD 140K-180K

AI alignment | Artificial Intelligence | Computer Vision | Constitutional AI | Continual Learning

Hybrid work schedule

Senior-level Full Time

Toronto, ON, CA

1mo ago

Research Engineer - LLM Training & Alignment Systems CAD 127K-225K

Automation | Benchmarking | C# | C++ | Data Curation

Mid-level Contract Full Time

Kingston, Ontario, Canada

1mo ago

Machine Learning Researcher - RL and Agentic Systems USD 190K-287K

Agentic Systems | Benchmarking | Data Validation | Dataset Quality Evaluation | Dataset quality

Mid-level Full Time

Remote R

1mo ago

Tech Lead, Machine Learning Engineer - Global E-Commerce (Conversational AI) SGD 150K-191K

Data Curation | Deep learning | DeepSpeed | Direct Preference Optimization | Evaluation

Senior-level Full Time

Singapore, Singapore

1mo ago

Staff Machine Learning Engineer, AV Core USD 336K-370K

3D Scene | 3D Scene Understanding | Action models | Behavior Modeling | C++

Hybrid work | Work from home

Senior-level Full Time

Sunnyvale

1mo ago

Find jobs in AI/ML, Data Science and Big Data