Find jobs in AI/ML, Data Science and Big Data

16 results for Reinforcement Learning from AI Feedback (Skill/Tech stack)

Machine Learning Manager, Search & Knowledge Platforms USD 175K-301K

AI Feedback | Hallucination reduction | High Availability | Human Feedback | Language Models

Mid-level Full Time

Santa Clara; Seattle

5d ago
Foundation AI Engineer (LLM) CAD 100K-110K

AI Feedback | Attention Mechanisms | Constitutional AI | Constitutional Safety Tuning | Data Curation

Annual health checkups | Healthcare insurance | Opportunity to collaborate with industry professionals | Performance bonuses | Preferential pricing for services

Mid-level Full Time

Hanoi, Vietnam

5d ago
Principal Research Engineer, Model Training & Post-Training USD 400K-550K

AI Feedback | Checkpointing | Cost Performance | Cost-performance tradeoffs | Data Decontamination

401k matching | Country specific visa support | Flexible work arrangements | Medical, dental, and vision options | Parental leave

Senior-level Full Time

Palo Alto, California, United States

21d ago
Agent Post-Training, Frontier Evals and Environments Research USD 295K-445K

AI Feedback | Data Pipelines | Evaluation | Experiment design | Grading

Mid-level Full Time

San Francisco

24d ago
Agent Post-Training, API & Power Users USD 295K-445K

AI Feedback | Agent systems | Computer use | Cost Optimization | Data Generation

Senior-level Full Time

San Francisco

24d ago
Agent Post-Training Research USD 295K-445K

AI Feedback | Agent systems | Calibrated Reasoning | Data Pipelines | Deep learning

Mid-level Full Time

San Francisco

26d ago
Staff Software Engineer, AI/ML USD 216K-271K

AI Feedback | Agentic AI | Data Pipelines | Direct Preference Optimization | Experimentation platforms

Conference reimbursement | Education reimbursement | Employee assistance program | Employee stock purchase program | Equity compensation

Senior-level Full Time

Seattle

27d ago
Senior Machine Learning Engineer, Computer Vision/VLM USD 204K-259K

AI Feedback | Computer Vision | Data Processing | Data Processing Pipelines | Deep learning

Senior-level Full Time

Mountain View, CA, USA; San Francisco, …

27d ago
Senior Solutions Architect, Generative AI Research USD 184K-287K

AI Agents | AI Feedback | Agent evaluation | Artificial Intelligence | Batching

Senior-level Full Time

US, FL, Remote, United States R

27d ago
Director, Reinforcement Learning & Agentic Post-Training EUR 151K-200K

AI Feedback | API Integration | Distributed Training | Environment Design | Evaluation

Executive-level Full Time

Paris, France

27d ago
Senior Software Engineer - Model Training & AI Evals INR 3500K-5000K

AI Feedback | Ablation Studies | Benchmarking | CI/CD | Data Generation

Senior-level Full Time

Remote (India) R

1mo ago
Sr. Staff, Machine Learning Engineer (Ads Engineering)

AI Feedback | Agent Orchestration | Agent systems | Agentic AI | Autonomous Reasoning

Senior-level Full Time

Seoul, South Korea

1mo ago
Head of Physical AI Programs USD 300K

AI Data | AI Feedback | AI data operations | Autonomous Systems | Benchmarking

Executive-level Full Time

East Palo Alto, CA, United States

1mo ago
Research Scientist, LLM Evaluation & Post-Training USD 150K-300K

AI Feedback | Alignment | Benchmarking | Context evaluation | Deep learning

Mid-level Full Time

Remote Work( USA), United States R

1mo ago
Senior AI Engineer USD 160K-170K

AI Feedback | AWS | Agent systems | CI/CD | Datadog

Senior-level Full Time

New York, New York, United States

1mo ago
Principal AI Research Scientist Post-Training · Alignment · Reinforcement Learning Autodesk AI Lab: London · San Francisco · Toronto · Remote (US/CA/EU USD 152K-269K

AI Feedback | Agentic Systems | Direct Preference Optimization | Distributed Training | Evaluation

Senior-level Full Time

AMER - United States - California … R

1mo ago