25 jobs for Direct Preference Optimization

Digital & GenAI Analyst - Consulting INR 2500K-5000K

Agent systems | Agentic Systems | Benchmarking | Deep learning | Direct Preference Optimization

Senior-level Full Time

India

1d ago

Generative AI Engineer USD 100K-150K

Adapter-Tuning | Benchmarking | DPO | Direct Preference Optimization | Distributed Training

Senior-level Full Time

United States - Remote R

4d ago

Foundation Model Engineer USD 100K-150K

Adapter methods | Attention Mechanisms | Dataset curation | Direct Preference Optimization | Distributed Training

Senior-level Full Time

United States - Remote R

5d ago

Foundation AI Engineer (LLM) CAD 100K-110K

AI Feedback | Attention Mechanisms | Constitutional AI | Constitutional Safety Tuning | Data Curation

Annual health checkups | Healthcare insurance | Opportunity to collaborate with industry professionals | Performance bonuses | Preferential pricing for services

Mid-level Full Time

Hanoi, Vietnam

5d ago

AI Research Engineer A BRL 113K-151K

Ablation Studies | Active Learning | Adversarial Testing | Attention Mechanisms | BPE

Flexible work arrangements | Fully remote | Inclusive collaborative environment | Professional growth

Mid-level Full Time

Brazil R

7d ago

Machine Learning Research Engineer (Foundational Research) GBP 80K-127K

CI/CD | ClearML | Containerization | Continuous integration | Curriculum learning

Flexible work arrangement | Hybrid work model | Learning opportunities | On-the-job coaching | Work-life balance

Mid-level Full Time

United Kingdom, London R

7d ago

Machine Learning Research Engineer | Kilby Labs USD 137K-238K

C# | C++ | Deep learning | Direct Preference Optimization | Embeddings

Career development | Employee wellbeing

Mid-level Full Time

United States

7d ago

Senior AI Engineer - Fury Team USD 200K-400K

Agent coordination | Benchmarking | Data Curation | Deep learning | Direct Preference Optimization

Catered lunch daily | Company holidays | EV charging | Equity | Fully stocked kitchen

Senior-level Full Time

Remote R

12d ago

Applied Reinforcement Learning Engineer USD 150K-300K

A2C | A3C | Actor-critic | Agent systems | BCQ

Collaborate with industry leaders | Equal opportunity employer | Hybrid remote work | Research publications support

Mid-level Full Time

Remote Work( USA), United States R

13d ago

AI Engineer - Enterprise (Remote, USA - San Mateo, CA) A USD 150K-200K

AWS | Azure | Benchmarking | Containerization | Direct Preference Optimization

Customer facing technical work | Remote work

Senior-level Full Time

San Mateo, California, United States R

13d ago

AI Researcher

Big Data | Chain-of-Thought | Clustering | Cost Optimization | Data Classification

Mid-level Full Time

Tel Aviv-Yafo, Tel Aviv District, IL

14d ago

Applied Machine Learning Scientist Manager, NanoBanana, Gemini, Veo USD 236K-330K

Data Analysis | Direct Preference Optimization | Fine Tuning | LLM safety | Language Models

Bonus target | Equity | Health insurance | Paid time off | Retirement plans

Senior-level Full Time

Sunnyvale, CA, USA

18d ago

Principal Research Engineer, Model Training & Post-Training USD 400K-550K

AI Feedback | Checkpointing | Cost Performance | Cost-performance tradeoffs | Data Decontamination

401k matching | Country specific visa support | Flexible work arrangements | Medical, dental, and vision options | Parental leave

Senior-level Full Time

Palo Alto, California, United States

21d ago

Junior Foundation AI Engineer EUR 30K

AWS | Accelerate | Azure | CUDA | Cloud Computing

Corporate welfare | Health insurance | Meal vouchers | Smart working | Training

Entry-level Full Time

Milano (Bassi), Italy

26d ago

Staff Software Engineer, AI/ML USD 216K-271K

AI Feedback | Agentic AI | Data Pipelines | Direct Preference Optimization | Experimentation platforms

Conference reimbursement | Education reimbursement | Employee assistance program | Employee stock purchase program | Equity compensation

Senior-level Full Time

Seattle

27d ago

Senior Solutions Architect, Generative AI Research USD 184K-287K

AI Agents | AI Feedback | Agent evaluation | Artificial Intelligence | Batching

Senior-level Full Time

US, FL, Remote, United States R

27d ago

Senior Applied Scientist USD 142K-270K

Data Pipelines | Diffusion Models | Direct Preference Optimization | Evaluation metrics | Fine Tuning

Senior-level Full Time

Seattle, United States R

27d ago

Senior Applied Scientist, Alexa AI USD 167K-227K

Agentic Architectures | Automated Training | Automated training pipelines | C++ | DPO

Senior-level Full Time

Turin, Piedmont, ITA

29d ago

Senior Software Engineer - Model Training & AI Evals INR 3500K-5000K

AI Feedback | Ablation Studies | Benchmarking | CI/CD | Data Generation

Senior-level Full Time

Remote (India) R

1mo ago

Staff AI research scientist USD 234K-296K

Adversarial Training | Agentic Systems | Benchmark design | Data Curation | Data Generation

Company holidays | Company offsites | Dental insurance | Dependent FSA | Fertility support

Senior-level Full Time

San Francisco, CA

1mo ago

Director, Applied Science, Alexa for Shopping (Rufus) USD 262K-350K

Agent systems | Deep Deterministic Policy Gradient | Direct Preference Optimization | Distillation | Experimentation

401k matching | Dental insurance | Employee assistance program | Health insurance | Mental health support

Executive-level Full Time

Seattle, Washington, USA

1mo ago

Research Scientist, LLM Evaluation & Post-Training USD 150K-300K

AI Feedback | Alignment | Benchmarking | Context evaluation | Deep learning

Mid-level Full Time

Remote Work( USA), United States R

1mo ago

Senior Machine Learning Engineer , AI Platform USD 150K-210K

Artificial Intelligence | Batch Processing | Data Analysis | Data Pipelines | Data Privacy

Senior-level Full Time

Boston, MA

1mo ago

Principal AI Research Scientist Post-Training · Alignment · Reinforcement Learning Autodesk AI Lab: London · San Francisco · Toronto · Remote (US/CA/EU USD 152K-269K

AI Feedback | Agentic Systems | Direct Preference Optimization | Distributed Training | Evaluation

Senior-level Full Time

AMER - United States - California … R

1mo ago

Tech Lead, Machine Learning Engineer - Global E-Commerce (Conversational AI) SGD 150K-191K

Data Curation | Deep learning | DeepSpeed | Direct Preference Optimization | Evaluation

Senior-level Full Time

Singapore, Singapore

1mo ago

Find jobs in AI/ML, Data Science and Big Data