Find jobs in AI/ML, Data Science and Big Data

17 results for Direct Preference Optimization (Skill/Tech stack)

Senior Data Scientist - (Query Intelligence, Global Discovery) EUR 67K-80K

AWS | Agent Orchestration | Autogen | Autonomous Agents | Direct Preference Optimization

Bicycle subsidy | Corporate discounts | Corporate pension plan | Digital meal vouchers | Educational budget

Senior-level Full Time

Berlin, Germany

13h ago
Staff Software Engineer, Generative AI, Core ML USD 207K-300K

AI Feedback | Computer Vision | Data Processing | Deep learning | Digital Twin

Senior-level Full Time

Mountain View, CA, USA

1d ago
Data Scientist Associate INR 1068K-1496K

API Development | AWS | Agentic AI | Apache Spark | Azure

Mid-level Full Time

Bengaluru, Karnataka, India

1d ago
Machine Learning Engineer (Post-Training) EUR 57K-84K

AWS | Data Pipelines | Data-parallel | DeepSpeed | Direct Preference Optimization

Senior-level Full Time

Paris, France

1d ago
Senior Applied Scientist USD 180K-230K

Direct Preference Optimization | Distributed Training | Human Feedback | LLM-as-a-Judge | Language Models

Senior-level Full Time

Palo Alto

2d ago
LLM Engineer (Reinforcement Learning)

DDP | Deep learning | Direct Preference Optimization | Distributed Training | Docker

Senior-level Full Time

Pangyo (Software Dream Center), South Korea

8d ago
Senior Applied Scientist USD 142K-270K

Diffusion Models | Direct Preference Optimization | Fine Tuning | Human Feedback | Inference acceleration

Senior-level Full Time

Seattle, United States

8d ago
大模型应用算法工程师/专家 CNY 240K-480K

C++ | Computer Vision | Deep learning | Direct Preference Optimization | Human Computer Dialogue

Senior-level Full Time

上海、北京

9d ago
Senior Applied AI Manager USD 170K-234K

Agent systems | Agentic Systems | Curriculum learning | Data Deduplication | Data mixing

Senior-level Full Time

San Mateo, CA

9d ago
Agent RL Infra Engineer USD 224K-356K

AI Feedback | Active Learning | Cluster management | Continuous Learning | Data Curation

Senior-level Full Time

US, CA, Santa Clara, United States

11d ago
Applied Reinforcement Learning Engineer USD 150K-160K

Actor-critic | Agent systems | BCQ | Behavioral cloning | CQL

Equal opportunity employer | Hybrid remote work | Research publications opportunity

Mid-level Full Time

Remote Work( USA), United States R

14d ago
校招-Ai研究科学家-大语言模型/视觉语言模型算法与后训练（博士优先） CNY 500K-500K

Adapters | Direct Preference Optimization | Fine Tuning | Flax | Function design

None Full Time

上海

20d ago
Senior Data Scientist - (Query Intelligence, Global Discovery) EUR 64K-85K

Agent Orchestration | Amazon Web Services | Auto Planning | Autogen | Direct Preference Optimization

Bicycle subsidy | Corporate discounts | Corporate pension plan | Digital meal vouchers | Educational budget

Senior-level Full Time

Berlin, Germany

21d ago
Research Scientist – LTX Model Quality

Benchmark design | Computer Vision | Deep learning | Direct Preference Optimization | Evaluation metrics

Car to go subscriptions | Free parking | Learning opportunities | On site bakery | On-site restaurants

Mid-level Full Time

Jerusalem

21d ago
Staff AI Engineer, Model Post-Training and Alignment USD 196K-268K

Benchmarking | Deep learning | Direct Preference Optimization | Fine Tuning | Generalized Reward Policy Optimization

Company events | Comprehensive healthcare | Education subsidy | Learning and development programs | Meal allowances

Senior-level Full Time

APAC

21d ago
Senior ML Engineer – Distributed RL & Post-Training Infrastructure A USD 204K-350K

Automated testing | Cryptography | Direct Preference Optimization | Distributed Systems | Docker

Senior-level Full Time

Remote R

22d ago
Senior AI Research Scientist (6240) USD 170K-270K

Adversarial Learning | Attention Networks | Dash | Data Preprocessing | Data Wrangling

Hybrid work schedule | Professional development programs | Travel for training and team building

Senior-level Full Time

San Jose, CA, US

1mo ago