aijobs.net

Sign in

Find jobs in AI/ML, Data Science and Big Data

1 result for Group Relative Policy Optimization (Skill/Tech stack)

Principal Research Engineer, Model Training & Post-Training USD 400K-550K

AI Feedback | Checkpointing | Cost Performance | Cost-performance tradeoffs | Data Decontamination

401k matching | Country specific visa support | Flexible work arrangements | Medical, dental, and vision options | Parental leave

Senior-level Full Time

Palo Alto, California, United States

21d ago