aijobs.net

Sign in

Find jobs in AI/ML, Data Science and Big Data

2 results for Generalized Reward Policy Optimization (Skill/Tech stack)

Machine Learning Research Engineer | Kilby Labs USD 137K-238K

C# | C++ | Deep learning | Direct Preference Optimization | Embeddings

Career development | Employee wellbeing

Mid-level Full Time

United States

13d ago
Research Scientist, LLM Evaluation & Post-Training USD 150K-300K

AI Feedback | Alignment | Benchmarking | Context evaluation | Deep learning

Mid-level Full Time

Remote Work( USA), United States R

1mo ago