aijobs.net

Sign in

Find jobs in AI/ML, Data Science and Big Data

2 results for Sparse Reward (Skill/Tech stack)

大语言模型后训练/Agentic算法工程师 CNY 180K-360K

Agentic RL | DAPO | Distributed Training | Evaluation | Function Calling

Entry-level Full Time

上海、北京

10h ago
AI Research Engineer - RL Manipulation CHF 123K-176K

Credit Assignment | Domain Randomization | Exploration | Imitation Learning | Model-based reinforcement learning

Bias for action | Collaborative team | Independent ownership

Senior-level Full Time

Zürich, Zurich, Switzerland

1mo ago