148 jobs for RLHF

Ai 院--多模态团队--多模态理解算法研究员-强化学习方向 CNY 240K-480K

DPO | Data Processing | Data pipeline | DeepSpeed | Distributed Training

Senior-level Full Time

北京 R

3h ago

Architect INR 2000K-5000K

Azure Cognitive | Azure Cognitive Search | Azure Form Recognizer | Azure OpenAI | Azure SQL

Senior-level Full Time

INDIA - NOIDA- BIRLASOFT OFFICE, IN

23h ago

AI Engineer A USD 30K-48K

API Integration | AWS | Agent Frameworks | Autogen | Azure

Application video interview | Competitive pay | Growth opportunities | Remote work

Mid-level Full Time

Columbia - Bogotá

1d ago

Machine Learning Engineer - LLMs USD 160K-250K

Active Learning | DPO | Data Augmentation | Data loaders | Document Classification

401k | Equity | Flexible vacation policy | Medical/dental/vision/life insurance | Relocation support

Senior-level Full Time

Los Angeles, CA

1d ago

Machine Learning Engineer (Content Ecology & Creator) -E-commerce Governance USD 145K-266K

C++ | DPO | GNN | Graph Neural Networks | Heterogeneous Graphs

Entry-level Full Time

Seattle, Washington, United States

1d ago

Software Engineer, Machine Learning Infrastructure GBP 28K-28K

APIs | AWS | Batch inference | Cost Optimization | DPO

Mid-level Full Time

London - The River Building HQ

1d ago

Digital & GenAI Analyst - Consulting INR 2500K-5000K

Agent systems | Agentic Systems | Benchmarking | Deep learning | Direct Preference Optimization

Senior-level Full Time

India

1d ago

Principal Machine Learning Engineer INR 4000K-5500K

AWS | Amazon SageMaker | Azure | Cloud platform | Deep learning

Senior-level Full Time

India - Hyderabad

1d ago

NLP AI Engineer USD 100K-150K

Adapters | DPO | Efficient Fine Tuning | Evaluation | FSDP

Senior-level Full Time

United States - Remote R

1d ago

Large Language Model Specialist USD 100K-150K

Adapter | Attention | Benchmarking | DPO | Data Curation

Senior-level Full Time

Tempe, AZ R

1d ago

LLM Engineer USD 100K-150K

Adapter modules | Attention Optimization | Benchmarking | DPO | Dataset Distillation

Senior-level Full Time

United States - Remote R

1d ago

LLM Engineer USD 100K-150K

Adapter Method | Attention Optimization | DPO | Distributed Training | Efficient Fine Tuning

Senior-level Full Time

United States - Remote R

1d ago

Machine Learning Engineer – RL USD 100K-150K

Actor-critic | Adversarial Testing | Constraint Enforcement | DPO | Deep learning

Senior-level Full Time

United States - Remote R

1d ago

GenAI Engineer CAD 135K-170K

A/B | A/B Testing | B testing | Cost Optimization | Experimentation

Career development opportunities

Senior-level Full Time

Canada - Remote R

2d ago

AI Development Lead USD 185K-235K

Agentic AI | CI/CD | Data Preparation | Deep learning | Ethical AI

401k matching | Employee assistance program | Flexible schedule | Health and wellness benefits | Hybrid work

Senior-level Full Time

McLean, Virginia, United States

2d ago

Lead Machine Learning Engineer (Foundation Models) SGD 162K-238K

C++ | DPO | Deep learning | DeepSpeed | Distributed Training

Birthday leave | Employee assistance programme | FlexWork | Flexible benefits | Medical insurance

Senior-level Full Time

Singapore, Singapore

4d ago

Senior Software Engineer AI/ML - Payments EUR 61K-86K

Agent Orchestration | Agentic Systems | Benchmarking | Context engineering | Ensemble Methods

Senior-level Full Time

Amsterdam

4d ago

Applied Machine Learning Researcher A AUD 130K-180K

DPO | Data Curation | Data labeling | Evaluation Frameworks | Experimentation

Fully remote | High ownership role | In-person gatherings | Opportunities for growth | Remote flexibility

Senior-level Full Time

Australia R

4d ago

顶尖应届-影像大模型算法工程师-相机 CNY 25K-37K

Agent architecture | Bokeh | C# | C++ | CMake

Entry-level Full Time

北京

4d ago

顶尖应届-影像大模型算法研究员-相机 CNY 25K-37K

Agents | Bokeh | C# | C++ | CMake

Entry-level Full Time

北京

4d ago

顶尖应届-影像大模型算法工程师-相机 CNY 25K-37K

Agent systems | Bokeh | C# | C++ | CMake

Entry-level Full Time

上海

4d ago

Generative AI Engineer USD 100K-150K

Adapter-Tuning | Benchmarking | DPO | Direct Preference Optimization | Distributed Training

Senior-level Full Time

United States - Remote R

4d ago

LLM Engineer USD 100K-150K

Adapter methods | Benchmarking | DPO | Distributed Training | Efficient Attention

Senior-level Full Time

United States - Remote R

4d ago

Machine Learning Engineer, Specialist INR 3242K-5000K

Agent Orchestration | Agentic AI | Attention | Containerization | DPO

Financial wellness programs | Hybrid work model | Personal wellness resources | Physical wellness benefits | Wellness support

Senior-level Full Time

Hyderabad, India

4d ago

Data Scientist - Agentic AI Systems - IFS Loops USD 140K-150K

Autogen | DPO | Deep learning | Embeddings | Evaluation

401k company match | Disability benefits | Flexible paid time off | Flexible spending accounts | Life insurance

Mid-level Full Time

Palo Alto, California, United States

5d ago

Senior Solutions Engineer, AI Data & Model Evaluation Solutions A BRL 230K-265K

Artificial Intelligence | Data Annotation | Data Operations | Human-in-the-loop | LLM Evaluation

Collaborative cross-functional environment | Exposure to Leading AI Organizations | Fully remote | Professional growth

Senior-level Full Time

Brazil R

5d ago

Artificial Intelligence Data Engineer INR 2200K-4500K

A/B | A/B Testing | AI Foundry | App Insights | App Service

Top "Places to Work" awards | Work-life balance flexibility

Mid-level Full Time

Mumbai, India

5d ago

Senior Machine Learning Engineer INR 4000K-7000K

Adapters | Benchmarking | DORA | DPO | Dataset Preparation

Mid-level Full Time

Noida, Uttar Pradesh, India

5d ago

Foundation Model Engineer USD 100K-150K

Adapter methods | Attention Mechanisms | Dataset curation | Direct Preference Optimization | Distributed Training

Senior-level Full Time

United States - Remote R

5d ago

【27届校招提前批】算法工程师 CNY 180K-360K

Agent collaboration | Asynchronous programming | Caching | Concurrency | Context engineering

None Full Time

上海

6d ago

Machine Learning Manager, Search & Knowledge Platforms USD 175K-301K

Cloud compute | Hallucination reduction | Inference Optimization | Information Retrieval | Language Models

Mid-level Full Time

Santa Clara; Seattle

6d ago

Machine Learning Manager, Search & Knowledge Platforms USD 175K-301K

AI Feedback | Hallucination reduction | High Availability | Human Feedback | Language Models

Mid-level Full Time

Santa Clara; Seattle

6d ago

Speech AI Senior Engineer AUD 16K-130K

Alignment | Data Augmentation | Data Pipelines | Data cleaning | Dataset annotation

Annual health checkups | Collaboration with industry experts | Performance bonuses | Preferential services pricing | Premium healthcare

Senior-level Full Time

Hanoi, Vietnam

6d ago

Senior AI Engineer USD 161K-249K

AWS | Agent systems | Agentic AI | Autogen | CI/CD

Discounted WGU tuition | Flexible paid time off | Flexible spending account | Health savings account | Medical/Dental/Vision

Senior-level Full Time

Raleigh Office, United States

6d ago

大模型算法研究员-MiMo CNY 500K-500K

Active Learning | C++ | Curriculum learning | Deep learning | Instruction Tuning

Entry-level Full Time

北京

7d ago

Agent 全栈研发工程师（前/后端）-MiMo CNY 144K-240K

API Design | Agent Framework | Agents SDK | Autogen | Automation Testing

Mid-level Full Time

北京

7d ago

Analista de Ciência de Dados em IA Pleno A BRL 83K-106K

AI Safety | Adversarial Testing | Bias detection | Chunking | Diffusion Models

Comprehensive Labor Benefits | Continuous learning | Flexible working hours | Inclusive, diverse culture | Long-term stability

Mid-level Full Time

Brazil R

7d ago

Senior Gen AI Software Engineer PLN 246K-385K

AI Evaluation | AWS Bedrock | AWS IAM | AWS Lambda | AWS SageMaker

Employee capital plans | Flexible working hours | Hybrid work model | Life insurance | Medical care

Senior-level Full Time

Krakow, Malopolskie, Poland

7d ago

AI Research Engineer A BRL 113K-151K

Ablation Studies | Active Learning | Adversarial Testing | Attention Mechanisms | BPE

Flexible work arrangements | Fully remote | Inclusive collaborative environment | Professional growth

Mid-level Full Time

Brazil R

7d ago

Applied Agentic AI Lead, Partner Co-Design USD 224K-431K

Agent systems | Compliance | Deep learning | Docker | Fine Tuning

Benefits | Equity

Senior-level Full Time

US, CA, Santa Clara R

7d ago

Senior Forward Deployed ML Engineer, Agents GBP 145K-200K

AWS | Azure | CI/CD | Cloud platform | Computer Vision

Equity | Flexible work options | Wellness benefits

Senior-level Full Time

London, England, United Kingdom

7d ago

Analista de Ciência de Dados em IA Pleno BRL 78K-160K

Adversarial Testing | Bias detection | Chunking | Embeddings | Fairness

CLT employment | Flexible schedule | Remote work

Senior-level Full Time

São Paulo

8d ago

Senior Manager, Data Quality & Evaluation A USD 82K-100K

Adjudication | Annotation Guidelines | Annotation platforms | Audio evaluation | Calibration

Fully remote | International team collaboration | Professional growth opportunities

Senior-level Full Time

Saudi Arabia R

8d ago

Senior Manager, Data Quality & Evaluation A TRY 960K-1132K

Adjudication | Annotation | Audio evaluation | Calibration | Data Quality

Fully remote | International team collaboration | Operational excellence focus | Professional growth opportunities

Senior-level Full Time

Turkey R

8d ago

Senior Manager, Data Quality & Evaluation A ZAR 660K-730K

AI | Adjudication | Annotation Guidelines | Audio evaluation | Calibration

Fully remote | International team collaboration | Professional growth opportunities

Senior-level Full Time

South Africa R

8d ago

Senior Manager, Data Quality & Evaluation A MXN 789K-1100K

Adjudication | Annotation | Audio Review | Calibration | Cause analysis

Fully remote | International team collaboration | Professional growth

Senior-level Full Time

Mexico R

8d ago

Senior Manager, Data Quality & Evaluation A RON 258K-288K

Adjudication | Annotation quality | Audio evaluation | Calibration | Cause analysis

Continuous improvement culture | Flexible work location | Fully remote | Innovation-focused workplace | International team collaboration

Senior-level Full Time

Romania R

8d ago

Senior Manager, Data Quality & Evaluation A EUR 75K-108K

Adjudication | Annotation Guidelines | Audio evaluation | Calibration | Cause analysis

Fully remote | Innovation-focused workplace | Professional growth

Senior-level Full Time

Italy R

8d ago

Senior Manager, Data Quality & Evaluation A EUR 75K-120K

Adjudication | Annotation Guidelines | Audio evaluation | Calibration | Cause analysis

Fully remote | International team collaboration | Leadership influence on quality strategy | Professional growth opportunities

Senior-level Full Time

Portugal R

8d ago

Senior Manager, Data Quality & Evaluation A EUR 75K-120K

Adjudication | Annotation Guidelines | Annotation platforms | Audio evaluation | Calibration

Fully remote | International team collaboration | Professional growth opportunities

Senior-level Full Time

Netherlands R

8d ago

Find jobs in AI/ML, Data Science and Big Data