Machine Learning Engineer, Inference & Serving (Speech LLM) - San Francisco

San Francisco, CA

USD 180K-270K Mid-level Full Time

@ P...

Apply Save

Found 25d ago

Tasks

Apply model compression and quantization
Build inference engines for large language models and speech models
Collaborate with training and backend teams
Deploy GPU accelerated inference pipelines
Implement continuous batching
Integrate real time audio streaming
Manage KV cache and stateful connections
Optimize latency and throughput
Support distributed multi GPU inference with autoscaling

Perks/Benefits

Skills/Tech-stack

Education

N/A

Apply Save

Language: en Views:

4 Clicks:

0 Saves: 0

Related jobs

AI Engineer USD 109K-140K

Agent Orchestration | Computer Vision | Data Validation | Data extraction | Document Classification

Mid-level Full Time

Morristown, NJ, United States

6h ago
Sr. DevOps Engineer (Storage Platform)-Remote A USD 100K-150K

Alerting | Ansible | Bash | CI/CD | Ceph

Remote work

Senior-level Full Time

United States, United States R

8h ago
Sr. Site Reliability Engineer (Storage Platforms)-Remote A USD 100K-150K

Ansible | Bash | CI/CD | CentOS | Ceph

Contract-to-hire | No sponsorship | Remote work

Senior-level Full Time

United States, United States R

8h ago
AI Intern USD 50K-58K

Access Control | Artificial Intelligence | Cybersecurity | Data Privacy | Help desk

Entry-level Internship

York, United States

9h ago
Machine Learning Engineer USD 131K-178K

AWS | Cassandra | Convolutional Neural Networks | Data Lakes | Data Pipelines

Mid-level Full Time

Remote, NY, US R

9h ago
Senior Data Management Professional - Data Engineering (Shared Infrastructure) USD 110K-190K

Amazon S3 | Data Engineering | Data Modeling | Data Pipelines | Data Quality

Senior-level Full Time

New York

11h ago
Senior Data Management Professional - Data Engineering (Shared Infrastructure) USD 110K-190K

Amazon S3 | Automation | Data Engineering | Data Modeling | Data Pipelines

401k match | Dental insurance | Life insurance | Long-term disability | Medical insurance

Senior-level Full Time

Princeton

11h ago
Senior Databricks Forward Deployed Engineer - GPS USD 119K-198K

API Integration | AWS | Airflow | Azure | CI/CD

Travel

Senior-level Full Time

Arlington/Rosslyn, Virginia, United States; Atlanta, Georgia, …

11h ago
GenAI Engineer USD 73K-105K

AWS Bedrock | Amazon SageMaker | Amazon Web Services | Data integration | Fine Tuning

Competitive benefits package | Onsite work | Travel 0 to 25 percent

Entry-level Full Time

Arlington/Rosslyn, Virginia, United States

11h ago
Lead AI and Data Solutions Engineer II USD 137K-229K

Amazon Web Services | Apache Spark | Application Programming | Application Programming Interfaces | Cloud Computing

Senior-level Full Time

Sacramento, California, United States; Tempe, Arizona, …

11h ago
Databricks Senior Consultant USD 113K-188K

AWS | Azure | Business Intelligence | Cloud platform | Data Engineering

Senior-level Full Time

Arlington/Rosslyn, Virginia, United States; Sacramento, California, …

11h ago
TikTok Shop - E-commerce Anti-Fraud Data Scientist USD 156K-296K

A/B | A/B Testing | Analytics | B testing | Big Data

Mid-level Full Time

Seattle, Washington, United States

11h ago
Software Engineer, Systems ML - SW/HW Co-design USD 117K-173K

AI infrastructure | Bias Mitigation | C# | C++ | Co-design

Senior-level Full Time

Sunnyvale, CA | Redmond, WA

12h ago
Software Engineer, Machine Learning USD 213K-293K

API Design | Agent Orchestration | Artificial Intelligence | Bias Mitigation | C++

Senior-level Full Time

Sunnyvale, CA | Remote, US | … R

12h ago
Software Engineer III, Embedded Systems, Hearables Audio software USD 147K-211K

Acoustics | Algorithm Integration | Audio Software | Bring-up | C++

Senior-level Full Time

Mountain View, CA, USA

12h ago
Senior Software Engineer, Generative AI, Google Ads USD 174K-252K

Computer Vision | Data Processing | Debugging | GenAI | Information Retrieval

Senior-level Full Time

Mountain View, CA, USA

12h ago
Staff Software Engineer, AI/ML Performance USD 207K-300K

Algorithms | Auto sharding | C++ | Code debugging | Code generation

Senior-level Full Time

Sunnyvale, CA, USA

12h ago
Software Engineer III, AI/ML, Search Intelligence Freshness USD 147K-211K

C++ | Data Processing | Debugging | Deep learning | Few-Shot Learning

Senior-level Full Time

Mountain View, CA, USA

12h ago
Senior Software Engineer, Generative AI USD 174K-252K

Agent-based | Agent-based systems | Cloud platform | Data Structures | Data Structures and Algorithms

Senior-level Full Time

Sunnyvale, CA, USA

12h ago
Software Engineer III, Generative AI, Payments Risk USD 147K-211K

Agent systems | Algorithms | Analytics | Big Data | Computer Vision

Senior-level Full Time

Mountain View, CA, USA

12h ago
Software Engineer III, Infrastructure, Infra Spanner USD 147K-211K

C++ | Concurrency | Consensus Algorithms | Data Corruption | Data corruption diagnosis

Senior-level Full Time

Sunnyvale, CA, USA

12h ago
Senior Software Engineer, Recommendations, Rankings, Predictions, Search Discover USD 174K-252K

C++ | Data Analysis | Data Processing | Deep learning | Embeddings

Senior-level Full Time

Mountain View, CA, USA

12h ago
Tech Lead Manager, Google Analytics Gold Processing Backend USD 207K-300K

Apache Flume | C++ | Data Modeling | Data Processing | Data Structures

Senior-level Full Time

Mountain View, CA, USA

12h ago
Senior Software Engineer - Site Controller, Energy Storage USD 180K-237K

CAN | DNP3 | Data Visualization | Docker | Firmware Over The Air

Senior-level Full Time

San Francisco, California, United States

16h ago
Machine Learning Research Engineer USD 146K-222K

Data Analysis | Data Visualization | Deep learning | GPU Programming | Graph Neural Networks

401k | Education reimbursement program | Flexible benefits package | Flexible schedule | Relocation assistance

Mid-level Full Time

Livermore, CA, United States

19h ago

Machine Learning Engineer, Inference & Serving (Speech LLM) - San Francisco

Tasks

Perks/Benefits

Skills/Tech-stack

Education

Roles

Regions

Countries

States

Cities

Related jobs