Data Engineer - Databricks

Mexico, Mexico

NEORIS

We harness the power of emerging technologies and digital solutions to enable companies to disrupt their industries

View all jobs at NEORIS

Apply now Apply later

NEORIS es un acelerador Digital que ayuda a las compañías a entrar en el futuro, teniendo 20 años de experiencia como Socios Digitales de algunas de las mayores compañías del mundo. Somos más de 4,000 profesionales en 11 países, con nuestra cultura multicultural de startup en donde cultivamos innovación, aprendizaje continuo para crear soluciones de alto valor para nuestros clientes.

Estamos en búsqueda de Data Engineer - Databricks

Principales responsabilidades:

1. Diseño y Desarrollo de Pipelines de Datos: Construir, optimizar y mantener pipelines de datos escalables para procesar y transformar grandes volúmenes de datos.
2. Integración de Datos: Trabajar en la ingesta y unificación de datos desde múltiples fuentes, estructuradas y no estructuradas, integrándolas en un sistema de almacenamiento centralizado.
3. Optimización de Procesamiento de Datos: Mejorar la eficiencia de pipelines de datos utilizando mejores prácticas en Spark y optimizaciones propias de Databricks.
4. Modelado de Datos: Diseñar modelos de datos eficientes y adecuados para diferentes necesidades de análisis, optimizando consultas en lagos y warehouses de datos.
5. Implementación de ETL/ELT: Definir y desarrollar procesos ETL (extracción, transformación y carga) y ELT (extracción, carga y transformación) para transformar datos en insights prácticos.
6. Colaboración con Científicos de Datos y Analistas: Proveer y optimizar datasets para proyectos de Machine Learning, Business Intelligence y Analytics.
7. Seguridad y Gobernanza de Datos: Garantizar el cumplimiento de normas de seguridad, privacidad y gobernanza de datos en colaboración con equipos de compliance y TI.


Habilidades y Conocimientos Técnicos
1. Databricks: Experiencia en el uso avanzado de Databricks, incluidas las funcionalidades de notebooks, configuración de clústeres, optimización de jobs y conectividad con otros servicios.
2. Apache Spark: Dominio de Spark para procesar grandes volúmenes de datos y optimización de tareas en tiempo real.
3. SQL y Bases de Datos: Fuerte conocimiento de SQL para consultas, transformación y análisis de datos en bases de datos relacionales y no relacionales.
4. Lenguajes de Programación: Dominio de Python, especialmente para escribir scripts en Spark y manejar APIs de datos.
5. Data Lake y Data Warehouse: Experiencia en diseño y administración de lagos de datos (por ejemplo, Delta Lake) y warehouses (como Azure Synapse o Amazon Redshift).
6. Herramientas de ETL/ELT: Conocimiento en herramientas de orquestación como Apache Airflow, así como tecnologías específicas de ETL en la nube.
7. Herramientas en la Nube: Experiencia en plataformas de nube como AWS, Azure o Google Cloud, especialmente en servicios de almacenamiento, procesamiento y bases de datos.
8. Optimización y Performance Tuning: Conocimientos de técnicas para mejorar el rendimiento en el procesamiento de datos y configuración de recursos en Databricks.
Competencias Adicionales
• Pensamiento Analítico.
• Resolución de Problemas.
• Comunicación y Colaboración.

Modalidad: Remota

Inglés: Intermedio a nivel conversacional

Ofrecemos:

 

  • Esquema 100% nominal 
  • Prestaciones de Ley 
  • Vales de despensa 
  • Beneficios adicionales 
  • Programa Bienestar 
  • Plan de Desarrollo Profesional 
  • Colaboración multicultural 

 

Te invitamos a conocernos en http://www.neoris.com, Facebook, LinkedIn, Twitter o Instagram: @NEORIS.

Julieta Reyes

#LI-JR2

 

 

Apply now Apply later

* Salary range is an estimate based on our AI, ML, Data Science Salary Index 💰

Job stats:  0  0  0
Category: Engineering Jobs

Tags: Airflow APIs AWS Azure Business Intelligence Databricks Data warehouse ELT ETL GCP Google Cloud Machine Learning Pipelines Python Redshift Spark SQL

Region: North America
Country: Mexico

More jobs like this