Data Engineer
Madrid, MD, Spain
ALDIA
As an International consultancy, ALDIA offers an extensive range of qualified solutions within engineering and IT.ALDIA es una multinacional con sede central en Londres y con presencia en algunos de los principales países de la Unión Europea (Inglaterra, Suecia, España, Francia y Alemania). Nos especializamos en la consultoría tecnológica y de ingeniería. Nuestro core de actividad se centra en las áreas claves de las industrias de Seguros, Finanzas, Comunicación, Infraestructura, Multimedia, Entretenimiento, Automoción, Ferroviario, Turbinas Eólicas y Oil & Gas.
ALDIA trabaja con su propio grupo de consultores para mejorar la calidad, crear estabilidad, minimizar riesgos y aportar soluciones tecnológicas e innovadoras formando parte de todas las fases del ciclo completo de vida de los procesos incorporando la metodología ágil en cada uno de ellos.
En la actualidad, estamos buscando un/a Data Engineer para que se incorpore a nuestro equipo de consultores de forma indefinida y que trabaje directamente con nuestro cliente editorial de investigaciones científicas.
¿Qué buscamos?
Un/a Data Engineer para realizar la siguientes funciones:
- Comprender y promover los mejores marcos y soluciones de datos, estándares técnicos y tecnologías clave, para respaldar de manera efectiva los requisitos comerciales existentes y futuros.
- Comprender los requisitos funcionales para definir los mejores modelos de datos y flujos de datos entre las aplicaciones, servicios, almacenamientos de datos y mecanismos de sincronización.
- Apoyar a los diferentes equipos de desarrollo de SW en el modelado, diseño, construcción, evolución y desmantelamiento de sus aplicaciones data-intensive y modelos de datos.
- Integrar, transformar y consolidar datos de varios sistemas de datos estructurados y no estructurados en estructuras adecuadas para crear soluciones de análisis.
- Procurar que la aplicaciones/procesos de datos sean escalables, fiables, seguros, extensibles, trazables, disponibles y gestionables.
- Diseñar, implementar, monitorear y optimizar nuestras plataformas de datos.
- Trabajar en estrecha colaboración con los arquitectos de TI para proporcionar soluciones de datos generales consistentes y confiables para todo el ecosistema de aplicaciones.
- Crear una asociación con equipos Scrum y POs, entendiendo la aplicación y los requisitos comerciales, y ayudándolos a comprender los datos a través de la exploración, la construcción y el mantenimiento de pipelines seguras para el procesamiento de datos.
- Colaborar estrechamente con el equipo de Data Science y Machine Learning para mejorar el rendimiento de nuestras pipelines de aprendizaje automático.
- Crear modelos y prototipos que validen tus ideas, antes de llevarlas al equipo de desarrollo.
- Crear y mantener actualizados los documentos que describen la estrategia de datos de su dominio de aplicaciones, así como todas las pautas y estándares relevantes.
- Comprender los requisitos funcionales para definir los mejores modelos de datos y flujos de datos entre las aplicaciones, servicios, almacenamientos de datos y mecanismos de sincronización.
Requisitos
• SQL, Python o Scala.
• Spark y PySpark.
• Conocimientos del procesamiento paralelo y los patrones de arquitectura de datos.
• Conocimientos sólidos sobre DataBricks, DataFactory, SQL Server, MongoDB.
• Se valora ElasticSearch y DeltaLake.
• Experiencia en la construcción de Data Lakes
• Experiencia en procesamiento de datos: ingesta y transformación de datos, procesamiento batch, procesamiento de transmisión de datos, procesamiento distribuido, monitoreo, optimización, registro.
• Experiencia en la resolución de problemas de procesamiento y almacenamiento de datos.
• Conocimiento de los estándares de seguridad de datos.
• Conocimiento del diseño de la capa de servidor: esquema en estrella, dimensiones, carga incremental, tiendas.
• Conocimiento de las estructuras físicas de almacenamiento de datos: compresión, particionamiento, fragmentación, redundancia, distribuciones, archivado.
Ventajas
- Contrato Indefinido
- Plan de Carrera
* Salary range is an estimate based on our AI, ML, Data Science Salary Index 💰
Tags: Databricks Elasticsearch Machine Learning MongoDB Pipelines PySpark Python Scala Scrum Spark SQL
More jobs like this
Explore more career opportunities
Find even more open roles below ordered by popularity of job title or skills/products/technologies used.