Data Engineer

Madrid, MD, Spain

⚠️ We'll shut down after Aug 1st - try foo🦍 for all jobs in tech ⚠️

Applications have closed

ALDIA

As an International consultancy, ALDIA offers an extensive range of qualified solutions within engineering and IT.

Posted 8 months ago

ALDIA es una multinacional con sede central en Londres y con presencia en algunos de los principales países de la Unión Europea (Inglaterra, Suecia, España, Francia y Alemania). Nos especializamos en la consultoría tecnológica y de ingeniería. Nuestro core de actividad se centra en las áreas claves de las industrias de Seguros, Finanzas, Comunicación, Infraestructura, Multimedia, Entretenimiento, Automoción, Ferroviario, Turbinas Eólicas y Oil & Gas.

ALDIA trabaja con su propio grupo de consultores para mejorar la calidad, crear estabilidad, minimizar riesgos y aportar soluciones tecnológicas e innovadoras formando parte de todas las fases del ciclo completo de vida de los procesos incorporando la metodología ágil en cada uno de ellos.

En la actualidad, estamos buscando un/a Data Engineer para que se incorpore a nuestro equipo de consultores de forma indefinida y que trabaje directamente con nuestro cliente editorial de investigaciones científicas.

¿Qué buscamos?

Un/a Data Engineer para realizar la siguientes funciones:

Comprender y promover los mejores marcos y soluciones de datos, estándares técnicos y tecnologías clave, para respaldar de manera efectiva los requisitos comerciales existentes y futuros.
Comprender los requisitos funcionales para definir los mejores modelos de datos y flujos de datos entre las aplicaciones, servicios, almacenamientos de datos y mecanismos de sincronización.
Apoyar a los diferentes equipos de desarrollo de SW en el modelado, diseño, construcción, evolución y desmantelamiento de sus aplicaciones data-intensive y modelos de datos.
Integrar, transformar y consolidar datos de varios sistemas de datos estructurados y no estructurados en estructuras adecuadas para crear soluciones de análisis.
Procurar que la aplicaciones/procesos de datos sean escalables, fiables, seguros, extensibles, trazables, disponibles y gestionables.
Diseñar, implementar, monitorear y optimizar nuestras plataformas de datos.
Trabajar en estrecha colaboración con los arquitectos de TI para proporcionar soluciones de datos generales consistentes y confiables para todo el ecosistema de aplicaciones.
Crear una asociación con equipos Scrum y POs, entendiendo la aplicación y los requisitos comerciales, y ayudándolos a comprender los datos a través de la exploración, la construcción y el mantenimiento de pipelines seguras para el procesamiento de datos.
Colaborar estrechamente con el equipo de Data Science y Machine Learning para mejorar el rendimiento de nuestras pipelines de aprendizaje automático.
Crear modelos y prototipos que validen tus ideas, antes de llevarlas al equipo de desarrollo.
Crear y mantener actualizados los documentos que describen la estrategia de datos de su dominio de aplicaciones, así como todas las pautas y estándares relevantes.
Comprender los requisitos funcionales para definir los mejores modelos de datos y flujos de datos entre las aplicaciones, servicios, almacenamientos de datos y mecanismos de sincronización.

Requisitos

• SQL, Python o Scala.
• Spark y PySpark.
• Conocimientos del procesamiento paralelo y los patrones de arquitectura de datos.
• Conocimientos sólidos sobre DataBricks, DataFactory, SQL Server, MongoDB.
• Se valora ElasticSearch y DeltaLake.
• Experiencia en la construcción de Data Lakes
• Experiencia en procesamiento de datos: ingesta y transformación de datos, procesamiento batch, procesamiento de transmisión de datos, procesamiento distribuido, monitoreo, optimización, registro.
• Experiencia en la resolución de problemas de procesamiento y almacenamiento de datos.
• Conocimiento de los estándares de seguridad de datos.
• Conocimiento del diseño de la capa de servidor: esquema en estrella, dimensiones, carga incremental, tiendas.
• Conocimiento de las estructuras físicas de almacenamiento de datos: compresión, particionamiento, fragmentación, redundancia, distribuciones, archivado.

Ventajas