Ingénieur Observabilité / SRE - H/F

Toulouse, Occitanie, France

Devoteam

Transform your bussines with Devoteam, the AI-driven tech consulting. Become a leading company embracing AI for sustainable value.

View all jobs at Devoteam

Apply now Apply later

Description de l'entreprise

Avec près de 11 000 collaborateurs à travers le monde, nous accompagnons les entreprises dans leur transformation numérique. Nous imaginons et concrétisons leurs ambitions grâce aux possibilités infinies des plateformes digitales, pour faire évoluer leur culture et leur mode de travail, et créer de la valeur dans leurs organisations.

Présent dans 25 pays d’Europe et du Moyen-Orient et fort de 25 ans d’expérience, nous mettons la “Technologie au service de l’Homme” afin de construire un monde plus humain et plus durable.

Travailler chez Devoteam, c’est : 

  • Travailler aux côtés de partenaires comme Google, Microsoft, AWS ou Salesforce dont nous implémentons les solutions chez nos clients ;
  • Evoluer dans un groupe international qui vous accompagne dans le développement de votre carrière avec des parcours de formation et de certification adaptés. 
  • Rejoindre une équipe spécialisée, accompagné par un manager de proximité qui saura vous guider dans vos choix et favoriser les échanges avec vos pairs, que ce soit lors d'événements techniques ou conviviaux.
  • Grandir dans une entreprise qui challenge ses équipes en étant agile et ambitieuse, s’adaptant pour permettre les succès individuels et collectifs.

Description du poste

Vos objectifs :

  • Assurer la fiabilité, la performance et l'évolutivité des systèmes de production.
  • Collaborer étroitement avec les équipes de développement et d'opérations pour mettre en œuvre les meilleures pratiques SRE et réduire le "toil" (travail manuel répétitif).

Vos missions : 

Fiabilité des Systèmes:

  • Surveiller et gérer la fiabilité des services et applications en production.
  • Définir et maintenir les indicateurs clés de performance (KPIs) et les objectifs de niveau de service (SLOs).
  • Répondre aux incidents, mener des analyses de causes profondes (RCA) et rédiger des post-mortems.

Automatisation et Infrastructure:

  • Automatiser les tâches manuelles et répétitives pour réduire le "toil".
  • Développer et maintenir l'infrastructure en tant que code (IaC) avec des outils comme Terraform et Ansible.
  • Mettre en œuvre et gérer des pipelines CI/CD et des pratiques GitOps.

Observabilité et Surveillance:

  • Mettre en place des outils de surveillance et d'observabilité (par exemple, Prometheus, Grafana, ELK, Datadog).
  • Surveiller les "quatre signaux d'or" : latence, trafic, erreurs et saturation.
  • Configurer des alertes et des notifications pour les incidents potentiels.

Collaboration et Communication:

  • Travailler en étroite collaboration avec les équipes de développement et d'opérations.
  • Promouvoir une culture "blameless" (sans culpabilité) pour l'analyse des incidents et l'apprentissage.
  • Communiquer efficacement avec les parties prenantes sur les questions de fiabilité et de performance.

Qualifications

Expérience Requise:

  • Expérience en administration système (SysAdmin/SysOps) avec une orientation vers l'architecture.
  • Expérience en développement ou DevOps avec une orientation vers l'architecture.
  • Expérience en production.

Compétences Techniques:

  • Systèmes d'Exploitation: Linux (administration).
  • Cloud Computing: AWS, GCP, Azure.
  • Automatisation et Configuration: Ansible, Terraform, Puppet, Chef, SaltStack.
  • Scripting: Python, Bash, NodeJS.
  • CI/CD et GitOps: GitLab, GitHub, FluxCD, ArgoCD.
  • Observabilité et Surveillance: Prometheus, Grafana, ELK, DataDog.
  • Bases de Données: Connaissance de DBA Oracle.
  • Versioning: GIT.

Compétences Fonctionnelles:

  • Compréhension des principes et pratiques SRE.
  • Connaissance des différences entre SRE et DevOps.
  • Capacité à mesurer et gérer la performance et la fiabilité des services.
  • Expérience dans la gestion des incidents et la rédaction de post-mortems.
  • Aptitude à identifier et réduire le "toil".
  • Esprit d'équipe et capacité à collaborer efficacement.
  • Ouverture d'esprit et volonté d'apprendre de nouvelles technologies et méthodes.
  • Force de persuasion.
  • Mentalité axée sur la qualité de service (QoS).
  • Esprit d'équipe et responsabilité collective.

Informations supplémentaires

Comment se déroule le processus de recrutement chez Devoteam ? Il comporte 2 à 3 entretiens :

- Talent Acquisition Interview : l'objectif est de faire le point sur vos compétences, votre niveau d'anglais et de valider vos éléments de motivation
- Tech & Business Interview : cet entretien vise à approfondir vos compétences techniques et à vérifier leur adéquation avec nos besoins lors d'un échange avec un expert métier
- Leadership Interview : il permet d'évaluer votre potentiel, vos ambitions et d'envisager votre évolution au sein de Devoteam.
Nous privilégions au moins un entretien en présentiel. Une prise de référence est demandée et, selon votre profil, des tests (techniques, anglais, personnalité...) peuvent vous être adressés.
Si votre candidature est retenue, nous vous faisons parvenir une proposition présentant les conditions d'embauche. En cas d'acceptation, le contrat de travail est formalisé.

Le Groupe Devoteam oeuvre pour l'égalité des chances, pour la promotion de ses collaboratrices et de ses collaborateurs au mérite et lutte activement contre toute forme de discrimination. Nous sommes convaincus que la diversité contribue à la créativité, au dynamisme et à l'excellence de notre organisation. Chaque candidature est donc considérée indépendamment de tout critère discriminatoire.

Apply now Apply later

* Salary range is an estimate based on our AI, ML, Data Science Salary Index 💰

Job stats:  0  0  0
Category: Big Data Jobs

Tags: Agile Ansible Architecture AWS Azure CI/CD DevOps ELK GCP Git GitHub GitLab Grafana KPIs Linux Node.js Oracle Pipelines Puppet Python Salesforce Terraform

Region: Europe
Country: France

More jobs like this