SRE (Site Reliability Engineer)

Description

Descriptif du poste

Notre équipe SRE recherche une nouvelle pépite pour accompagner la croissance d’AGICAP.

Comment ?

En tant que SRE, tu participes à améliorer la stabilité, la scalabilité et les performances de notre plateforme full cloud en remettant sans cesse en question l’existant.

Tes missions

Fiabilité & Performance :

• Participer à la définition, au suivi et à l’amélioration des SLI/SLO/SLA pour garantir la disponibilité des services.

• Contribuer à l’analyse des incidents et au suivi des post-mortems.

• Participer aux campagnes de tests de charge et de performance pour valider la scalabilité des systèmes.

Observabilité & Monitoring :

• Mettre en place et maintenir des solutions de monitoring (logs, métriques, alerting).

• Contribuer à l’amélioration des dashboards et alertes pour renforcer la réactivité sur incidents.

• Participer à l’évolution des outils d’observabilité (Prometheus, Grafana, Loki, etc.).

Culture SRE & Résilience :

• Participer à des exercices de chaos engineering encadrés.

• Travailler avec les équipes Dev et Ops pour améliorer la gestion des erreurs et renforcer l’auto-réparation des services.

• Adopter et diffuser les bonnes pratiques de reliability au sein de l’équipe.

⚙️Environnement Technique

Même si notre stack technique évolue sans cesse, voici les technos que nous utilisons aujourd’hui :

• Cloud Provider : GCP en majorité

• 100% de notre infra est en Infra As Code (Terraform / Ansible) ou managé par des opérateurs Kubernetes développés en interne

• 99% de nos apps tournent sur GKE

• LB HAProxy et Istio

• SGBD PostgreSQL & SQL Server

• CI/CD avec GitHub Actions

• Flow GitOps avec ArgoCD

👉 Dans ce podcast, Lucas, notre CTO, parle de la qualité chez Agicap

👉 Podcast Thomas PIERRAIN (VP of Engineering) à propos de notre rapport à l’autonomie

👉 Talk: La scale-up, l’autonomie et le sous-marin nucléaire (Thomas PIERRAIN et Pauline JAMIN):  https://www.youtube.com/watch?v=FPZw6gy04T4

👉Show me your domain:  https://t.co/KdhY1W0zsx

👉Live coding : refacto legacy :  https://www.youtube.com/watch?v=G8ItpRMBcH0

👉Débrief Battle : La qualité de code est-elle compatible avec le mode startup ?

    5 autres jobs qui pourrait t'intéresser:

    Meilleurs outils télétravail

    Obtiens 10x plus d'entretiens d'embauche grâce à l'automatisation des candidatures avec l'IA

    En fonction de tes critères de recherche, postule automatiquement jusqu'à 1 500 offres d'emploi chaque mois