Description
Descriptif du poste
Notre équipe SRE recherche une nouvelle pépite pour accompagner la croissance d’AGICAP.
Comment ?
En tant que SRE, tu participes à améliorer la stabilité, la scalabilité et les performances de notre plateforme full cloud en remettant sans cesse en question l’existant.
Tes missions
Fiabilité & Performance :
• Participer à la définition, au suivi et à l’amélioration des SLI/SLO/SLA pour garantir la disponibilité des services.
• Contribuer à l’analyse des incidents et au suivi des post-mortems.
• Participer aux campagnes de tests de charge et de performance pour valider la scalabilité des systèmes.
Observabilité & Monitoring :
• Mettre en place et maintenir des solutions de monitoring (logs, métriques, alerting).
• Contribuer à l’amélioration des dashboards et alertes pour renforcer la réactivité sur incidents.
• Participer à l’évolution des outils d’observabilité (Prometheus, Grafana, Loki, etc.).
Culture SRE & Résilience :
• Participer à des exercices de chaos engineering encadrés.
• Travailler avec les équipes Dev et Ops pour améliorer la gestion des erreurs et renforcer l’auto-réparation des services.
• Adopter et diffuser les bonnes pratiques de reliability au sein de l’équipe.
⚙️Environnement Technique
Même si notre stack technique évolue sans cesse, voici les technos que nous utilisons aujourd’hui :
• Cloud Provider : GCP en majorité
• 100% de notre infra est en Infra As Code (Terraform / Ansible) ou managé par des opérateurs Kubernetes développés en interne
• 99% de nos apps tournent sur GKE
• LB HAProxy et Istio
• SGBD PostgreSQL & SQL Server
• CI/CD avec GitHub Actions
• Flow GitOps avec ArgoCD
👉 Dans ce podcast, Lucas, notre CTO, parle de la qualité chez Agicap
👉 Podcast Thomas PIERRAIN (VP of Engineering) à propos de notre rapport à l’autonomie
👉 Talk: La scale-up, l’autonomie et le sous-marin nucléaire (Thomas PIERRAIN et Pauline JAMIN): https://www.youtube.com/watch?v=FPZw6gy04T4
👉Show me your domain: https://t.co/KdhY1W0zsx
👉Live coding : refacto legacy : https://www.youtube.com/watch?v=G8ItpRMBcH0
👉Débrief Battle : La qualité de code est-elle compatible avec le mode startup ?
5 autres jobs qui pourrait t'intéresser:
- 🌐 SRE (Site Reliability Engineer)
- 🌐 Senior Platform Engineer
- 🌐 Senior Protocol Engineer
- 🌐 Ingénieur Systèmes DevOps (H/F)
- 🌐 DevOps Engineer - Spain/France
Mon top 5 du matériel pour télétravailler

Obtiens 10x plus d'entretiens d'embauche grâce à l'automatisation des candidatures avec l'IA
En fonction de tes critères de recherche, postule automatiquement jusqu'à 1 500 offres d'emploi chaque mois