Description
Foxintelligence recherche un(une) undefined/Site Reliability Engineer.
Ta mission consiste à travailler avec le reste de l’équipe undefined / SRE et les équipes de développement afin d’assurer disponibilité, performance, efficacité et sécurité maximale des services applicatifs. Nous travaillons en collaboration rapprochée avec le CTO et les développeurs et nos challenges en terme de gestion de la data feront de toi un expert en infrastructure résiliente et performante ! Nos objectifs sont d’automatiser un maximum nos opérations, nous tenons donc à gérer le maximum en Infra As Code (IaC), ce qui nous permet de gagner en résilience et d’anticiper au mieux notre croissance internationale.
Voici quelques chiffres de production pour donner une idée des volumes que nous traitons :
40 TB opérationnels (noSQL et SQL) pour nos applications grand public et en entrée de notre flux “Big Data”
800 TB pour la partie analytique
3000-6000 conteneurs en parallèle en fonction des pics de charge
15 à 45 millions d’appels de fonctions serverless par jour
1 millard de messages de logs chaque jour
Tes responsabilités au quotidien :
Assurer le bon fonctionnement de notre infrastructure AWS (suivi du monitoring, création d’alertes, anticipations des problèmes)
Déployer de nouvelles architectures AWS via Terraform, Helm, Ansible
Administration K8S / Karpenter
Administration des outils transverses fournis aux développeurs (Jenkins, Vault, Nexus, Grafana, ELK, etc..)
Maitrise des coûts - Sécurité - Support aux développeurs (1jour/semaine max)
5 autres jobs qui pourrait t'intéresser:
- 🌐 Senior Software Engineer Containers and Platform
- 🌐 Systems Engineer
- 🌐 Devops Engineer
- 🌐 Devops Engineer
- 🌐 Cloud Security Engineer (Remote)
Obtiens 10x plus d'entretiens d'embauche grâce à l'automatisation des candidatures avec l'IA
En fonction de tes critères de recherche, postule automatiquement jusqu'à 1 500 offres d'emploi chaque mois