DevOps/Site Reliability Engineer.

Description du poste:

Description

Foxintelligence recherche un(une) undefined/Site Reliability Engineer.

Ta mission consiste à travailler avec le reste de l’équipe undefined / SRE et les équipes de développement afin d’assurer disponibilité, performance, efficacité et sécurité maximale des services applicatifs. Nous travaillons en collaboration rapprochée avec le CTO et les développeurs et nos challenges en terme de gestion de la data feront de toi un expert en infrastructure résiliente et performante ! Nos objectifs sont d’automatiser un maximum nos opérations, nous tenons donc à gérer le maximum en Infra As Code (IaC), ce qui nous permet de gagner en résilience et d’anticiper au mieux notre croissance internationale.

Voici quelques chiffres de production pour donner une idée des volumes que nous traitons :

  • 40 TB opérationnels (noSQL et SQL) pour nos applications grand public et en entrée de notre flux “Big Data”

  • 800 TB pour la partie analytique

  • 3000-6000 conteneurs en parallèle en fonction des pics de charge

  • 15 à 45 millions d’appels de fonctions serverless par jour

  • 1 millard de messages de logs chaque jour

Tes responsabilités au quotidien :

  • Assurer le bon fonctionnement de notre infrastructure AWS (suivi du monitoring, création d’alertes, anticipations des problèmes)

  • Déployer de nouvelles architectures AWS via Terraform, Helm, Ansible

  • Administration K8S / Karpenter

  • Administration des outils transverses fournis aux développeurs (Jenkins, Vault, Nexus, Grafana, ELK, etc..)

  • Maitrise des coûts - Sécurité - Support aux développeurs (1jour/semaine max)

    5 autres jobs qui pourrait t'intéresser:

    RemoteFR t'aide à trouver ton prochain job 100% remote : Crée ton profil

    Poster une annonce 100% télétravail

    Vous recrutez en télétravail?

    Ciblez des milliers de travailleurs remote en postant sur le 1er site d'annonces full-remote en France!