Ce que je fais

Trois disciplines étroitement liées, prises en charge de bout en bout — et non renvoyées par-dessus la clôture entre les équipes.

Notes du terrain

Des écrits pratiques sur la fiabilité, l'architecture et l'exploitation de systèmes réels — sans esbroufe ni théâtre de gourou.

Des SLO qui ne mentent pas : mesurer ce que les utilisateurs ressentent vraiment

La plupart des SLO sont au vert pendant que les utilisateurs souffrent — ils mesurent le système, pas la personne. Comment bâtir des SLI à partir de vrais parcours utilisateur, donner à chaque parcours l'objectif qu'il mérite, transformer la marge en un budget d'erreur avec un propriétaire, et câbler des alertes qui descendent droit à la cause.

Concevoir des alertes que personne n'ignore

Les alertes bruyantes apprennent à votre équipe à ignorer celle qui compte. Un guide approfondi et concret sur les alertes basées sur les symptômes et le multi-fenêtre / multi-burn-rate — les calculs du burn rate, du PromQL prêt à coller, et le processus d'astreinte qui rend les pages à nouveau crédibles.

Des modules Terraform qui passent à l'échelle avec votre équipe, pas contre elle

Les modules réutilisables ne passent à l'échelle que si on les traite comme des produits : petits, revus, testés et versionnés. Un guide pratique pour construire, publier et consommer des modules Terraform directement depuis GitHub — épinglés à un tag ou, quand ça compte, à un commit hash immuable — avec une arborescence Terragrunt qui reflète votre parc.

Vous avez un système qui ne doit jamais tomber ?

Qu'il s'agisse d'une revue d'architecture, d'une mission SRE ou d'un incendie de fiabilité que vous devez éteindre — parlons-en.

Contactez-moi

Retrouvez-moi sur les réseaux sociaux