Systemzuverlässigkeit

Mit KI baut jeder. Zuverlässigkeit ist die eigentliche Kunst.

Ich helfe Unternehmen, ihre Dienste unter Last, unter Audit und dauerhaft am Laufen zu halten.

Ein Gespräch beginnen Sehen, was ich tue

Observability

Sehen Sie es, bevor es ausfällt.

Metriken, Logs und Distributed Tracing, die undurchsichtige Systeme in etwas verwandeln, das Sie wirklich verstehen - und beheben, bevor Ihre Nutzer es überhaupt bemerken.

Ein Gespräch beginnen Alle Leistungen

Cloud-Architektur

Eine Cloud, die Sie nachvollziehen können.

Infrastructure as Code, Golden Paths und sichere Pipelines - reproduzierbar, auditierbar, sicher und günstig im Betrieb, durch und durch.

Ein Gespräch beginnen Alle Leistungen

Was ich tue

Drei eng verwandte Disziplinen, durchgängig verantwortet - und nicht zwischen den Teams über den Zaun geworfen.

Programmierung

Produktionsreife Software, test-first entwickelt - mit KI für Tempo, ohne Abkürzungen.

Backends und APIs (Django, Scala / Akka-HTTP)
Testgetriebene Entwicklung und saubere Architektur
KI-gestütztes Programmieren mit Senior-Review
Web-UIs, native Apps und PWAs auf CloudFront

SRE & Zuverlässigkeit

Systeme observierbar, widerstandsfähig und überlebensfähig machen - vor dem Vorfall, nicht währenddessen.

SLOs, Error Budgets & Alerting, das keine Fehlalarme schlägt
Incident-Bereitschaft, Runbooks & Postmortems
Observability: Metriken, Logs, Tracing
Performance & Kosten unter realer Last

Cloud-Architektur & Automatisierung

Infrastructure as Code, Golden Paths und Pipelines, mit denen Sie schnell vorankommen, ohne die Produktion zu brechen.

AWS-Architektur & Well-Architected-Reviews
Terraform-Module & wiederverwendbare Grundlagen
CI/CD, GitOps & Deployment-Sicherheit
Security by Design & geringste Rechte

Leistungen entdecken

Notizen aus dem Feld

Praxisnahe Texte über Zuverlässigkeit, Architektur und den Betrieb echter Systeme - ohne Hype, ohne Thought-Leadership-Theater.

7. Juni 2026

Git-Worktrees: ein Gehirn, viele Agenten parallel am Werk

Wenn mehrere Personen - oder mehrere KI-Agenten - gleichzeitig am selben Repo arbeiten, jeweils auf einem eigenen Branch, brauchst du keine N Klone und kannst auch keinen einzelnen Checkout teilen. Git-Worktrees geben dir eine Historie und viele Arbeitsverzeichnisse: eine einzige Quelle der Wahrheit, über die ein zentraler Agent nachdenken kann, während jeder Worker isoliert baut, testet und committet.

6 Jun 2026

SLOs, die nicht lügen: messen, was Nutzer wirklich erleben

Die meisten SLOs sind grün, während die Nutzer leiden - sie messen das System, nicht den Menschen. Wie man SLIs aus echten User Journeys baut, jeder Journey das Ziel gibt, das sie verdient, den Spielraum in ein Fehlerbudget mit klarem Eigentümer verwandelt und Alerts verdrahtet, die direkt zur Ursache durchführen.

5 Jun 2026

Alerts entwerfen, die niemand ignoriert

Laute Alerts bringen dem Team bei, ausgerechnet den zu ignorieren, der zählt. Ein tiefer, praxisnaher Leitfaden zu symptombasierten Alerts und Multi-Window-/Multi-Burn-Rate-Alerting - die Mathematik hinter der Burn Rate, kopierfertiges PromQL und der On-Call-Prozess, der Pages wieder vertrauenswürdig macht.

Alle Artikel

Haben Sie ein System, das nicht ausfallen darf?

Ob Architektur-Review, ein SRE-Engagement oder ein Zuverlässigkeitsbrand, den Sie löschen müssen - lassen Sie uns reden.

Kontakt aufnehmen