Configurar Alertmanager mal es lo habitual. Patrones sensatos de routing, silencios, agrupación y rotaciones de guardia para evitar la fatiga de alertas.
Leer másEtiqueta: prometheus
Monitorización de contenedores: más allá de cAdvisor
cAdvisor fue el default histórico pero hoy no basta. Cómo combinar eBPF, Kubernetes metrics y APM para observabilidad real de containers.
Leer másObservabilidad y SLOs: presupuestos de error que se cumplen
Los SLOs solo funcionan si el error budget se gestiona de verdad. Cómo definirlos sin ceremonia y cómo usarlos para equilibrar velocidad y fiabilidad.
Leer másPrometheus: cómo escribir alertas que no se ignoren
Guía práctica para escribir reglas de alerta en Prometheus que reflejen problemas reales, no ruido: síntomas vs. causas, SLOs, y el peso del watchdog.
Leer más