AI-integrated DevOps tools in my daily flow

Después de un año midiendo cuáles de las herramientas DevOps con IA integradas realmente aportan y cuáles son humo, este es el stack que se queda en mi flujo diario.

190 8 min April 28, 2026 4.2

Arquitectura

Kubernetes 1.35 GA: an operations-side balance sheet

Kubernetes 1.35 llega a GA en 2026 consolidando mejoras gestadas durante tres versiones. Este es el balance desde la operación diaria: qué usar, qué probar y qué evitar.

226 9 min April 28, 2026 4.8

Inteligencia Artificial

AI agent incidents: recovery runbooks that work

Los agentes fallan. La pregunta no es si, sino cómo y qué haces en los primeros veinte minutos. Este es el runbook que distingue un incidente contenido de una reputación dañada.

129 8 min April 28, 2026 4.7

Metodologías

SRE with AI: dashboards that actually help

Los cuadros de mando con IA llevan un par de años prometiendo detección de anomalías mágica y causa raíz automática. La realidad es más modesta pero también más útil, si se sabe separar el ruido del valor real. Repaso honesto de qué funciona y qué no.

145 14 min February 3, 2026 4.3

Metodologías

The Site Reliability Workbook: patterns we still use

Han pasado siete años desde que Google publicó el Workbook, y buena parte del libro no ha envejecido. Repaso los patrones que de verdad aplicamos en equipos pequeños y los que resultaron ser cultura de campus.

126 12 min June 5, 2025

Arquitectura

Kubernetes 1.32: what the first jump of 2025 brings

Kubernetes 1.32 Penelope se publicó en diciembre y lleva varios meses rodando en clusters. Es buen momento para mirar qué cambios han envejecido bien, cuáles han generado trabajo extra y qué aprendizajes llevarse al salto hacia 1.33.

129 11 min May 18, 2025 4.7

Arquitectura

Kubernetes 1.33: the sneak peek from an operations lens

La release 1.33 llega el 23 de abril y el sneak peek oficial de marzo ya deja ver las líneas fuertes: in-place resize GA, sidecars terminando de madurar y un puñado de deprecaciones importantes.

124 10 min April 6, 2025 4.2

Metodologías

Chaos Engineering in Enterprise: Beyond Chaos for Chaos’s Sake

Chaos engineering es más que romper producción. Cómo implementar con hipótesis, blast radius controlado y ROI medible en organizaciones reales.

123 11 min July 19, 2024

Metodologías

Observability and SLOs: Error Budgets That Get Met

Los SLOs solo funcionan si el error budget se gestiona de verdad. Cómo definirlos sin ceremonia y usarlos para equilibrar velocidad y fiabilidad.

125 10 min February 29, 2024 4.6

Metodologías

Blameless Post-Mortems: How to Actually Improve

Los post-mortems blameless son fáciles de decir, difíciles de hacer bien. Técnicas concretas para extraer aprendizaje real sin que se conviertan en teatro.