Agent observability with OpenTelemetry GenAI semconv in 2026

The OTel GenAI spec stabilizes attributes for LLMs, tools, and agents. Practical Python implementation with Anthropic + Grafana Tempo.

125 25 min May 18, 2026

Herramientas

AI-integrated DevOps tools in my daily flow

Después de un año midiendo cuáles de las herramientas DevOps con IA integradas realmente aportan y cuáles son humo, este es el stack que se queda en mi flujo diario.

174 8 min April 28, 2026 4.2

Inteligencia Artificial

AI agent incidents: recovery runbooks that work

Los agentes fallan. La pregunta no es si, sino cómo y qué haces en los primeros veinte minutos. Este es el runbook que distingue un incidente contenido de una reputación dañada.

118 8 min April 28, 2026 4.7

Inteligencia Artificial

Production-grade agent evaluations: the framework that works

Después de año y medio llenando tableros con agentes en producción, la pregunta que separa equipos que envían fiable de los que van a ciegas sigue siendo la misma: ¿cómo mides que el agente está funcionando?

143 15 min April 22, 2026 4.3

Inteligencia Artificial

AI incident postmortems: what they have taught us

Una selección de postmortems publicados entre 2025 y 2026 por equipos que operan sistemas con IA en producción revela patrones repetidos: fallos en guardrails, deriva silenciosa de modelos, dependencia oculta del proveedor y una colección de sustos que vale la pena destilar.

142 13 min February 27, 2026 4.6

Metodologías

SRE with AI: dashboards that actually help

Los cuadros de mando con IA llevan un par de años prometiendo detección de anomalías mágica y causa raíz automática. La realidad es más modesta pero también más útil, si se sabe separar el ruido del valor real. Repaso honesto de qué funciona y qué no.

131 14 min February 3, 2026 4.3

Herramientas

Observability tools I would recommend in 2026

Tras una década de Prometheus, tres años de consolidación alrededor de OpenTelemetry y la madurez definitiva del stack abierto con Grafana, Loki y Tempo, recomendaciones concretas para equipos que arrancan o revisan su capa de observabilidad. Qué encaja, qué sobra y qué evitar.

153 10 min January 13, 2026 4.0

Inteligencia Artificial

AI agent observability: what to instrument first

Los agentes que encadenan llamadas a modelos, herramientas y memoria son difíciles de depurar sin una instrumentación pensada para ellos. Después de un año largo operando agentes en producción, repaso qué hay que medir primero, qué estándares están consolidándose y qué errores caros evita tener trazas bien hechas desde el inicio.

138 12 min December 8, 2025

Tecnología

Parca, Beyla and Grafana: a sidecar-free observability stack

La combinación de Parca para perfiles continuos, Beyla para auto-instrumentación vía eBPF y Grafana como capa de visualización ofrece observabilidad profunda sin tocar código. Repaso a cómo encajan y dónde se sufren los límites.

125 17 min August 13, 2025 4.5

Metodologías

Continuous profiling with eBPF in production

El profiling continuo ha salido del terreno experimental y se ha vuelto una herramienta habitual en sistemas con tráfico real. Repaso qué aporta eBPF frente a instrumentación clásica, qué cuesta y cuándo compensa instalarlo.

125 12 min June 8, 2025 4.6

Metodologías

The Site Reliability Workbook: patterns we still use

Han pasado siete años desde que Google publicó el Workbook, y buena parte del libro no ha envejecido. Repaso los patrones que de verdad aplicamos en equipos pequeños y los que resultaron ser cultura de campus.

111 12 min June 5, 2025

Metodologías

Zero Trust integrated with SIEM: what actually works

Dos años después de que Zero Trust dejase de ser palabra de marketing, toca mirar cómo conecta con el SIEM del día a día. Reflexión sobre señales útiles, ruido evitable y decisiones que de verdad cambian la postura de seguridad.

139 13 min March 22, 2025 4.5