LLM-as-judge maduro: cuándo confiar y cuándo no

Usar un LLM como juez de otro LLM se generalizó en 2024 y sigue siendo la única forma escalable de evaluar calidad cualitativa. La pregunta madura es cuándo fiarse de esos números.

28 de abril de 2026 3 min 226 4,7

Herramientas

Herramientas de observabilidad que recomendaría en 2026

Tras una década de Prometheus, tres años de consolidación alrededor de OpenTelemetry y la madurez definitiva del stack abierto con Grafana, Loki y Tempo, recomendaciones concretas para equipos que arrancan o revisan su capa de observabilidad. Qué encaja, qué sobra y qué evitar.

13 de enero de 2026 7 min 246 4,0

Inteligencia Artificial

Observabilidad de agentes de IA: qué instrumentar primero

Los agentes que encadenan llamadas a modelos, herramientas y memoria son difíciles de depurar sin una instrumentación pensada para ellos. Después de un año largo operando agentes en producción, repaso qué hay que medir primero, qué estándares están consolidándose y qué errores caros evita tener trazas bien hechas desde el inicio.

8 de diciembre de 2025 9 min 206

Inteligencia Artificial

Product-market fit en la era de la IA: lo que cambia

Las reglas del product-market fit han cambiado en la era de la IA. Baseline de calidad alto, moats distintos y nuevas métricas. Una guía pragmática para evaluar PMF en productos con LLM.

22 de noviembre de 2024 10 min 223 4,2

Arquitectura

OpenTelemetry: la unificación de logs, métricas y trazas

OpenTelemetry consolida las tres señales de observabilidad bajo un estándar único. Estado actual, integración y camino de adopción.

24 de agosto de 2023 4 min 194 4,6

Startup

Métricas útiles para Startups: Tipos y Usos

Las métricas útiles para startups son los datos que permiten evaluar el desempeño real de la empresa: métricas de rendimiento, KPIs y cómo usarlas para tomar decisiones.

11 de febrero de 2023 6 min 146 4,6