Mature LLM-as-judge: when to trust and when not

Using an LLM to judge another LLM became widespread in 2024 and remains the only scalable way to evaluate qualitative quality. The mature question is when to trust those numbers.

140 5 min April 28, 2026 4.7

Herramientas

Observability tools I would recommend in 2026

Tras una década de Prometheus, tres años de consolidación alrededor de OpenTelemetry y la madurez definitiva del stack abierto con Grafana, Loki y Tempo, recomendaciones concretas para equipos que arrancan o revisan su capa de observabilidad. Qué encaja, qué sobra y qué evitar.

155 10 min January 13, 2026 4.0

Inteligencia Artificial

AI agent observability: what to instrument first

Los agentes que encadenan llamadas a modelos, herramientas y memoria son difíciles de depurar sin una instrumentación pensada para ellos. Después de un año largo operando agentes en producción, repaso qué hay que medir primero, qué estándares están consolidándose y qué errores caros evita tener trazas bien hechas desde el inicio.

140 12 min December 8, 2025

Inteligencia Artificial

Product-Market Fit in the AI Era: What Changes

Las reglas del product-market fit han cambiado en la era de la IA. Baseline de calidad alto, moats distintos y nuevas métricas. Una guía pragmática para evaluar PMF en productos con LLM.

135 14 min November 22, 2024 4.2

Arquitectura

OpenTelemetry: Unifying Logs, Metrics, and Traces

OpenTelemetry consolida las tres señales de observabilidad bajo un estándar único. Estado actual, integración y camino de adopción.

123 8 min August 24, 2023 4.6

Startup

Useful Metrics for Startups: Types and Uses

Las métricas útiles para startups son los datos que permiten evaluar el desempeño real de la empresa: métricas de rendimiento, KPIs y cómo usarlas para tomar decisiones.

93 10 min February 11, 2023 4.6