LLM caches: saving tokens without dropping quality

Un proxy con caché delante de un modelo de lenguaje puede reducir la factura de tokens de forma significativa, pero introduce riesgos sutiles si el diseño no es cuidadoso. Qué tipos de caché funcionan en producción, dónde están las trampas habituales y cómo integrarlos sin degradar la experiencia.

Inference routers: choosing a model based on the request

Un enrutador de inferencia decide qué modelo atiende cada petición en función de coste, latencia y complejidad. Bien diseñados reducen la factura de tokens sin que el usuario perciba degradación; mal diseñados introducen fallos sutiles difíciles de depurar.

TigerBeetle: a database built for financial transactions

TigerBeetle es una base de datos distribuida escrita en Zig y especializada en un tipo concreto de carga: contabilidad por partida doble de altísimo volumen con garantías fuertes de consistencia. No pretende sustituir a Postgres; pretende ser la pieza correcta cuando el problema es contar transacciones financieras a ritmo de millones por segundo sin fallos sutiles.

Platform engineering: consolidation after the boom

Después de tres años de expansión y de un ecosistema sobreexcitado alrededor del término, platform engineering llega a 2025 en una fase de consolidación. Las plataformas internas que sobreviven son las que entendieron su función real, las que confundieron el nombre con la solución están desmantelando sus equipos o recortándolos drásticamente.

Fly.io: deploying globally without complicating your life

Fly.io lleva años vendiendo la idea de que desplegar una aplicación en varias regiones del mundo debería ser casi tan sencillo como empujar una imagen y escribir una línea de configuración. Tras varios proyectos reales encima de la plataforma, se puede hablar con honestidad de qué cumple, qué falta y para quién merece la pena frente a opciones más clásicas.

Microsoft Garnet: a high-performance cache alternative

Garnet es el servidor de caché abierto por Microsoft Research que habla el protocolo de Redis pero está escrito en .NET 8 con un núcleo de almacenamiento orientado a hardware moderno. Tras casi dos años en público, muestra números interesantes y una arquitectura que merece mirarse con calma, aunque el ecosistema Redis siga siendo más maduro.

Testing with AI: the determinism problem

Probar sistemas que incluyen modelos de lenguaje rompe la primera regla del testing: la misma entrada da la misma salida. Analizo las estrategias que han funcionado tras un año largo integrando IA en productos reales, por qué los tests deterministas tradicionales no bastan y cómo plantear un cinturón de pruebas que capture regresiones sin bloquearse en la varianza.

Citus: scaling Postgres horizontally without leaving it

Tras la adquisición por Microsoft en 2019, Citus vivió un limbo comercial que terminó con Microsoft abriendo el código completo en 2022. Tres años después, la extensión de particionado para Postgres ha madurado y ofrece una ruta práctica para escalar sin abandonar el motor que ya conoces. Un repaso honesto.

SQLite in production: patterns that have aged well

SQLite lleva años ganando terreno en servidores reales gracias a WAL, a proyectos como Litestream y libSQL, y a hardware con discos rápidos. Repaso los patrones que siguen funcionando después de varios años de uso, los que no, y por qué el tamaño medio de una aplicación web se come ya sin despeinarse.

Modern data engineering: dbt, Iceberg and the lakehouse come together

Tras años de prometer un lakehouse abierto, la combinación de Apache Iceberg con catálogos REST y dbt encima ha cuajado en 2025 como la pila de referencia. Analizo qué resuelve, dónde sigue doliendo y por qué la separación limpia entre tabla, motor y transformación importa más de lo que parece.