NPU de nueva generación: el hardware que mueve IA en 2026

Las NPU dejaron de ser un accesorio para convertirse en el componente que define rendimiento real en portátiles, teléfonos y servidores pequeños. Repaso práctico del hardware que domina 2026, qué cargas compensan y dónde sigue ganando la GPU tradicional.

1,2K 12 min marzo 17, 2026 4,9

Arquitectura

Cachés para LLM: ahorrar tokens sin tirar la calidad

Un proxy con caché delante de un modelo de lenguaje puede reducir la factura de tokens de forma significativa, pero introduce riesgos sutiles si el diseño no es cuidadoso. Qué tipos de caché funcionan en producción, dónde están las trampas habituales y cómo integrarlos sin degradar la experiencia.

125 10 min noviembre 29, 2025

Tecnología

Garnet de Microsoft: alternativa de caché de alto rendimiento

Garnet es el servidor de caché abierto por Microsoft Research que habla el protocolo de Redis pero está escrito en .NET 8 con un núcleo de almacenamiento orientado a hardware moderno. Tras casi dos años en público, muestra números interesantes y una arquitectura que merece mirarse con calma, aunque el ecosistema Redis siga siendo más maduro.

114 10 min noviembre 14, 2025 4,5

Tecnología

Dragonfly: el caché moderno inspirado en Redis

Dragonfly lleva tres años como alternativa compatible con Redis, pero con arquitectura multihilo y sin fork para persistencia. En 2025 ya no es una curiosidad: hay despliegues serios que lo eligen por coste y latencia. Repaso de qué cambia y cuándo compensa mirarlo con calma.

101 13 min septiembre 18, 2025 4,5

Desarrollo de Software

Python 3.13 con GIL opcional: qué significa para los equipos

Python 3.13 introduce de forma experimental la ejecución sin GIL mediante PEP 703. Tras unos meses de rodaje empiezan a verse pruebas reales fuera del laboratorio. Conviene entender bien qué ganas, qué pierdes y qué no cambia todavía.

116 11 min agosto 25, 2025 4,3

Arquitectura

Redis 8.2 y su soporte vectorial: cuándo tiene sentido

Redis 8.2 incorpora búsqueda vectorial como tipo de dato nativo. La pregunta no es si funciona, sino si sustituye a un motor dedicado como Qdrant, Weaviate o pgvector en cargas reales con millones de vectores y latencias exigentes.

114 12 min agosto 4, 2025 4,6

Desarrollo de Software

Qwik en producción: resumible y económico en cliente

Qwik lleva dos años prometiendo aplicaciones que arrancan al instante porque no hidratan, sino que reanudan. Con la serie 1.x asentada y casos reales publicados, toca ver si la resumibilidad compensa la curva de aprendizaje y cuándo es el entorno adecuado.

129 14 min julio 20, 2025 4,3

Mac

Apple M4 Pro en máquinas de desarrollo: experiencia real

Llevo seis meses usando un MacBook Pro con M4 Pro como equipo principal de desarrollo. Cuento qué ha cambiado de verdad respecto al M2 Pro anterior, dónde se nota el salto y dónde la inversión no se justifica si ya tienes un equipo reciente.

116 11 min junio 20, 2025 4,5

Desarrollo de Software

Polars frente a pandas en 2025: la práctica real

Polars lleva dos años pidiendo relevo a pandas. Con Polars 1.x estable y una comunidad creciente, toca revisar dónde de verdad compensa migrar, dónde pandas sigue ganando y cómo convivir entre ambos sin pagar dos veces.

233 12 min junio 17, 2025 4,3

Metodologías

Profiling continuo con eBPF en producción

El profiling continuo ha salido del terreno experimental y se ha vuelto una herramienta habitual en sistemas con tráfico real. Repaso qué aporta eBPF frente a instrumentación clásica, qué cuesta y cuándo compensa instalarlo.

127 12 min junio 8, 2025 4,6

Arquitectura

PostgreSQL 17: optimizaciones que cambian consultas reales

PostgreSQL 17 llegó en septiembre con mejoras silenciosas del planificador. Seis meses en producción confirman que los escaneos SAOP, el streaming I/O y los anti-joins han cambiado planes de consulta reales sin tocar una línea de SQL.

99 10 min abril 30, 2025 4,3