Las NPU dejaron de ser un accesorio para convertirse en el componente que define rendimiento real en portátiles, teléfonos y servidores pequeños. Repaso práctico del hardware que domina 2026, qué cargas compensan y dónde sigue ganando la GPU tradicional.
Leer másEtiqueta: rendimiento
Cachés para LLM: ahorrar tokens sin tirar la calidad
Un proxy con caché delante de un modelo de lenguaje puede reducir la factura de tokens de forma significativa, pero introduce riesgos sutiles si el diseño no es cuidadoso. Analizo qué tipos de caché funcionan en producción, dónde están las trampas habituales y cómo integrarlo sin degradar la experiencia del usuario.
Leer másGarnet de Microsoft: alternativa de cache de alto rendimiento
Garnet es el servidor de cache abierto por Microsoft Research que habla el protocolo de Redis pero esta escrito en .NET 8 con un nucleo de almacenamiento orientado a hardware moderno. Tras casi dos anos en publico, muestra numeros interesantes y una arquitectura que merece mirarse con calma, aunque el ecosistema Redis siga siendo mas maduro.
Leer másDragonfly: el cache moderno inspirado en Redis
Dragonfly lleva tres anios como alternativa compatible con Redis, pero con arquitectura multihilo y sin fork para persistencia. En 2025 ya no es una curiosidad: hay despliegues serios que lo eligen por coste y latencia. Repaso lo que cambia y cuando compensa mirarlo con calma.
Leer másPython 3.13 con GIL opcional: qué significa para los equipos
Python 3.13 introduce de forma experimental la ejecución sin GIL mediante PEP 703. Tras unos meses de rodaje empiezan a verse pruebas reales fuera del laboratorio. Conviene entender bien qué ganas, qué pierdes y qué no cambia todavía.
Leer másRedis 8.2 y su soporte vectorial: cuando tiene sentido
Redis 8.2 incorpora busqueda vectorial como tipo de dato nativo. La pregunta no es si funciona, sino si sustituye a un motor dedicado como Qdrant, Weaviate o pgvector en cargas reales con millones de vectores y latencias exigentes.
Leer másRedis 8.2 y su soporte vectorial: cuando tiene sentido
Redis 8.2 incorpora busqueda vectorial como tipo de dato nativo. La pregunta no es si funciona, sino si sustituye a un motor dedicado como Qdrant, Weaviate o pgvector en cargas reales con millones de vectores y latencias exigentes.
Leer másQwik en produccion: resumible y económico en cliente
Qwik lleva dos anios prometiendo aplicaciones que arrancan al instante porque no hidratan, sino que reanudan. Con la serie 1.x asentada y casos reales publicados, toca ver si la resumibilidad compensa la curva de aprendizaje y cuando es el entorno adecuado.
Leer másQwik en produccion: resumible y economico en cliente
Qwik lleva dos anios prometiendo aplicaciones que arrancan al instante porque no hidratan, sino que reanudan. Con la serie 1.x asentada y casos reales publicados, toca ver si la resumibilidad compensa la curva de aprendizaje y cuando es el entorno adecuado.
Leer másApple M4 Pro en maquinas de desarrollo: experiencia real
Llevo seis meses usando un MacBook Pro con M4 Pro como equipo principal de desarrollo. Toca contar que ha cambiado de verdad respecto al M2 Pro anterior, donde se nota el salto y donde la inversion no se justifica si ya tienes un equipo reciente.
Leer más