Hybrid RAG in 2026: the patterns that keep winning
Tres años después del boom inicial, el RAG en producción ha convergido en patrones híbridos que combinan búsqueda densa, léxica y reranking. Estos son los que sobreviven al paso del tiempo.
Category
Pragmatic software architecture: decisions, trade-offs and patterns that scale.
Tres años después del boom inicial, el RAG en producción ha convergido en patrones híbridos que combinan búsqueda densa, léxica y reranking. Estos son los que sobreviven al paso del tiempo.
Kubernetes 1.35 llega a GA en 2026 consolidando mejoras gestadas durante tres versiones. Este es el balance desde la operación diaria: qué usar, qué probar y qué evitar.
Skills package reusable capabilities; subagents isolate bounded-task execution. Together they form the most effective pattern for composing complex agents in 2026.
The Model Context Protocol, proposed by Anthropic in late 2024 and adopted through 2025-2026 by every major vendor, has proven operational patterns. This is the state of the art.
Kubernetes ganó la batalla de la orquestación, pero Docker Swarm sigue activo y útil para casos concretos. Cuándo elegir Swarm sin sentirse anticuado.
Dieciséis meses después del anuncio inicial, Model Context Protocol pasó de curiosidad a estándar de facto entre clientes y servidores de agentes. Qué hay disponible, qué servidores merecen la pena, qué problemas siguen abiertos y cómo se parece al mapa de protocolos anteriores.
Tres años después de que platform engineering se convirtiera en palabra de moda, el polvo ha caído. Unas pocas empresas tienen plataformas internas que de verdad aceleran al desarrollo, muchas montaron un portal Backstage vacío y algunas volvieron a DevOps clásico. Análisis de qué distingue a las que ganaron.
Seis meses después de que A2A llegara a la Linux Foundation, y tras varios ciclos de implementación por parte de Google, Microsoft y proyectos abiertos, qué significa la versión 1 del protocolo y si ya es seguro construir sobre él.
Con 1.34 liberado en agosto de 2025 y el ciclo de 1.35 en su última fase de congelación de funciones, qué llegará estable, qué quedará en beta, qué nos interesa a quienes mantenemos clústeres pequeños o medianos y qué podemos ignorar sin culpa hasta el siguiente ciclo.
La integración de WebAssembly dentro de containerd como tiempo de ejecución alternativo ha madurado. Ya es posible desplegar cargas mixtas Linux y Wasm en el mismo clúster de Kubernetes con argumentos operativos sólidos. Cuándo compensa y cuándo no.
Con MCP resolviendo la conexión entre agente y herramientas, el siguiente cuello de botella aparece: cómo hablan entre sí dos agentes de distintos proveedores. Agent2Agent de Google, donado a la Linux Foundation en 2025, intenta ocupar ese hueco.
gVisor interpone un kernel en espacio de usuario entre el contenedor y el anfitrión. Después de años en producción en Google y adopción creciente en plataformas serverless, merece una lectura honesta sobre cuándo compensa frente a microVMs y runtimes clásicos.
Un proxy con caché delante de un modelo de lenguaje puede reducir la factura de tokens de forma significativa, pero introduce riesgos sutiles si el diseño no es cuidadoso. Qué tipos de caché funcionan en producción, dónde están las trampas habituales y cómo integrarlos sin degradar la experiencia.
Un enrutador de inferencia decide qué modelo atiende cada petición en función de coste, latencia y complejidad. Bien diseñados reducen la factura de tokens sin que el usuario perciba degradación; mal diseñados introducen fallos sutiles difíciles de depurar.
TigerBeetle es una base de datos distribuida escrita en Zig y especializada en un tipo concreto de carga: contabilidad por partida doble de altísimo volumen con garantías fuertes de consistencia. No pretende sustituir a Postgres; pretende ser la pieza correcta cuando el problema es contar transacciones financieras a ritmo de millones por segundo sin fallos sutiles.
Después de tres años de expansión y de un ecosistema sobreexcitado alrededor del término, platform engineering llega a 2025 en una fase de consolidación. Las plataformas internas que sobreviven son las que entendieron su función real, las que confundieron el nombre con la solución están desmantelando sus equipos o recortándolos drásticamente.
Tras la adquisición por Microsoft en 2019, Citus vivió un limbo comercial que terminó con Microsoft abriendo el código completo en 2022. Tres años después, la extensión de particionado para Postgres ha madurado y ofrece una ruta práctica para escalar sin abandonar el motor que ya conoces. Un repaso honesto.
SQLite lleva años ganando terreno en servidores reales gracias a WAL, a proyectos como Litestream y libSQL, y a hardware con discos rápidos. Repaso los patrones que siguen funcionando después de varios años de uso, los que no, y por qué el tamaño medio de una aplicación web se come ya sin despeinarse.
Tras años de prometer un lakehouse abierto, la combinación de Apache Iceberg con catálogos REST y dbt encima ha cuajado en 2025 como la pila de referencia. Analizo qué resuelve, dónde sigue doliendo y por qué la separación limpia entre tabla, motor y transformación importa más de lo que parece.
DuckDB lleva dos años colándose en las arquitecturas de datos sin hacer ruido. Ya no es solo la base de datos embebida para analítica local: en 2025 está apareciendo en casos concretos de empresa donde reemplaza a piezas mucho más caras. Un recorrido por patrones reales.
El término Agent OS lleva un año ganando tracción entre investigación y producto. Describe una capa que va más allá de una biblioteca de agentes: planificador, gestión de contexto, memoria persistente y aislamiento. Una lectura del estado real de ese concepto.
Redpanda promete compatibilidad con el protocolo Kafka pero sin JVM, sin ZooKeeper y con arquitectura thread-per-core. En 2025 ya hay despliegues serios en producción. Merece la pena entender dónde compensa el cambio y dónde no.
Kubernetes 1.34 llega con ajustes en planificador, validación declarativa y progresos en soporte dinámico de recursos. Un repaso a lo que importa actualizar rápido, lo que puede esperar, y las deprecaciones que conviene leer con calma.
Redis 8.2 incorpora búsqueda vectorial como tipo de dato nativo. La pregunta no es si funciona, sino si sustituye a un motor dedicado como Qdrant, Weaviate o pgvector en cargas reales con millones de vectores y latencias exigentes.
Seis meses después de la GA de containerd 2.0 hay suficiente camino recorrido para evaluar la migración desde 1.x. Repasamos compatibilidad, cambios de API, trampas habituales y cuándo compensa planificar el salto.
Firecracker lleva años detrás de Lambda y Fargate, pero su adopción fuera de AWS se ha acelerado. Repaso cuándo compensa cambiar containers por microVMs, qué aportan frente a gVisor y dónde siguen las asperezas.
Kubernetes 1.32 Penelope se publicó en diciembre y lleva varios meses rodando en clusters. Es buen momento para mirar qué cambios han envejecido bien, cuáles han generado trabajo extra y qué aprendizajes llevarse al salto hacia 1.33.
PostgreSQL 17 llegó en septiembre con mejoras silenciosas del planificador. Seis meses en producción confirman que los escaneos SAOP, el streaming I/O y los anti-joins han cambiado planes de consulta reales sin tocar una línea de SQL.
Valkey 8.1 salió el 31 de marzo y marca el momento en que la alternativa comunitaria de Redis deja de ser experimento. Cuenta una migración real: qué cambió, qué se mantuvo igual, y dónde hubo sobresaltos.
La release 1.33 llega el 23 de abril y el sneak peek oficial de marzo ya deja ver las líneas fuertes: in-place resize GA, sidecars terminando de madurar y un puñado de deprecaciones importantes.
Coolify promete la experiencia de Vercel o Heroku desplegada en tus propios servidores. Tras varios meses usándolo en VPS de producción, cuento dónde brilla, dónde cojea y para qué perfil de equipo tiene sentido.
GraphRAG lleva un año en uso empresarial real. Balance de qué tipos de preguntas resuelve mejor que el RAG clásico, qué cuesta operarlo y cuándo la complejidad extra compensa.
Cloudflare Workers cumple ocho años y se ha convertido en una plataforma de aplicaciones completa. Repaso de qué ofrece hoy, qué limitaciones persisten y en qué tipo de proyecto tiene sentido apostar.
Montar un sistema de ficheros compartido entre varios servidores sin NFS ni complicaciones de kernel. Recorrido por la instalación de JuiceFS usando S3 como backend y PostgreSQL como metadatos.
MariaDB 11.7 trajo vector search nativo, mejoras en JSON y optimizaciones de rendimiento. Cómo se diferencia de MySQL 8 y cuándo sigue siendo la elección correcta.
Kubernetes 1.30 trae ValidatingAdmissionPolicy en GA, pod scheduling readiness y job success policy. Una release discreta pero útil para quien opera clústeres de verdad.
Kubecost da visibilidad de coste por namespace, deployment y label. OpenCost es su núcleo OSS. Cuándo compensa y cómo integrar en el workflow de K8s.
Workers + KV + D1 + R2 + Durable Objects conforman un stack edge completo. Qué falta, qué ya funciona y cuándo compite con AWS.
Kubernetes 1.31 no trae fuegos artificiales, pero estabiliza AppArmor, convierte los sidecars en ciudadanos de primera clase y deja DRA a un paso del GA. Repaso desde la óptica de quien opera clústeres.
El debate sidecar-or-not se resolvió con dos opciones maduras: Istio Ambient y Cilium Mesh. Comparativa operativa y cuál encaja con tu equipo.
Redis cambió a licencia dual en marzo de 2024. Valkey nació como fork BSD respaldado por AWS, Google y la Linux Foundation. Qué implica para usuarios y proyectos.
cAdvisor fue el default histórico pero hoy no basta. Cómo combinar eBPF, Kubernetes metrics y APM para observabilidad real de containers.
PG17 llega con vacuum más eficiente, logical replication con failover y JSON_TABLE estándar. Qué features valen la pena probar en staging y cómo planificar el upgrade.
PostgreSQL 16 cerró las brechas históricas de la replicación lógica. Parallel apply, slots en standby y bidireccionalidad disciplinada la convierten en herramienta de primera línea para migraciones y CDC.
Llevar SCADA a contenedores gana flexibilidad pero abre nuevos vectores de riesgo. Qué funciona, qué no, y cómo gobernar la transición.
Cilium ofrece service mesh sin sidecars gracias a eBPF. Cuándo supera a Linkerd/Istio y cuándo su enfoque novedoso tiene límites.
SQLite en servidores es más viable de lo que crees. WAL, Litestream, LiteFS y patrones que hacen posible escalarla hasta donde muchos Postgres no llegan.
Linkerd apuesta por simplicidad y rendimiento antes que por catálogo de features. Dónde supera a Istio, qué cuesta operarlo y cuándo un service mesh compensa la complejidad.
Instalación reproducible de PostgreSQL 16 con pgvector en Debian o Ubuntu, con decisión razonada entre IVFFlat y HNSW y configuración lista para producción.
Internal Developer Platform es un término con tres grandes opciones. Cuál encaja mejor según el tamaño del equipo y la cultura de plataforma de tu organización.
pgvector maduró en 2023-2024 con HNSW y construcción paralela. Cuándo PostgreSQL basta para RAG, cómo indexar bien y dónde empieza a sufrir.
SQLite y DuckDB comparten el modelo embedded pero resuelven problemas distintos. OLTP vs OLAP explicados con criterios prácticos para elegir y cuándo usarlas juntas.
ArgoCD ha consolidado GitOps como la práctica deploy estándar en Kubernetes. Cómo aprovecharlo bien y qué errores evitar en producción.
Un service mesh ofrece mTLS, observabilidad y gestión de tráfico transversales. Comparativa entre Istio, Linkerd y Cilium para casos reales.
Backstage es la base open-source de muchos Internal Developer Platforms. Cómo funciona, qué cuesta adoptarlo y cuándo no merece la pena.
eBPF permite ejecutar código seguro dentro del kernel para tracing, networking y seguridad. Por qué es la base de las herramientas modernas de observabilidad.
Las bases vectoriales han pasado de ser experimentales a base de productos LLM. Comparativa pragmática entre las tres opciones más usadas en 2023.
PostgreSQL 16 trae replicación lógica desde standby, mejor paralelismo y observabilidad. Las novedades que realmente importan en producción.
Chroma es la opción más simple para empezar con embeddings y búsqueda semántica. Cuándo brilla, cuándo se queda corta y cómo desplegarla.
Los micro-frontends prometen autonomía de equipo en la UI. Cuándo merece la pena dividir el frontend, qué patrones funcionan y qué cuesta caro.
Platform engineering formaliza el producto interno que los desarrolladores necesitan. Qué es un IDP, qué resuelve y cómo empezar.
Cache-aside, write-through, write-back, TTL bien diseñado. Patrones de caching con Redis que evitan problemas sutiles en producción.
K8s 1.27 estabiliza SeccompDefault, remueve funcionalidades deprecadas y mejora el scheduler. Qué atender al actualizar.
Apache Kafka consolida su papel como backbone de eventos en arquitecturas empresariales. Estado actual, alternativas y patrones maduros.
OpenTelemetry consolida las tres señales de observabilidad bajo un estándar único. Estado actual, integración y camino de adopción.
Vault centraliza secretos con rotación, auditoría y políticas granulares. Guía práctica para equipos que pasan de .env a gestión seria.
Cilium reemplaza iptables con programas eBPF en el kernel, cambiando radicalmente el rendimiento y capacidades de la red en Kubernetes.
Kafka se lleva los titulares, pero RabbitMQ sigue siendo la mejor elección para muchos flujos de mensajería. Guía de decisión práctica.
K8s 1.28 introduce sidecars nativos en alpha. Qué cambia, cómo afecta a service mesh y observabilidad, y cómo prepararse para su GA.
Pixie usa eBPF para instrumentar automáticamente clústeres de Kubernetes sin cambiar el código. Guía práctica y comparativa con Prometheus + Grafana.
Migrar de monolito a microservicios no es solo un cambio técnico: es una decisión organizativa con retos claros en interfaces, orquestación y cultura DevOps.
Arquitectura modular o microservicios: cómo elegir la estructura correcta para tu proyecto según tamaño, equipo y requisitos de escalabilidad.