Hybrid Search: Combining BM25 and Vectors Seriously
El vector puro y la palabra clave pura dejan huecos distintos. La búsqueda híbrida los cubre fusionando BM25 y embeddings con RRF.
Category
Pragmatic software architecture: decisions, trade-offs and patterns that scale.
El vector puro y la palabra clave pura dejan huecos distintos. La búsqueda híbrida los cubre fusionando BM25 y embeddings con RRF.
Anthropic presenta MCP, un estándar abierto para conectar modelos de lenguaje con datos y herramientas. Qué resuelve, cómo se diferencia del function calling y por qué puede convertirse en el LSP de los agentes.
MariaDB 11.7 trajo vector search nativo, mejoras en JSON y optimizaciones de rendimiento. Cómo se diferencia de MySQL 8 y cuándo sigue siendo la elección correcta.
DuckDB es el motor analítico embebido que ha cambiado el panorama. Lee Parquet y CSV directamente, vectoriza la ejecución y cabe dentro de tu proceso Python. Un repaso a cuándo sustituye de verdad a un data warehouse.
Kubernetes 1.30 trae ValidatingAdmissionPolicy en GA, pod scheduling readiness y job success policy. Una release discreta pero útil para quien opera clústeres de verdad.
vLLM se ha convertido en la referencia para servir LLM en GPU. PagedAttention, batching continuo y API compatible con OpenAI. Cómo desplegarlo bien y cuándo compensa.
Tras dos años de RAG en producción, patrones claros emergen: chunking inteligente, hybrid search, re-ranking, evaluación continua. Qué evitar.
Kubecost da visibilidad de coste por namespace, deployment y label. OpenCost es su núcleo OSS. Cuándo compensa y cómo integrar en el workflow de K8s.
Litestream convierte SQLite en una base de datos con backup continuo a S3. Cómo funciona, setup típico y cuándo es mejor que Postgres para apps pequeñas.
Workers + KV + D1 + R2 + Durable Objects conforman un stack edge completo. Qué falta, qué ya funciona y cuándo compite con AWS.
Kubernetes 1.31 no trae fuegos artificiales, pero estabiliza AppArmor, convierte los sidecars en ciudadanos de primera clase y deja DRA a un paso del GA. Repaso desde la óptica de quien opera clústeres.
OpenTelemetry declaró estables las señales de logs en julio de 2024. La tercera pata de la observabilidad moderna por fin se une a métricas y trazas bajo un único protocolo y un modelo de datos común.
El debate sidecar-or-not se resolvió con dos opciones maduras: Istio Ambient y Cilium Mesh. Comparativa operativa y cuál encaja con tu equipo.
Redis cambió a licencia dual en marzo de 2024. Valkey nació como fork BSD respaldado por AWS, Google y la Linux Foundation. Qué implica para usuarios y proyectos.
cAdvisor fue el default histórico pero hoy no basta. Cómo combinar eBPF, Kubernetes metrics y APM para observabilidad real de containers.
PG17 llega con vacuum más eficiente, logical replication con failover y JSON_TABLE estándar. Qué features valen la pena probar en staging y cómo planificar el upgrade.
PostgreSQL 16 cerró las brechas históricas de la replicación lógica. Parallel apply, slots en standby y bidireccionalidad disciplinada la convierten en herramienta de primera línea para migraciones y CDC.
Llevar SCADA a contenedores gana flexibilidad pero abre nuevos vectores de riesgo. Qué funciona, qué no, y cómo gobernar la transición.
Cilium ofrece service mesh sin sidecars gracias a eBPF. Cuándo supera a Linkerd/Istio y cuándo su enfoque novedoso tiene límites.
SQLite en servidores es más viable de lo que crees. WAL, Litestream, LiteFS y patrones que hacen posible escalarla hasta donde muchos Postgres no llegan.
Linkerd apuesta por simplicidad y rendimiento antes que por catálogo de features. Dónde supera a Istio, qué cuesta operarlo y cuándo un service mesh compensa la complejidad.
Instalación reproducible de PostgreSQL 16 con pgvector en Debian o Ubuntu, con decisión razonada entre IVFFlat y HNSW y configuración lista para producción.
Internal Developer Platform es un término con tres grandes opciones. Cuál encaja mejor según el tamaño del equipo y la cultura de plataforma de tu organización.
pgvector maduró en 2023-2024 con HNSW y construcción paralela. Cuándo PostgreSQL basta para RAG, cómo indexar bien y dónde empieza a sufrir.
SQLite y DuckDB comparten el modelo embedded pero resuelven problemas distintos. OLTP vs OLAP explicados con criterios prácticos para elegir y cuándo usarlas juntas.