RAG con Postgres y pgvector en producción: del PoC al SLO
Embeddings, indexado HNSW, reranking, evaluación, ventana de contexto y latencia bajo carga. La pila completa con código y SLOs medibles.
Etiqueta
Embeddings, indexado HNSW, reranking, evaluación, ventana de contexto y latencia bajo carga. La pila completa con código y SLOs medibles.
Instalación reproducible de PostgreSQL 16 con pgvector en Debian o Ubuntu, con decisión razonada entre IVFFlat y HNSW y configuración lista para producción.
pgvector maduró en 2023-2024 con HNSW y construcción paralela. Cuándo PostgreSQL basta para RAG, cómo indexar bien y dónde empieza a sufrir.
pgvector convierte PostgreSQL en una base vectorial competente. Por qué la búsqueda semántica necesita índices especializados y cuándo basta con extender Postgres.