nomic-embed-text: embeddings abiertos competitivos

Nomic liberó un modelo de embeddings con pesos, datos y código abiertos que rivaliza con text-embedding-3-small de OpenAI. Por qué importa y dónde encaja.

122 9 min mayo 5, 2024 4,5

Inteligencia Artificial

Gemini 1.5: contexto de millones de tokens en producción

Gemini 1.5 Pro demostró que el contexto de un millón de tokens es real. Qué cambia en RAG y arquitecturas cuando el modelo puede procesar un libro entero.

98 9 min febrero 26, 2024 4,4

Inteligencia Artificial

text-embedding-3 de OpenAI: qué cambia respecto al anterior

OpenAI liberó text-embedding-3 con calidad superior y dimensiones variables. Cómo aprovechar lo nuevo sin rehacer toda la pila RAG ni presupuestar mal el reindexado.

125 10 min enero 27, 2024 4,5

Arquitectura

pgvector en 2024: índices HNSW y escalado real

pgvector maduró en 2023-2024 con HNSW y construcción paralela. Cuándo PostgreSQL basta para RAG, cómo indexar bien y dónde empieza a sufrir.

126 12 min enero 21, 2024 4,4

Inteligencia Artificial

Cohere Embed v3: multilingüe y orientado a empresa

Cohere Embed v3 añadió señales de calidad de documento y mantuvo su foco multilingüe. Cómo compara con OpenAI y cuándo encaja mejor en un pipeline RAG.

121 9 min enero 9, 2024 4,2

Arquitectura

Bases de datos vectoriales: Qdrant, Pinecone y Weaviate

Las bases vectoriales han pasado de ser experimentales a base de productos LLM. Comparativa pragmática entre las tres opciones más usadas en 2023.

141 10 min noviembre 13, 2023 4,4

Arquitectura

pgvector: búsqueda semántica sin salir de Postgres

pgvector convierte PostgreSQL en una base vectorial competente. Por qué la búsqueda semántica necesita índices especializados y cuándo basta con extender Postgres.

121 12 min noviembre 1, 2023

Desarrollo de Software

LangChain: el framework para orquestar aplicaciones con LLM

LangChain unifica la construcción de aplicaciones con LLM: prompts, retrievers, agentes y memoria. Cuándo ayuda y cuándo añade complejidad innecesaria.