Saltar al contenido
lunes, abril 20, 2026
Entradas recientes
  • eBPF para profiling continuo: Parca y Beyla
  • NIST PQC: los finalistas de criptografía post-cuántica
  • MariaDB 11.7: el fork que mantiene su propio camino
  • Observabilidad de LLM: trazas, costes y calidad
  • Rust 1.75 y 1.76: mejoras que se notan en el día a día

Jacar

Pasión por la tecnología

  • es
    • en

Etiqueta: rag

RAG en producción: patrones que funcionan y los que no

septiembre 26, 2024 javi
Bibliotecas con estanterías de libros digitales representando recuperación de información

Tras dos años de RAG, patrones claros emergen: chunking inteligente, hybrid search, re-ranking, evaluación continua. Qué evitar.

Leer más
Arquitectura Inteligencia Artificial 

OpenAI Assistants API: agentes con estado sin infraestructura propia

septiembre 17, 2024 javi
Interfaz de asistente digital sobre pantalla moderna en tema oscuro

Assistants API simplifica agents con threads persistentes, tool calling y file search. Cuándo compensa vs chat completions + logic propia.

Leer más
Desarrollo de Software Inteligencia Artificial 

Re-ranking en RAG: la pieza que sube la calidad de verdad

julio 10, 2024 javi
Gráfica con columnas coloridas ordenadas representando reordenación de resultados

Embeddings solo no es suficiente. Un re-ranker sobre top-100 suele subir precision 15-30%. Cuándo y cómo integrar sin drama.

Leer más
Inteligencia Artificial 

nomic-embed-text: embeddings abiertos competitivos

mayo 5, 2024 javi
Puntos de datos conectados en patrón de red azul representando espacio vectorial

Nomic liberó un modelo de embeddings open source que rivaliza con los de OpenAI. Cuándo usarlo, comparativa y cómo integrar en tu RAG.

Leer más
Inteligencia Artificial 

Gemini 1.5: contexto de millones de tokens en producción

febrero 26, 2024 javi
Abstracción de puntos de datos luminosos en gradiente de color representando contexto amplio

Gemini 1.5 Pro demostró que el contexto de un millón de tokens es real. Qué cambia en RAG y arquitecturas cuando el modelo se puede tragar un libro entero.

Leer más
Inteligencia Artificial 

text-embedding-3 de OpenAI: qué cambia respecto al anterior

enero 27, 2024 javi
Red neuronal abstracta con puntos conectados en gradiente de colores

OpenAI liberó text-embedding-3 con calidad superior y el truco de dimensiones variables. Cómo aprovechar lo nuevo sin rehacer toda la pila RAG.

Leer más
Inteligencia Artificial 

pgvector en 2024: índices HNSW y escalado real

enero 21, 2024 javi
Nodos interconectados en red azul representando grafos de búsqueda vectorial

pgvector 0.5 añadió HNSW y cambió la conversación. Cuándo PostgreSQL con pgvector es suficiente, cómo indexar bien y dónde empieza a sufrir.

Leer más
Arquitectura Inteligencia Artificial 

Cohere Embed v3: multilingüe y orientado a empresa

enero 9, 2024 javi
Conexiones de red multicolor representando embeddings multilingües

Cohere Embed v3 añadió un ranking interno de calidad de documentos y mantuvo su foco multilingüe. Cómo compara con OpenAI y cuándo encaja mejor.

Leer más
Inteligencia Artificial 

Bases de datos vectoriales: Qdrant, Pinecone y Weaviate

noviembre 13, 2023 javi
Pantalla con visualización abstracta de datos en clusters

Las bases vectoriales han pasado de ser experimentales a base de productos LLM. Comparativa pragmática entre las tres opciones más usadas en 2023.

Leer más
Arquitectura Inteligencia Artificial 

pgvector: busqueda semantica sin salir de Postgres

noviembre 1, 2023 javi
Servidor de base de datos con luces parpadeando

pgvector convierte PostgreSQL en una base vectorial competente. Cuándo elegirlo frente a Qdrant o Pinecone y cómo configurarlo bien.

Leer más
Arquitectura Inteligencia Artificial 

Navegación de entradas

Entradas anteriores

Entradas recientes

  • eBPF para profiling continuo: Parca y Beyla
  • NIST PQC: los finalistas de criptografía post-cuántica
  • MariaDB 11.7: el fork que mantiene su propio camino
  • Observabilidad de LLM: trazas, costes y calidad
  • Rust 1.75 y 1.76: mejoras que se notan en el día a día
  • TensorRT-LLM: aceleración en GPUs NVIDIA para LLM
  • DuckDB: analítica rápida sin mover los datos
  • LoRA y QLoRA: fine-tuning eficiente al alcance de un solo portátil
  • Figma Dev Mode: del diseño al código con menos fricciones
  • Computer Use de Claude: cuando el agente mueve el ratón
  • GitHub Copilot Workspace: la IDE conversacional de GitHub
  • Edge computing industrial: latencia baja donde ocurre el dato
  • Swarm: el experimento de OpenAI para agentes multi-rol
  • Trivy y Grype un año después: cual ha madurado mejor
  • Kubernetes 1.30: mejoras que agradecen los operadores

Copyright © Todos los derechos reservados

Usamos cookies para asegurar que te damos la mejor experiencia en nuestra web. Si continúas usando este sitio, asumiremos que estás de acuerdo con ello. Pulsa en "Aceptar todo" si estás de acuerdo.
Ajustes de CookiesAceptar Todo
Manage consent

Privacy Overview

This website uses cookies to improve your experience while you navigate through the website. Out of these, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may affect your browsing experience.
Necessary
Siempre activado
Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.
Functional
Functional cookies help to perform certain functionalities like sharing the content of the website on social media platforms, collect feedbacks, and other third-party features.
Performance
Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.
Analytics
Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics the number of visitors, bounce rate, traffic source, etc.
Advertisement
Advertisement cookies are used to provide visitors with relevant ads and marketing campaigns. These cookies track visitors across websites and collect information to provide customized ads.
Others
Other uncategorized cookies are those that are being analyzed and have not been classified into a category as yet.
GUARDAR Y ACEPTAR