vLLM: Serving LLMs in Production with Very High Throughput

vLLM se ha convertido en la referencia para servir LLM en GPU. PagedAttention, batching continuo y API compatible con OpenAI. Cómo desplegarlo bien y cuándo compensa.

158 13 min October 5, 2024 4.5

Inteligencia Artificial

Claude 3.5 Sonnet: The Model That Rewrote Price-Quality Balance

Claude 3.5 Sonnet llegó en junio de 2024 y forzó a todos a repensar. Qué lo hace especial en coding y cómo compara con GPT-4o.

211 9 min October 2, 2024 4.6

Inteligencia Artificial

Mistral Large: European Contender Against GPT-4

Mistral Large 2 cierra la brecha con GPT-4 y Claude desde Europa. Residencia EU, precios, y cuándo elegirlo frente a las alternativas.

115 10 min September 29, 2024 4.7

Arquitectura

RAG in Production: Patterns That Work and Those That Don’t

Tras dos años de RAG en producción, patrones claros emergen: chunking inteligente, hybrid search, re-ranking, evaluación continua. Qué evitar.

145 12 min September 26, 2024 4.4

Inteligencia Artificial

CrewAI: Orchestrating AI Agent Teams

CrewAI modela agentes como un equipo con roles y tareas. Cómo se compara con LangGraph y AutoGen, y cuándo merece la pena adoptar un patrón multi-agente.

132 12 min September 23, 2024 4.6

Desarrollo de Software

OpenAI Assistants API: Stateful Agents Without Your Own Infrastructure

La Assistants API ofrece threads persistentes, tool calling y file search gestionados por OpenAI. Analizamos cuándo compensa frente a Chat Completions más lógica propia.

116 12 min September 17, 2024 4.4

Inteligencia Artificial

EU AI Act: What Changes for Your Company

La Ley de IA de la UE entró en vigor en agosto de 2024. Qué significa para productos con IA, categorías de riesgo y plazos de cumplimiento reales.

117 10 min September 8, 2024

Cómo Instalar

How to Install Ollama on macOS with Apple Silicon

Instalar Ollama en un Mac con Apple Silicon, elegir el modelo adecuado según la RAM disponible y exponer la API local para integrarla con tus aplicaciones.

486 11 min August 6, 2024 4.1

Herramientas

GitLab Duo: AI Assistants Integrated in Your Pipeline

GitLab Duo añade IA al flujo devops completo: code completion, chat, explicación de vulnerabilidades. Cuándo compensa frente a Copilot más tooling separado.