Evaluación de alineamiento: RLHF, DPO y alternativas recientes

Tres años después de que RLHF se hiciera popular, el paisaje del alineamiento de modelos es más rico. Repaso de RLHF, DPO y los métodos más recientes como KTO o ORPO, con criterios para elegir.

8 de febrero de 2025 7 min 366

Inteligencia Artificial

Gemma 2: el modelo abierto de Google un año después

Google publicó Gemma 2 a mediados de 2024 y ya lleva tiempo en uso real. Balance de cómo compite en el ecosistema de modelos abiertos, qué tamaños tienen sentido y dónde ha cuajado su adopción.

5 de febrero de 2025 6 min 195 4,2

Inteligencia Artificial

o3 en público: el salto en razonamiento se confirma

La serie o3 de OpenAI empieza a estar disponible y marca un cambio real en razonamiento complejo. Análisis de dónde brilla, dónde sigue fallando y qué cambia para quien construye productos con LLMs.

2 de febrero de 2025 6 min 197 4,4

Inteligencia Artificial

Gemini 2.0: herramientas integradas y modo agente

Google ha lanzado Gemini 2.0 con un énfasis claro en uso de herramientas y agentes. Repaso de qué aporta, dónde está por detrás de la competencia y en qué tipo de aplicaciones encaja mejor.

30 de enero de 2025 6 min 190 4,5

Inteligencia Artificial

NPU en el PC: IA local más rápida y barata

Los procesadores Copilot+ de Qualcomm, Intel y AMD han normalizado la presencia de una NPU en el PC doméstico. Qué cambia realmente para ejecutar modelos en local y cuándo merece la pena.

6 de enero de 2025 6 min 191 4,5

Inteligencia Artificial

LoRA y QLoRA: fine-tuning eficiente al alcance de un solo portátil

LoRA reduce el coste del fine-tuning de forma dramática. QLoRA va aún más allá combinando cuantización y adaptadores de bajo rango. Cómo funcionan, cuándo usarlos y qué calidad esperar.

29 de octubre de 2024 7 min 255 4,6

Inteligencia Artificial

Claude 3.5 Sonnet: el modelo que reescribió el equilibrio precio-calidad

Claude 3.5 Sonnet llegó en junio de 2024 y forzó a todos a repensar. Qué lo hace especial en coding y cómo compara con GPT-4o.

2 de octubre de 2024 6 min 429 4,6

Inteligencia Artificial

Mistral Large: el contendiente europeo frente a GPT-4

Mistral Large 2 cierra la brecha con GPT-4 y Claude desde Europa. Residencia EU, precios, y cuándo elegirlo frente a las alternativas.

29 de septiembre de 2024 6 min 201 4,7

Desarrollo de Software

Decodificación restringida para salidas estructuradas en LLM

Outlines, Guidance e Instructor obligan al modelo a emitir JSON válido en el propio paso de generación. Cuándo ganan frente a reintentos y function calling.

26 de abril de 2024 7 min 303 4,7

Tecnología

Microsoft 365 Copilot: La Herramienta de Asistencia Técnica

Microsoft 365 Copilot integra modelos de lenguaje grande en Word, Excel, Teams y Outlook. Qué puede hacer realmente, cómo funciona y qué deben saber los equipos antes de desplegarlo.

18 de marzo de 2023 6 min 191 4,4

Tecnología

GitHub Copilot: El futuro de la programación AI

GitHub Copilot usa IA para sugerir código en tiempo real mientras programas. Cómo funciona, cuándo ayuda de verdad, cuándo no, y qué implica para el oficio de programar.

18 de marzo de 2023 6 min 154