o1-preview: el modelo de OpenAI que piensa antes de responder
OpenAI presentó o1 en septiembre de 2024. Un modelo que razona internamente antes de contestar. Qué cambia y cuándo merece la pena el coste adicional.
Categoría
Inteligencia artificial sin hype: modelos, agentes y casos de uso que funcionan en producción.
OpenAI presentó o1 en septiembre de 2024. Un modelo que razona internamente antes de contestar. Qué cambia y cuándo merece la pena el coste adicional.
El vector puro y la palabra clave pura dejan huecos distintos. La búsqueda híbrida los cubre fusionando BM25 y embeddings con RRF.
llama.cpp es la base silenciosa del LLM local. 2024 trajo speculative decoding, RPC distribuido y backends de GPU renovados. Cuándo usarlo directo y cuándo dejar que Ollama lo envuelva.
Ollama consolidó como estándar para LLMs locales. Catálogo curado, API compatible con OpenAI, soporte multiplataforma y cuándo usarlo frente a vLLM.
Anthropic presenta MCP, un estándar abierto para conectar modelos de lenguaje con datos y herramientas. Qué resuelve, cómo se diferencia del function calling y por qué puede convertirse en el LSP de los agentes.
Las reglas del product-market fit han cambiado en la era de la IA. Baseline de calidad alto, moats distintos y nuevas métricas. Una guía pragmática para evaluar PMF en productos con LLM.
Las aplicaciones LLM necesitan observabilidad específica: trazas de prompt/respuesta, costes de tokens y métricas de calidad. Herramientas y patrones para 2024.
TensorRT-LLM es el techo de rendimiento para inferencia LLM en NVIDIA. Complejo de desplegar pero 2-3x más rápido que vLLM en casos óptimos. Cuándo merece la complejidad.
LoRA reduce el coste del fine-tuning de forma dramática. QLoRA va aún más allá combinando cuantización y adaptadores de bajo rango. Cómo funcionan, cuándo usarlos y qué calidad esperar.
Anthropic lanzó Computer Use en octubre de 2024: Claude controla el escritorio. Qué funciona, qué no, y las implicaciones reales para automatización.
Copilot Workspace propone un desarrollo orientado a tareas: describe el problema, la IA planifica e implementa. Cómo compara con Cursor Composer y dónde encaja en el flujo de trabajo real.
OpenAI publicó Swarm como framework experimental y educativo para sistemas multi-agente. Patrones que emergen y comparación con CrewAI y LangGraph.