GPT-5: disponibilidad pública y primeras impresiones
Actualizado: 2026-05-03
OpenAI publicó GPT-5 a principios de agosto de 2025 después de casi año y medio de rumores, retrasos y expectativas infladas. Tras unas semanas de uso real en proyectos propios y ajenos, las primeras impresiones se pueden ya ordenar. El salto no es el terremoto que el hilo de marketing sugería, pero tampoco es trivial. Es, sobre todo, una versión que consolida líneas ya abiertas por o1 y o3 y las pone al alcance de cualquiera con una cuenta de pago.
Puntos clave
- GPT-5 es la fusión de las familias GPT-4o y o3: un modelo único que adapta cuánto razonamiento aplica según la complejidad del problema.
- El parámetro
reasoning_effort(low / medium / high) permite controlar explícitamente cuánto pensar antes de responder. - Rinde mejor que sus predecesores en razonamiento estructurado, generación de código con contexto multi-fichero y seguimiento de instrucciones largas.
- Para conversación casual, resúmenes o traducciones, la diferencia con GPT-4o es pequeña y el coste extra rara vez se justifica.
- Las alucinaciones siguen existiendo; cualquier dato importante debe verificarse contra una fuente primaria.
- El panorama en agosto de 2025 es de paridad aproximada entre laboratorios: GPT-5 no es claramente superior en todo.
Lo que realmente es GPT-5
La confusión inicial venía de que OpenAI llevaba tiempo ofreciendo dos familias en paralelo:
- GPT-4o y variantes: chat general con multimodal integrado.
- Familia o (o1, o1-mini, o3, o3-mini): razonamiento paso a paso.
GPT-5 es la fusión anunciada de ambas: un modelo único que adapta internamente cuánto razonamiento aplica según la complejidad del problema. En la práctica, la misma llamada a la API puede resolver una suma rápida en menos de un segundo y una demostración matemática compleja gastando treinta segundos de razonamiento interno. El parámetro reasoning_effort, heredado de la familia o, permite control explícito: low, medium y high. Sin este parámetro, el modelo decide por sí mismo.
Dónde rinde mejor
Las tareas donde GPT-5 da un salto claro frente a sus predecesores:
- Razonamiento matemático y lógico a nivel universitario.
- Generación de código que requiere planificación entre varios ficheros: las refactorizaciones coordinadas salen bien a la primera con más frecuencia.
- Análisis de contratos legales con extracción de cláusulas dependientes.
- Seguimiento de instrucciones largas y adherencia a formatos de salida estrictos, un punto frágil de GPT-4o. Si le pides JSON con un esquema concreto, cumple con precisión alta.
Esta mejora en seguimiento de instrucciones tiene implicaciones para quienes construyen agentes: el esfuerzo de validación de salidas se reduce. La discusión de patrones de agentes aparece en seguridad en agentes LLM.
Dónde no cambia tanto
Para conversación casual, resúmenes de correos, borradores de textos o traducciones, la diferencia con GPT-4o es pequeña. Tanto que en muchos flujos el coste adicional de GPT-5 no se justifica. OpenAI lo reconoce implícitamente manteniendo GPT-4o y sus variantes más baratas disponibles. La recomendación de la propia documentación: usar GPT-5 cuando la tarea se beneficia de razonamiento y GPT-4o para conversación estándar.
Las alucinaciones siguen existiendo. Son menos frecuentes y tienden a aparecer en temas más específicos, pero siguen siendo un problema real. El consejo clásico no cambia: cualquier dato importante que salga del modelo debe verificarse contra una fuente primaria.
GPT-5 tampoco resuelve las limitaciones fundamentales de los modelos transformer:
- Sin memoria persistente entre conversaciones distintas por defecto (aunque OpenAI ha añadido un sistema opcional de memoria con consentimiento).
- Ventana de contexto de 400 mil tokens, finita y con degradación de atención en los extremos.
- El modelo no puede ejecutar código por sí mismo: depende de herramientas externas.
Precio y disponibilidad
GPT-5 está disponible en ChatGPT Plus, Pro y Enterprise, y en la API. Los precios publicados en agosto sitúan GPT-5 en torno a ocho veces el coste por token de GPT-4o, con un modelo GPT-5-mini a precio comparable a GPT-4o. La API soporta nativamente salidas estructuradas, llamadas a herramientas paralelas y un modo de respuesta incremental que emite razonamiento y resultado intercalados. Para quienes ya usaban o3 con tool use, la transición es trivial; para quienes venían solo de GPT-4o, hay que adaptar el código.
El panorama competitivo
La aparición de GPT-5 reaviva la pregunta sobre dónde están los rivales. En agosto de 2025 el panorama es de paridad aproximada entre laboratorios, con cada uno destacando en áreas concretas:
- Claude (Anthropic): referente en razonamiento estructurado y contexto largo.
- Gemini 2.5 Pro (Google): ventajas concretas en tareas multimodales.
- Llama 4 (Meta): versiones open-weights que se acercan a GPT-4o en tareas estándar, con la ventaja de correr en hardware propio.
- Grok 4 (xAI): ha subido posiciones en benchmarks específicos.
GPT-5 no es claramente superior en todo. En matemáticas avanzadas, Claude rinde al mismo nivel. En tareas visuales, Gemini tiene ventajas concretas. Para arquitecturas de routing multi-modelo que mezclan proveedores según la tarea, el patrón aparece en LLM routing multi-modelo.
Mi lectura
GPT-5 es una actualización útil pero no imprescindible. Para equipos ya montados sobre GPT-4o con flujos que funcionan, la pregunta correcta no es si migrar sino qué partes del flujo se beneficiarían: las que involucran razonamiento multipaso, generación de código compleja o seguimiento estricto de instrucciones largas. Esas partes pueden moverse a GPT-5 sin cambiar el resto.
Para equipos que están empezando ahora, elegir GPT-5 como modelo por defecto y GPT-5-mini como modelo de volumen es una estrategia razonable. La combinación ofrece un compromiso aceptable entre coste y capacidad.
Lo que ya no tiene sentido en 2025 es usar un solo proveedor para todo: cada tarea tiene su modelo mejor adaptado. Mezclar un modelo abierto local con llamadas puntuales a GPT-5 para los casos que lo requieren es un patrón con economía razonable que se ve cada vez más.