Inteligencia Artificial

#agentes #gpt-5 #ia generativa #llm #modelos lenguaje #openai #razonamiento

GPT-5: disponibilidad pública y primeras impresiones

28 de agosto de 2025 6 min 264 4,4

Índice de contenidos

Puntos clave
Lo que realmente es GPT-5
Dónde rinde mejor
Dónde no cambia tanto
Precio y disponibilidad
El estado de la competencia
Mi lectura
Fuentes

Actualizado: 2026-07-12

OpenAI publicó GPT-5 a principios de agosto de 2025 después de casi año y medio de rumores, retrasos y expectativas infladas. Tras unas semanas de uso real en proyectos propios y ajenos, las primeras impresiones se pueden ya ordenar. El salto no es el terremoto que el hilo de marketing sugería, pero tampoco es trivial. Es, sobre todo, una versión que consolida líneas ya abiertas por o1 y o3 y las pone al alcance de cualquiera con una cuenta de pago.

Puntos clave

GPT-5 es la fusión de las familias GPT-4o y o3: un modelo único que adapta cuánto razonamiento aplica según la complejidad del problema.
El parámetro reasoning_effort (minimal / low / medium / high) permite controlar explícitamente cuánto pensar antes de responder.
Rinde mejor que sus predecesores en razonamiento estructurado, generación de código con contexto multi-fichero y seguimiento de instrucciones largas.
Para conversación casual, resúmenes o traducciones, la diferencia con GPT-4o es pequeña y el coste extra rara vez se justifica.
Las alucinaciones siguen existiendo; cualquier dato importante debe verificarse contra una fuente primaria.
El estado del mercado en agosto de 2025 es de paridad aproximada entre laboratorios: GPT-5 no es claramente superior en todo.

Lo que realmente es GPT-5

La confusión inicial venía de que OpenAI llevaba tiempo ofreciendo dos familias en paralelo:

GPT-4o y variantes: chat general con multimodal integrado.
Familia o (o1, o1-mini, o3, o3-mini): razonamiento paso a paso.

GPT-5 es la fusión anunciada de ambas: un modelo único que adapta internamente cuánto razonamiento aplica según la complejidad del problema. En la práctica, la misma llamada a la API puede resolver una suma rápida en menos de un segundo y una demostración matemática compleja gastando treinta segundos de razonamiento interno. El parámetro reasoning_effort, heredado de la familia o, permite control explícito: minimal, low, medium y high (el nivel minimal apenas razona y prioriza la latencia). Sin este parámetro, el modelo decide por sí mismo.

Dónde rinde mejor

Las tareas donde GPT-5 da un salto claro frente a sus predecesores:

Razonamiento matemático y lógico a nivel universitario.
Generación de código que requiere planificación entre varios ficheros: las refactorizaciones coordinadas salen bien a la primera con más frecuencia.
Análisis de contratos legales con extracción de cláusulas dependientes.
Seguimiento de instrucciones largas y adherencia a formatos de salida estrictos, un punto frágil de GPT-4o. Si le pides JSON con un esquema concreto, cumple con precisión alta.

Esta mejora en seguimiento de instrucciones tiene implicaciones para quienes construyen agentes: el esfuerzo de validación de salidas se reduce. La discusión de patrones de agentes aparece en seguridad en agentes LLM.

Dónde no cambia tanto

Para conversación casual, resúmenes de correos, borradores de textos o traducciones, la diferencia con GPT-4o es pequeña. Tanto que en muchos flujos el coste adicional de GPT-5 no se justifica. OpenAI lo reconoce implícitamente manteniendo GPT-4o y sus variantes más baratas disponibles. La recomendación de la propia documentación: usar GPT-5 cuando la tarea se beneficia de razonamiento y GPT-4o para conversación estándar.

Las alucinaciones siguen existiendo. Son menos frecuentes y tienden a aparecer en temas más específicos, pero siguen siendo un problema real. El consejo clásico no cambia: cualquier dato importante que salga del modelo debe verificarse contra una fuente primaria.

GPT-5 tampoco resuelve las limitaciones fundamentales de los modelos transformer:

Sin memoria persistente entre conversaciones distintas por defecto (aunque OpenAI ha añadido un sistema opcional de memoria con consentimiento).
Ventana de contexto de 400 mil tokens, finita y con degradación de atención en los extremos.
El modelo no puede ejecutar código por sí mismo: depende de herramientas externas.

Precio y disponibilidad

GPT-5 está disponible en el nivel gratuito de ChatGPT y en Plus, Pro, Team y Enterprise, además de la API (anuncio oficial de OpenAI^[1]). El dato que sorprendió en agosto no fue una subida de precio sino lo contrario: la API sitúa el input de GPT-5 en 1,25 $ por millón de tokens, la mitad que GPT-4o, y mantiene el mismo coste de salida (10 $ por millón), con GPT-5-mini en 0,25 $ / 2 $ y GPT-5-nano en 0,05 $ / 0,40 $ (resumen técnico de Simon Willison^[2]; cobertura de precios en TechCrunch^[3]). La ventana de contexto es de 400 mil tokens en total: 272 mil de entrada y hasta 128 mil de salida. La API soporta nativamente salidas estructuradas, llamadas a herramientas paralelas y un modo de respuesta incremental que emite razonamiento y resultado intercalados. Para quienes ya usaban o3 con tool use, la transición es trivial; para quienes venían solo de GPT-4o, hay que adaptar el código.

El estado de la competencia

La aparición de GPT-5 reaviva la pregunta sobre dónde están los rivales. En agosto de 2025 el estado del mercado es de paridad aproximada entre laboratorios, con cada uno destacando en áreas concretas:

Claude (Anthropic): referente en razonamiento estructurado y contexto largo.
Gemini 2.5 Pro (Google): ventajas concretas en tareas multimodales.
Llama 4 (Meta): versiones open-weights que se acercan a GPT-4o en tareas estándar, con la ventaja de correr en hardware propio.
Grok 4 (xAI): ha subido posiciones en benchmarks específicos.

GPT-5 no es claramente superior en todo. En matemáticas avanzadas, Claude rinde al mismo nivel. En tareas visuales, Gemini tiene ventajas concretas. Para arquitecturas de routing multi-modelo que mezclan proveedores según la tarea, el patrón aparece en LLM routing multi-modelo.

Mi lectura

GPT-5 es una actualización útil pero no imprescindible. Para equipos ya montados sobre GPT-4o con flujos que funcionan, la pregunta correcta no es si migrar sino qué partes del flujo se beneficiarían: las que involucran razonamiento multipaso, generación de código compleja o seguimiento estricto de instrucciones largas. Esas partes pueden moverse a GPT-5 sin cambiar el resto.

Para equipos que están empezando ahora, elegir GPT-5 como modelo por defecto y GPT-5-mini como modelo de volumen es una estrategia razonable. La combinación ofrece un compromiso aceptable entre coste y capacidad.

Lo que ya no tiene sentido en 2025 es usar un solo proveedor para todo: cada tarea tiene su modelo mejor adaptado. Mezclar un modelo abierto local con llamadas puntuales a GPT-5 para los casos que lo requieren es un patrón con economía razonable que se ve cada vez más.

Este artículo también está disponible en inglés: GPT-5: public availability and early impressions.

GPT-5: disponibilidad pública y primeras impresiones

Puntos clave

Lo que realmente es GPT-5

Dónde rinde mejor

Dónde no cambia tanto

Precio y disponibilidad

El estado de la competencia

Mi lectura

Fuentes

IA explicada sin humo, en tu correo

Comparte este artículo

¿Te ha resultado útil este artículo?

Entradas relacionadas

Qué es Docker Agent, el plugin para crear agentes de IA con YAML

Qué es Open GSD, el flujo Git-Ship-Done para agentes de programación

Qué es un embedding vectorial y para qué sirve

RAG con Postgres y pgvector en producción: del PoC al SLO