Claude Opus 4.7 y tareas de horizonte largo: cambios reales
Actualizado: 2026-05-03
Anthropic lanzó Claude Opus 4.7 posicionándolo como su modelo más capaz con particular fortaleza en trabajo agéntico de horizonte largo, trabajo de conocimiento, visión y memoria. Tras dos meses corriéndolo sobre cargas reales en varios equipos, los cambios prácticos frente a Opus 4.6 son más sutiles que lo que sugiere el marketing pero consistentes.
Puntos clave
- Opus 4.7 usa menos herramientas que 4.6 y razona más internamente; esto reduce tokens pero puede cortar demasiado pronto en tareas que requieren información externa.
- El parámetro
effort: extra_highes la palanca principal para trabajo agéntico intenso. - La mejora en horizonte largo es real pero depende de estructura: instrucciones articuladas en fases y subagentes para trabajo acotado.
- Tareas que Sonnet 4.6 resuelve al 95 % de calidad no justifican el coste de Opus 4.7.
- El router que asigna Opus solo cuando la complejidad lo requiere ahorra el 40-70 % del gasto.
Menos llamadas a herramientas, más razonamiento
El cambio de comportamiento más notable: Opus 4.7 tiende a usar menos herramientas que Opus 4.6 y a razonar más internamente. En tareas de exploración de código, esto se traduce en:
- Menos lecturas redundantes del mismo fichero.
- Menos búsquedas con palabras clave similares.
- Más inferencia a partir del contexto ya cargado.
El resultado es menor coste de tokens (menos llamadas a herramientas) y a veces mejores respuestas (más razonamiento sobre lo ya conocido). El matiz: para tareas que genuinamente requieren información externa, esta tendencia puede cortar demasiado pronto. Ahí el parámetro effort funciona como contrapeso.
El parámetro effort como palanca
extra_high es el setting más útil para coding agéntico intenso y trabajo de conocimiento complejo. Aumentar el effort empuja al modelo a:
- Usar herramientas más.
- Razonar más profundamente.
- Producir respuestas más elaboradas.
A cambio de más tiempo y tokens. En migraciones de código grandes o análisis complejos, esta palanca mejora sensiblemente el resultado; en tareas ligeras, subir el effort desperdicia presupuesto.
Regla práctica: tareas con criterio objetivo (compila, pasa tests, migración se ejecuta sin error) toleran effort alto bien; tareas con criterio subjetivo (calidad de prosa, decisiones de diseño) no necesariamente mejoran con más effort y conviene medir antes.
Horizonte largo: cuándo es una ventaja real
La mejora en tareas largas es real pero depende de estructura. Opus 4.7 sostiene coherencia mejor que 4.6 en cadenas de 50-100 pasos si las instrucciones están bien articuladas. En cadenas peor estructuradas, la diferencia es menor.
El patrón que saca el máximo:
- Dividir la tarea en fases explícitas.
- Usar subagentes para trabajo acotado.
- Mantener el contexto del orquestador limpio.
Opus 4.7 ejecuta bien este patrón; sin él, la diferencia con modelos menores se estrecha.
Dónde no conviene
No todo justifica Opus 4.7:
- Tareas que ya resuelve Sonnet 4.6 al 95 % de calidad con menos coste no se benefician del cambio.
- Uso conversacional ligero se sirve mejor con Haiku 4.5.
- El router de modelos que asigna Opus 4.7 solo cuando la complejidad lo justifica ahorra entre el 40 % y el 70 % de gasto sin impacto en calidad.
Conclusión
Claude Opus 4.7 es una mejora incremental con valor real en casos específicos: horizonte largo, coding agéntico con tareas multi-fichero, análisis complejo con razonamiento profundo. Para el resto, sigue siendo excesivo. La madurez es usar Opus donde Opus aporta, Sonnet donde basta, Haiku donde sobra. Saber diferenciar es parte del oficio.