Cómo construir un agente productivo con el SDK de Anthropic, paso a paso
Tutorial completo: tool use, streaming, prompt caching, observabilidad y un servidor MCP propio. Repo de referencia incluido.
Categoría
Tutorial completo: tool use, streaming, prompt caching, observabilidad y un servidor MCP propio. Repo de referencia incluido.
Después de un año midiendo cuáles de las herramientas DevOps con IA integradas realmente aportan y cuáles son humo, este es el stack que se queda en mi flujo diario.
La primera factura de un agente en producción suele ser más alta de lo que el equipo esperaba. Este artículo recoge las palancas reales para controlar el coste sin sacrificar calidad.
Opus 4.7 se lanzó como el modelo más capaz de Anthropic con énfasis en trabajo agéntico de horizonte largo. Tras dos meses de uso intensivo, estos son los cambios prácticos frente a Opus 4.6.
Usar un LLM como juez de otro LLM se generalizó en 2024 y sigue siendo la única forma escalable de evaluar calidad cualitativa. La pregunta madura es cuándo fiarse de esos números.
Los agentes fallan. La pregunta no es si, sino cómo y qué haces en los primeros veinte minutos. Este es el runbook que distingue un incidente contenido de una reputación dañada.
El red teaming de modelos de lenguaje ha pasado de actividad esotérica a práctica obligatoria. Con OWASP Agentic Top 10 y CSA Agentic AI Red Teaming Guide convergiendo en un vocabulario común, este es el manual operativo que cualquier equipo que despliegue agentes necesita tener.
Después de año y medio llenando tableros con agentes en producción, la pregunta que separa equipos que envían fiable de los que van a ciegas sigue siendo la misma: ¿cómo mides que el agente está funcionando?
El marco RICE es una metodología de priorización desarrollada por Intercom para decidir qué iniciativas entran en una hoja de ruta y en qué orden.
Prompt engineering ha pasado de ser una colección de trucos virales a una disciplina con patrones reproducibles, librerías dedicadas y herramientas de observabilidad.
Dos años después de los estándares NIST finales, la migración post-cuántica ya no es hipótesis. Qué se ha migrado de verdad, qué sigue atascado, dónde están los problemas operativos reales y cómo se ven los plazos desde abril de 2026.
Tras dos años de pilotos y un año de agentes en producción, la gobernanza ha pasado de comité aspiracional a control operativo. Qué piden las auditorías, qué rompió en 2025 y qué barandillas están absorbiendo la mayoría de los incidentes.