Claude Sonnet 4.6 in production: the cost-quality balance

Sonnet 4.6 es el modelo por defecto de la mayoría de cargas de trabajo en 2026. Estos son los casos donde brilla, dónde no basta y por qué sigue siendo el sweet spot.

88 5 min April 28, 2026 4.3

Inteligencia Artificial

AI agent incidents: recovery runbooks that work

Los agentes fallan. La pregunta no es si, sino cómo y qué haces en los primeros veinte minutos. Este es el runbook que distingue un incidente contenido de una reputación dañada.

59 8 min April 28, 2026 4.7

Inteligencia Artificial

Production-grade agent evaluations: the framework that works

Después de año y medio llenando tableros con agentes en producción, la pregunta que separa equipos que envían fiable de los que van a ciegas sigue siendo la misma: ¿cómo mides que el agente está funcionando?

80 15 min April 22, 2026 4.3

Arquitectura

Agent OS in production: real cases without the marketing

El concepto de Agent OS pasó del slide al despliegue en 2025. Seis meses en producción dejan patrones visibles: qué arquitecturas funcionan, dónde se rompe el modelo y qué aporta frente a correr agentes sobre pila existente.

99 13 min April 13, 2026 4.5

Inteligencia Artificial

Lessons from agents in production in 2025: summary for 2026

Durante 2025 cientos de equipos pusieron agentes IA en producción real. A principios de 2026, con datos suficientes, emergen lecciones consistentes sobre qué falla, qué funciona, cuánto cuesta y qué tareas no encajan. Repaso ordenado para equipos que empiezan ahora.

83 12 min March 26, 2026 4.7

Arquitectura

SQLite in production: patterns that have aged well

SQLite lleva años ganando terreno en servidores reales gracias a WAL, a proyectos como Litestream y libSQL, y a hardware con discos rápidos. Repaso los patrones que siguen funcionando después de varios años de uso, los que no, y por qué el tamaño medio de una aplicación web se come ya sin despeinarse.

77 11 min November 5, 2025 4.5

Arquitectura

RAG in Production: Patterns That Work and Those That Don’t

Tras dos años de RAG en producción, patrones claros emergen: chunking inteligente, hybrid search, re-ranking, evaluación continua. Qué evitar.

74 12 min September 26, 2024 4.4