RAG with Postgres and pgvector in production: from PoC to SLO

Embeddings, HNSW indexing, reranking, evaluation, context window, latency under load. Full stack with code and measurable SLOs.

June 9, 2026 10 min 143

Artificial Intelligence

How to build a production-ready agent with the Anthropic SDK, step by step

Full tutorial: tool use, streaming, prompt caching, observability, and your own MCP server. Reference repo included.

May 12, 2026 13 min 411

Artificial Intelligence

Mature LLM-as-judge: when to trust and when not

Using an LLM to judge another LLM became widespread in 2024 and remains the only scalable way to evaluate qualitative quality. The mature question is when to trust those numbers.

April 28, 2026 2 min 223 4.7

Artificial Intelligence

Claude Opus 4.7 and long-horizon tasks: real changes

Opus 4.7 se lanzó como el modelo más capaz de Anthropic con énfasis en trabajo agéntico de horizonte largo. Tras dos meses de uso intensivo, estos son los cambios prácticos frente a Opus 4.6.

April 28, 2026 3 min 269 4.7

Artificial Intelligence

FinOps on agent tokens: the invoice that surprises

La primera factura de un agente en producción suele ser más alta de lo que el equipo esperaba. Este artículo recoge las palancas reales para controlar el coste sin sacrificar calidad.

April 28, 2026 3 min 225 4.2

Methodologies

AI-integrated DevOps tools in my daily flow

Después de un año midiendo cuáles de las herramientas DevOps con IA integradas realmente aportan y cuáles son humo, este es el stack que se queda en mi flujo diario.

April 28, 2026 4 min 273 4.0

Artificial Intelligence

AI agent incidents: recovery runbooks that work

Los agentes fallan. La pregunta no es si, sino cómo y qué haces en los primeros veinte minutos. Este es el runbook que distingue un incidente contenido de una reputación dañada.

April 28, 2026 4 min 185 4.7

Artificial Intelligence

LLM red teaming: a practical playbook

El red teaming de modelos de lenguaje ha pasado de actividad esotérica a práctica obligatoria. Con OWASP Agentic Top 10 y CSA Agentic AI Red Teaming Guide convergiendo en un vocabulario común, este es el manual operativo que cualquier equipo que despliegue agentes necesita tener.

April 26, 2026 6 min 185 4.2

Artificial Intelligence

Production-grade agent evaluations: the framework that works

Después de año y medio llenando tableros con agentes en producción, la pregunta que separa equipos que envían fiable de los que van a ciegas sigue siendo la misma: ¿cómo mides que el agente está funcionando?

April 22, 2026 7 min 208 4.3

Methodologies

RICE: a prioritization framework for product roadmaps

El marco RICE es una metodología de priorización desarrollada por Intercom para decidir qué iniciativas entran en una hoja de ruta y en qué orden.

April 18, 2026 3 min 220 4.1

Artificial Intelligence

Prompt Engineering: From Trick to Mature Discipline

Prompt engineering ha pasado de ser una colección de trucos virales a una disciplina con patrones reproducibles, librerías dedicadas y herramientas de observabilidad.

April 17, 2026 5 min 217 4.7

Methodologies

Post-quantum migration: what is actually happening

Dos años después de los estándares NIST finales, la migración post-cuántica ya no es hipótesis. Qué se ha migrado de verdad, qué sigue atascado, dónde están los problemas operativos reales y cómo se ven los plazos desde abril de 2026.

April 10, 2026 5 min 222 4.0

Artificial Intelligence

Enterprise agent governance: the controls that are no longer optional

Tras dos años de pilotos y un año de agentes en producción, la gobernanza ha pasado de comité aspiracional a control operativo. Qué piden las auditorías, qué rompió en 2025 y qué barandillas están absorbiendo la mayoría de los incidentes.

April 1, 2026 6 min 220 4.4

Artificial Intelligence

Lessons from agents in production in 2025: summary for 2026

Durante 2025 cientos de equipos pusieron agentes IA en producción real. A principios de 2026, con datos suficientes, emergen lecciones consistentes sobre qué falla, qué funciona, cuánto cuesta y qué tareas no encajan. Repaso ordenado para equipos que empiezan ahora.

March 26, 2026 5 min 205 4.7

Architecture

Consolidated platform engineering: who wins and who gets stuck

Tres años después de que platform engineering se convirtiera en palabra de moda, el polvo ha caído. Unas pocas empresas tienen plataformas internas que de verdad aceleran al desarrollo, muchas montaron un portal Backstage vacío y algunas volvieron a DevOps clásico. Análisis de qué distingue a las que ganaron.

March 11, 2026 5 min 190

Artificial Intelligence

FinOps for AI workloads in 2026: the real pain

La factura de IA en las empresas ha dejado de ser anecdótica. Entre tokens de modelos frontera, GPUs reservadas que nadie usa y pipelines RAG con cachés mal configuradas, muchos equipos pagan diez veces lo que deberían. Guía de FinOps específico para IA sin relatos promocionales.

March 5, 2026 5 min 232 4.4

Artificial Intelligence

Agents that drive the computer: patterns that work

Tras dieciséis meses desde la primera versión de computer use de Anthropic y el empuje paralelo de browser-use, OpenAI Operator y Gemini Control, los agentes que manejan navegador y escritorio han pasado de demo a flujos reales. Toca revisar qué patrones sobreviven cuando los ejecutas todos los días en producción.

March 2, 2026 5 min 235 4.4

Artificial Intelligence

AI incident postmortems: what they have taught us

Una selección de postmortems publicados entre 2025 y 2026 por equipos que operan sistemas con IA en producción revela patrones repetidos: fallos en guardrails, deriva silenciosa de modelos, dependencia oculta del proveedor y una colección de sustos que vale la pena destilar.

February 27, 2026 6 min 239 4.6

Methodologies

Product discovery with AI: practices that stick

Dos años de experimentación con modelos generativos aplicados a descubrimiento de producto han dejado prácticas concretas útiles y otras tantas que se descartan. Un repaso honesto de qué ha funcionado, qué ha fracasado y cómo incorporar IA al ciclo de discovery sin corromper sus fundamentos.

February 24, 2026 5 min 206

Methodologies

Carbon-aware scheduling by default: first balance

A principios de 2026, varias plataformas de orquestación incluyen carbon-aware scheduling como opción por defecto o muy visible. Con meses de datos reales, toca evaluar si la promesa de reducir emisiones sin dañar rendimiento se cumple y en qué escenarios.

February 12, 2026 6 min 217 4.3

Methodologies

SRE with AI: dashboards that actually help

Los cuadros de mando con IA llevan un par de años prometiendo detección de anomalías mágica y causa raíz automática. La realidad es más modesta pero también más útil, si se sabe separar el ruido del valor real. Repaso honesto de qué funciona y qué no.

February 3, 2026 6 min 195 4.3

Artificial Intelligence

LLM-generated documentation: when it helps and when it gets in the way

Los modelos grandes de lenguaje llevan dos años prometiendo documentar código, APIs y arquitecturas sin esfuerzo. Después de ver docenas de proyectos intentarlo, hay patrones claros de dónde funciona y dónde acaba siendo una deuda más.

December 17, 2025 6 min 193 4.3

Artificial Intelligence

LLM guardrails: frameworks and their real cost

Los frameworks de guardrails prometen filtrar entradas y salidas de modelos de lenguaje para bloquear fugas de datos, contenido dañino o alucinaciones. Tras evaluar cuatro de los más populares en producción, repaso qué hacen realmente, qué coste en latencia y factura añaden y cuándo compensan frente a controles más simples.

December 11, 2025 4 min 262 4.4

Artificial Intelligence

AI agent observability: what to instrument first

Los agentes que encadenan llamadas a modelos, herramientas y memoria son difíciles de depurar sin una instrumentación pensada para ellos. Después de un año largo operando agentes en producción, repaso qué hay que medir primero, qué estándares están consolidándose y qué errores caros evita tener trazas bien hechas desde el inicio.

December 8, 2025 4 min 204

Architecture

Platform engineering: consolidation after the boom

Después de tres años de expansión y de un ecosistema sobreexcitado alrededor del término, platform engineering llega a 2025 en una fase de consolidación. Las plataformas internas que sobreviven son las que entendieron su función real, las que confundieron el nombre con la solución están desmantelando sus equipos o recortándolos drásticamente.

November 20, 2025 4 min 164

Artificial Intelligence

Testing with AI: the determinism problem

Probar sistemas que incluyen modelos de lenguaje rompe la primera regla del testing: la misma entrada da la misma salida. Analizo las estrategias que han funcionado tras un año largo integrando IA en productos reales, por qué los tests deterministas tradicionales no bastan y cómo plantear un cinturón de pruebas que capture regresiones sin bloquearse en la varianza.

November 11, 2025 4 min 176

Methodologies

Carbon-aware computing: now the default behavior

Hace tres años era una curiosidad académica. Hoy, planificar cargas por intensidad de carbono de la red eléctrica es una opción integrada en Kubernetes, en los servicios de contenedores de los grandes proveedores y en varios schedulers de CI. Repasamos qué cambió y qué hacer con esa capacidad.

September 9, 2025 7 min 176 4.6

Methodologies

User research in the age of generative AI

Los equipos de producto están tentados de sustituir entrevistas y tests reales por síntesis de IA. Dos años de experiencia ya permiten separar dónde la IA ayuda de verdad y dónde genera una falsa sensación de entender al usuario.

August 22, 2025 5 min 183 4.3

Methodologies

Migrating SSH to post-quantum cryptography: a practical guide

OpenSSH lleva un año ofreciendo intercambio de claves híbrido con ML-KEM. La pregunta ya no es si migrar, sino cómo hacerlo sin romper clientes antiguos ni dejar huecos en la cadena de conexión.

August 16, 2025 5 min 366 4.4

Artificial Intelligence

Computer Use in production: agents that drive the interface

Casi nueve meses después del lanzamiento de Computer Use, algunos equipos lo han llevado a producción para tareas reales. Dónde funciona, dónde todavía no conviene, y qué patrones están emergiendo para que un agente que maneja ratón y teclado no acabe siendo más problema que solución.

July 14, 2025 7 min 193 4.5

Artificial Intelligence

Continuous integration with AI agents: early patterns

Los agentes de IA empiezan a tener un hueco serio en los pipelines de integración continua: revisar diffs, proponer arreglos, generar tests que faltan. Seis meses de uso real para separar los patrones que funcionan de los que acaban costando más tiempo del que ahorran.

July 8, 2025 7 min 219 4.4

Methodologies

Continuous profiling with eBPF in production

El profiling continuo ha salido del terreno experimental y se ha vuelto una herramienta habitual en sistemas con tráfico real. Repaso qué aporta eBPF frente a instrumentación clásica, qué cuesta y cuándo compensa instalarlo.

June 8, 2025 6 min 179 4.5

Methodologies

The Site Reliability Workbook: patterns we still use

Han pasado siete años desde que Google publicó el Workbook, y buena parte del libro no ha envejecido. Repaso los patrones que de verdad aplicamos en equipos pequeños y los que resultaron ser cultura de campus.

June 5, 2025 6 min 164

Artificial Intelligence

FinOps applied to AI: where the cost really goes

Llevar FinOps a cargas de IA obliga a repensar lo que funcionaba en nube tradicional. Los costes no vienen solo de instancias EC2; vienen de tokens, llamadas de herramientas, reindexados y experimentos fallidos.

May 15, 2025 5 min 189 4.0

Artificial Intelligence

Continuous evaluation of RAG: dashboards that actually matter

Un sistema RAG sin evaluación continua se degrada en silencio. Los índices cambian, los modelos se actualizan, los usuarios preguntan cosas nuevas. Este es un repaso práctico de qué métricas vigilar y cómo montar el cuadro de mando que avisa antes del incidente.

May 9, 2025 6 min 181 4.3

Methodologies

VEX: filtering vulnerability noise with context

Después de años acumulando SBOMs, el cuello de botella es filtrar qué CVEs afectan de verdad. VEX aparece como la pieza que convierte el ruido en señal, y en 2025 empieza a tener adopción real en pipelines de supply chain.

April 3, 2025 6 min 169 4.5

Artificial Intelligence

AI agents in the enterprise: from demo to measurable value

Los agentes de IA han pasado de ser un tema de laboratorio a tener SDKs serios en tres grandes proveedores. Reflexión sobre cómo pasar de la demo llamativa a un caso de uso interno que mueva una métrica real.

March 31, 2025 6 min 198 4.4

Methodologies

Semgrep: modern SAST in your pipeline

Semgrep ha crecido hasta convertirse en uno de los análisis estáticos más pragmáticos del ecosistema. Reflexión sobre por qué funciona donde otros SAST fracasan y cómo meterlo en un pipeline sin que se convierta en ruido.

March 25, 2025 6 min 181 4.5

Methodologies

Zero Trust integrated with SIEM: what actually works

Dos años después de que Zero Trust dejase de ser palabra de marketing, toca mirar cómo conecta con el SIEM del día a día. Reflexión sobre señales útiles, ruido evitable y decisiones que de verdad cambian la postura de seguridad.

March 22, 2025 6 min 218 4.5

Artificial Intelligence

AI governance in enterprise: committees, policies, audits

Con las primeras obligaciones del AI Act europeo ya en vigor, la gobernanza de la IA en empresa deja de ser teórica. Qué comités montar, qué políticas escribir y qué auditar, desde la experiencia de varias implantaciones.

March 13, 2025 6 min 185

Methodologies

Dependabot and Renovate: two approaches to updating dependencies

Dependabot y Renovate persiguen lo mismo pero con filosofías distintas. Comparo ambos tras años usándolos en proyectos propios y de cliente, y repaso cuándo uno aprieta mejor y cuándo el otro se adapta más al flujo del equipo.

March 1, 2025 4 min 195 4.6

Artificial Intelligence

Open-weight models in enterprise: one year on

Hace un año los pesos abiertos eran una apuesta; hoy son una opción de producción real. Repaso lo que ha funcionado, lo que no y cómo están encajando Llama, DeepSeek, Qwen y Mistral en arquitecturas empresariales que antes dependían de APIs cerradas.

February 26, 2025 4 min 164 4.3

Methodologies

Pair programming with AI in 2025: habits that stick

Dos años después de convivir con asistentes de IA en el editor, los hábitos se han asentado. Reflexión sobre qué ha cambiado en el día a día de programar, qué se ha aprendido y qué quedaba por descubrir.

February 17, 2025 5 min 143 4.3

Artificial Intelligence

Alignment evaluation: RLHF, DPO, and recent alternatives

Tres años después de que RLHF se hiciera popular, el paisaje del alineamiento de modelos es más rico. Repaso de RLHF, DPO y los métodos más recientes como KTO o ORPO, con criterios para elegir.

February 8, 2025 5 min 337

Methodologies

SLSA v1.0: a mature framework for the software supply chain

SLSA lleva año y medio en su versión 1.0 y el ecosistema ha tenido tiempo de adoptarlo. Repaso de lo que funciona, lo que sigue costando y por dónde tiene sentido empezar.

December 31, 2024 5 min 156 4.5

Artificial Intelligence

How to Evaluate a RAG System Without Fooling Yourself

Medir la calidad de un sistema RAG es más sutil de lo que parece. Métricas, conjuntos dorados y los errores más comunes al evaluar.

December 28, 2024 5 min 187 4.3

Methodologies

Green Software Principles: A Checklist for Teams

El software consume energía. Reducir su huella de carbono no es solo virtud — es ahorro operativo. Ocho principios prácticos aplicables desde mañana.

December 16, 2024 4 min 199 4.6

Artificial Intelligence

LLM Observability: Traces, Costs, and Quality

Las aplicaciones LLM necesitan observabilidad específica: trazas de prompt/respuesta, costes de tokens y métricas de calidad. Herramientas y patrones para 2024.

November 10, 2024 5 min 204