RAG with Postgres and pgvector in production: from PoC to SLO

Embeddings, HNSW indexing, reranking, evaluation, context window, latency under load. Full stack with code and measurable SLOs.

June 9, 2026 10 min 143

Artificial Intelligence

EU AI Act 2026: a technical checklist for Spanish CTOs

On 2 August 2026 high-risk, transparency and Commission enforcement powers kick in. A per-system checklist with downloadable template.

May 22, 2026 5 min 211

Artificial Intelligence

Agent observability with OpenTelemetry GenAI semconv in 2026

The OTel GenAI spec stabilizes attributes for LLMs, tools, and agents. Practical Python implementation with Anthropic + Grafana Tempo.

May 18, 2026 12 min 247

Artificial Intelligence

How to install and tune oMLX on M5 Max 128 GB

Tested May 2026 recipe: oMLX 0.3.8 on Mac M5 Max with 128 GB, TurboQuant at 3.5-bit, Qwen 3.6 35B-A3B model stack, Claude Code wiring and real benchmarks.

May 17, 2026 12 min 2.2K 5.0

Artificial Intelligence

Multi-agent systems: LangGraph vs CrewAI vs Autogen in 2026

Three frameworks, three mental models. When to use each and why — with a real orchestration case.

May 14, 2026 12 min 901

Artificial Intelligence

How to build a production-ready agent with the Anthropic SDK, step by step

Full tutorial: tool use, streaming, prompt caching, observability, and your own MCP server. Reference repo included.

May 12, 2026 13 min 411

Artificial Intelligence

Claude Code vs Cursor vs GitHub Copilot in 2026: a comparison with measured tasks

Three production coding agents, five real tasks measured by time, tokens, and PR quality. No marketing — the actual measurement.

May 8, 2026 5 min 929

Artificial Intelligence

MCP (Model Context Protocol) in 2026: the complete guide for engineering teams

After eighteen months of multi-vendor adoption, MCP is the de facto standard for connecting models to tools. The complete guide: architecture, servers, policies, authentication, composition, and the antipatterns we’ve already seen in production.

May 4, 2026 13 min 317

Architecture

MCP as multi-vendor standard: patterns already mature

The Model Context Protocol, proposed by Anthropic in late 2024 and adopted through 2025-2026 by every major vendor, has proven operational patterns. This is the state of the art.

April 28, 2026 3 min 261 4.5

Artificial Intelligence

Mature LLM-as-judge: when to trust and when not

Using an LLM to judge another LLM became widespread in 2024 and remains the only scalable way to evaluate qualitative quality. The mature question is when to trust those numbers.

April 28, 2026 2 min 223 4.7

Artificial Intelligence

Claude Sonnet 4.6 in production: the cost-quality balance

Sonnet 4.6 es el modelo por defecto de la mayoría de cargas de trabajo en 2026. Estos son los casos donde brilla, dónde no basta y por qué sigue siendo el sweet spot.

April 28, 2026 2 min 206 4.3

Architecture

Hybrid RAG in 2026: the patterns that keep winning

Tres años después del boom inicial, el RAG en producción ha convergido en patrones híbridos que combinan búsqueda densa, léxica y reranking. Estos son los que sobreviven al paso del tiempo.

April 28, 2026 3 min 472 4.6

Artificial Intelligence

Claude Opus 4.7 and long-horizon tasks: real changes

Opus 4.7 se lanzó como el modelo más capaz de Anthropic con énfasis en trabajo agéntico de horizonte largo. Tras dos meses de uso intensivo, estos son los cambios prácticos frente a Opus 4.6.

April 28, 2026 3 min 269 4.7

Artificial Intelligence

FinOps on agent tokens: the invoice that surprises

La primera factura de un agente en producción suele ser más alta de lo que el equipo esperaba. Este artículo recoge las palancas reales para controlar el coste sin sacrificar calidad.

April 28, 2026 3 min 225 4.2

Artificial Intelligence

Profitable niche AI startups: the patterns that repeat

Mientras OpenAI y Anthropic acaparan titulares con rondas gigantes, un conjunto creciente de startups de IA de nicho factura millones con equipos de tres a diez personas. Estos son los patrones que comparten.

April 28, 2026 4 min 405 4.7

Artificial Intelligence

Runtime-generated UI: the first serious year

La idea de que la UI se genere sobre la marcha en lugar de ser prediseñada llegó a producción en 2025. Tras un año de casos reales, el balance es más matizado que el entusiasmo inicial.

April 28, 2026 3 min 370 4.2

Artificial Intelligence

DPO and alternatives to RLHF: practical state in 2026

Direct Preference Optimization and its relatives have displaced RLHF as the preferred alignment method in much of the ecosystem. This is the practical state of the field in 2026.

April 28, 2026 3 min 1.1K 4.6

Architecture

Skills and subagents: the agent reuse pattern

Skills package reusable capabilities; subagents isolate bounded-task execution. Together they form the most effective pattern for composing complex agents in 2026.

April 28, 2026 3 min 532 4.3

Artificial Intelligence

Synthetic training data in 2026: when it works

Synthetic data has moved from precarious substitute for real data to central component of modern training. These are the patterns that work and those still failing.

April 28, 2026 2 min 212 4.3

Artificial Intelligence

AI agent incidents: recovery runbooks that work

Los agentes fallan. La pregunta no es si, sino cómo y qué haces en los primeros veinte minutos. Este es el runbook que distingue un incidente contenido de una reputación dañada.

April 28, 2026 4 min 185 4.7

Artificial Intelligence

LLM red teaming: a practical playbook

El red teaming de modelos de lenguaje ha pasado de actividad esotérica a práctica obligatoria. Con OWASP Agentic Top 10 y CSA Agentic AI Red Teaming Guide convergiendo en un vocabulario común, este es el manual operativo que cualquier equipo que despliegue agentes necesita tener.

April 26, 2026 6 min 185 4.2

Artificial Intelligence

Production-grade agent evaluations: the framework that works

Después de año y medio llenando tableros con agentes en producción, la pregunta que separa equipos que envían fiable de los que van a ciegas sigue siendo la misma: ¿cómo mides que el agente está funcionando?

April 22, 2026 7 min 208 4.3

Artificial Intelligence

Prompt Engineering: From Trick to Mature Discipline

Prompt engineering ha pasado de ser una colección de trucos virales a una disciplina con patrones reproducibles, librerías dedicadas y herramientas de observabilidad.

April 17, 2026 5 min 217 4.7

Architecture

Agent OS in production: real cases without the marketing

El concepto de Agent OS pasó del slide al despliegue en 2025. Seis meses en producción dejan patrones visibles: qué arquitecturas funcionan, dónde se rompe el modelo y qué aporta frente a correr agentes sobre pila existente.

April 13, 2026 6 min 229 4.3

Artificial Intelligence

Deploy Llama 3.3 and Mistral locally with Ollama and Open WebUI on Ubuntu 24.04

Step-by-step tutorial in the established jacar.es series: install, GPU setup, quantized models, and secure exposure behind Traefik.

April 12, 2026 3 min 185

Architecture

Enterprise GraphRAG: patterns after a year of adoption

Un año después de que GraphRAG saliera de laboratorio, queda una estadística clara: funciona donde la información corporativa tiene relaciones densas, falla donde solo hay documentos sueltos. Patrones, costes y decisiones de arquitectura que han sobrevivido.

April 7, 2026 6 min 238 4.1

Artificial Intelligence

How to install a local MCP server for your editor

Model Context Protocol ha pasado de propuesta a estándar de facto para conectar editores con herramientas. Guía práctica para levantar un servidor MCP local, conectarlo a VS Code o a tu cliente favorito y entender qué estás exponiendo realmente.

April 4, 2026 6 min 232 4.2

Artificial Intelligence

Enterprise agent governance: the controls that are no longer optional

Tras dos años de pilotos y un año de agentes en producción, la gobernanza ha pasado de comité aspiracional a control operativo. Qué piden las auditorías, qué rompió en 2025 y qué barandillas están absorbiendo la mayoría de los incidentes.

April 1, 2026 6 min 220 4.4

Artificial Intelligence

Lessons from agents in production in 2025: summary for 2026

Durante 2025 cientos de equipos pusieron agentes IA en producción real. A principios de 2026, con datos suficientes, emergen lecciones consistentes sobre qué falla, qué funciona, cuánto cuesta y qué tareas no encajan. Repaso ordenado para equipos que empiezan ahora.

March 26, 2026 5 min 205 4.7

Architecture

Consolidated MCP ecosystem: a quick map for 2026

Dieciséis meses después del anuncio inicial, Model Context Protocol pasó de curiosidad a estándar de facto entre clientes y servidores de agentes. Qué hay disponible, qué servidores merecen la pena, qué problemas siguen abiertos y cómo se parece al mapa de protocolos anteriores.

March 23, 2026 4 min 216 4.2

Artificial Intelligence

European AI Act: full application and lessons from the first cycle

Con la Ley de IA de la Unión Europea en aplicación plena desde agosto de 2026 para los sistemas de alto riesgo, el primer ciclo completo permite sacar conclusiones prácticas. Qué cumplen las empresas sin esfuerzo, qué se está incumpliendo de facto, qué ha costado más y qué ha quedado en letra muerta.

March 14, 2026 5 min 201

Artificial Intelligence

FinOps for AI workloads in 2026: the real pain

La factura de IA en las empresas ha dejado de ser anecdótica. Entre tokens de modelos frontera, GPUs reservadas que nadie usa y pipelines RAG con cachés mal configuradas, muchos equipos pagan diez veces lo que deberían. Guía de FinOps específico para IA sin relatos promocionales.

March 5, 2026 5 min 232 4.4

Artificial Intelligence

Agents that drive the computer: patterns that work

Tras dieciséis meses desde la primera versión de computer use de Anthropic y el empuje paralelo de browser-use, OpenAI Operator y Gemini Control, los agentes que manejan navegador y escritorio han pasado de demo a flujos reales. Toca revisar qué patrones sobreviven cuando los ejecutas todos los días en producción.

March 2, 2026 5 min 235 4.4

Artificial Intelligence

AI incident postmortems: what they have taught us

Una selección de postmortems publicados entre 2025 y 2026 por equipos que operan sistemas con IA en producción revela patrones repetidos: fallos en guardrails, deriva silenciosa de modelos, dependencia oculta del proveedor y una colección de sustos que vale la pena destilar.

February 27, 2026 6 min 239 4.6

Artificial Intelligence

AI startup market correction in 2026

Tres años de valoraciones vertiginosas han empezado a corregirse sin estrépito pero con firmeza: rondas abajo, despidos selectivos y consolidación en torno a propuestas con ingresos reales. Una lectura ordenada de qué sobrevive, qué se quema y qué aprende el ecosistema.

February 21, 2026 5 min 189

Artificial Intelligence

Claude Haiku 4.5: lightweight power for massive agent fleets

Anthropic publicó Haiku 4.5 en octubre de 2025 y el modelo ha madurado rápido: rendimiento cercano a Sonnet 4 en tareas estructuradas a un tercio del coste, ventana amplia y latencia baja. Es la pieza que faltaba para desplegar agentes a escala sin quemar presupuesto.

February 18, 2026 5 min 213

Artificial Intelligence

Knowledge graph renaissance with LLMs

Los grafos de conocimiento llevaban dos décadas esperando su momento. Con los LLM como puente entre texto y ontología, y el patrón GraphRAG ya maduro, la tecnología vuelve al primer plano. Toca revisar por qué ahora sí encaja y dónde conviene usarla.

January 31, 2026 6 min 191 4.4

Artificial Intelligence

UX for agents: first design consensus

Después de dos años viendo cómo cada producto inventaba su propia interfaz para hablar con un agente, en enero de 2026 empieza a emerger un consenso estable sobre qué patrones funcionan, cuáles no y qué espera ya el usuario medio. Toca recoger lo que ha quedado.

January 28, 2026 7 min 232 4.5

Architecture

Agent-to-agent protocols v1: what we have in hand

Seis meses después de que A2A llegara a la Linux Foundation, y tras varios ciclos de implementación por parte de Google, Microsoft y proyectos abiertos, qué significa la versión 1 del protocolo y si ya es seguro construir sobre él.

January 25, 2026 5 min 181 4.4

Artificial Intelligence

Sovereign AI in Europe: practical status

El discurso de la IA soberana europea lleva tres años alimentando titulares, inversiones públicas y acuerdos interestatales. Empezamos a ver qué parte de la promesa tiene sustancia técnica y qué parte sigue siendo narrativa política, con Mistral, Aleph Alpha y la red de supercomputación EuroHPC como ejes.

January 7, 2026 6 min 225 4.1

Architecture

Agent-to-agent protocols: the next open layer

Con MCP resolviendo la conexión entre agente y herramientas, el siguiente cuello de botella aparece: cómo hablan entre sí dos agentes de distintos proveedores. Agent2Agent de Google, donado a la Linux Foundation en 2025, intenta ocupar ese hueco.

December 23, 2025 5 min 219 4.4

Artificial Intelligence

Phi-3 on the edge: Microsoft’s SLM in 2025

Phi-3 es la familia de modelos pequeños de lenguaje que Microsoft viene puliendo desde abril de 2024 con variantes de 3.800 millones, 7.000 millones y 14.000 millones de parámetros. Después de año y medio, el panorama del edge con SLM abiertos se ha vuelto serio y Phi-3 ocupa un sitio claro.

December 20, 2025 5 min 210 4.6

Artificial Intelligence

LLM-generated documentation: when it helps and when it gets in the way

Los modelos grandes de lenguaje llevan dos años prometiendo documentar código, APIs y arquitecturas sin esfuerzo. Después de ver docenas de proyectos intentarlo, hay patrones claros de dónde funciona y dónde acaba siendo una deuda más.

December 17, 2025 6 min 193 4.3

Artificial Intelligence

LLM guardrails: frameworks and their real cost

Los frameworks de guardrails prometen filtrar entradas y salidas de modelos de lenguaje para bloquear fugas de datos, contenido dañino o alucinaciones. Tras evaluar cuatro de los más populares en producción, repaso qué hacen realmente, qué coste en latencia y factura añaden y cuándo compensan frente a controles más simples.

December 11, 2025 4 min 262 4.4

Artificial Intelligence

AI agent observability: what to instrument first

Los agentes que encadenan llamadas a modelos, herramientas y memoria son difíciles de depurar sin una instrumentación pensada para ellos. Después de un año largo operando agentes en producción, repaso qué hay que medir primero, qué estándares están consolidándose y qué errores caros evita tener trazas bien hechas desde el inicio.

December 8, 2025 4 min 204

Architecture

LLM caches: saving tokens without dropping quality

Un proxy con caché delante de un modelo de lenguaje puede reducir la factura de tokens de forma significativa, pero introduce riesgos sutiles si el diseño no es cuidadoso. Qué tipos de caché funcionan en producción, dónde están las trampas habituales y cómo integrarlos sin degradar la experiencia.

November 29, 2025 5 min 186

Architecture

Inference routers: choosing a model based on the request

Un enrutador de inferencia decide qué modelo atiende cada petición en función de coste, latencia y complejidad. Bien diseñados reducen la factura de tokens sin que el usuario perciba degradación; mal diseñados introducen fallos sutiles difíciles de depurar.

November 26, 2025 5 min 190 4.1

Artificial Intelligence

Testing with AI: the determinism problem

Probar sistemas que incluyen modelos de lenguaje rompe la primera regla del testing: la misma entrada da la misma salida. Analizo las estrategias que han funcionado tras un año largo integrando IA en productos reales, por qué los tests deterministas tradicionales no bastan y cómo plantear un cinturón de pruebas que capture regresiones sin bloquearse en la varianza.

November 11, 2025 4 min 176