How to install and tune oMLX on M5 Max 128 GB

Tested May 2026 recipe: oMLX 0.3.8 on Mac M5 Max with 128 GB, TurboQuant at 3.5-bit, Qwen 3.6 35B-A3B model stack, Claude Code wiring and real benchmarks.

1.0K 26 min May 17, 2026 5.0

Inteligencia Artificial

FinOps on agent tokens: the invoice that surprises

La primera factura de un agente en producción suele ser más alta de lo que el equipo esperaba. Este artículo recoge las palancas reales para controlar el coste sin sacrificar calidad.

139 7 min April 28, 2026 4.2

Arquitectura

Hybrid RAG in 2026: the patterns that keep winning

Tres años después del boom inicial, el RAG en producción ha convergido en patrones híbridos que combinan búsqueda densa, léxica y reranking. Estos son los que sobreviven al paso del tiempo.

352 5 min April 28, 2026 4.6

Inteligencia Artificial

Synthetic training data in 2026: when it works

Synthetic data has moved from precarious substitute for real data to central component of modern training. These are the patterns that work and those still failing.

142 5 min April 28, 2026 4.3

Inteligencia Artificial

DPO and alternatives to RLHF: practical state in 2026

Direct Preference Optimization and its relatives have displaced RLHF as the preferred alignment method in much of the ecosystem. This is the practical state of the field in 2026.

758 5 min April 28, 2026 4.7

Experiencia de Usuario

Runtime-generated UI: the first serious year

La idea de que la UI se genere sobre la marcha en lugar de ser prediseñada llegó a producción en 2025. Tras un año de casos reales, el balance es más matizado que el entusiasmo inicial.

270 6 min April 28, 2026 4.2

Inteligencia Artificial

LLM red teaming: a practical playbook

El red teaming de modelos de lenguaje ha pasado de actividad esotérica a práctica obligatoria. Con OWASP Agentic Top 10 y CSA Agentic AI Red Teaming Guide convergiendo en un vocabulario común, este es el manual operativo que cualquier equipo que despliegue agentes necesita tener.

123 12 min April 26, 2026 4.3

Inteligencia Artificial

Prompt Engineering: From Trick to Mature Discipline

Prompt engineering ha pasado de ser una colección de trucos virales a una disciplina con patrones reproducibles, librerías dedicadas y herramientas de observabilidad.

149 10 min April 17, 2026 4.7

Inteligencia Artificial

FinOps for AI workloads in 2026: the real pain

La factura de IA en las empresas ha dejado de ser anecdótica. Entre tokens de modelos frontera, GPUs reservadas que nadie usa y pipelines RAG con cachés mal configuradas, muchos equipos pagan diez veces lo que deberían. Guía de FinOps específico para IA sin relatos promocionales.

152 11 min March 5, 2026 4.4

Inteligencia Artificial

Knowledge graph renaissance with LLMs

Los grafos de conocimiento llevaban dos décadas esperando su momento. Con los LLM como puente entre texto y ontología, y el patrón GraphRAG ya maduro, la tecnología vuelve al primer plano. Toca revisar por qué ahora sí encaja y dónde conviene usarla.

122 14 min January 31, 2026 4.4

Inteligencia Artificial

LLM-generated documentation: when it helps and when it gets in the way

Los modelos grandes de lenguaje llevan dos años prometiendo documentar código, APIs y arquitecturas sin esfuerzo. Después de ver docenas de proyectos intentarlo, hay patrones claros de dónde funciona y dónde acaba siendo una deuda más.

133 12 min December 17, 2025 4.3

Inteligencia Artificial

LLM guardrails: frameworks and their real cost

Los frameworks de guardrails prometen filtrar entradas y salidas de modelos de lenguaje para bloquear fugas de datos, contenido dañino o alucinaciones. Tras evaluar cuatro de los más populares en producción, repaso qué hacen realmente, qué coste en latencia y factura añaden y cuándo compensan frente a controles más simples.

154 12 min December 11, 2025 4.4