NVIDIA alternatives in 2026: where the market is heading

NVIDIA domina el entrenamiento de IA, pero la inferencia tiene cada vez más alternativas viables. Este es el mapa del ecosistema en 2026.

158 5 min April 28, 2026 4.7

Inteligencia Artificial

FinOps for AI workloads in 2026: the real pain

La factura de IA en las empresas ha dejado de ser anecdótica. Entre tokens de modelos frontera, GPUs reservadas que nadie usa y pipelines RAG con cachés mal configuradas, muchos equipos pagan diez veces lo que deberían. Guía de FinOps específico para IA sin relatos promocionales.

74 11 min March 5, 2026 4.4

Tecnología

NVIDIA Blackwell GPUs: what changes for training

Los primeros racks GB200 NVL72 llevan meses en manos de los hiperescalares y ya empiezan a verse mediciones públicas. La generación Blackwell no es una mejora incremental sobre Hopper, sino un cambio en la forma de entrenar modelos grandes. Repasamos qué cambia y qué no.

49 14 min September 6, 2025 4.6

Inteligencia Artificial

vLLM in 2025: the improvements that matter to LLM-serving teams

vLLM se ha consolidado como el motor de serving de LLM más adoptado en producción. Repaso de las mejoras recientes, qué cambia para quien lo opera y qué sigue siendo punto débil.

59 11 min February 14, 2025 4.5

Inteligencia Artificial

TensorRT-LLM: Extreme Acceleration on NVIDIA GPUs for LLMs

TensorRT-LLM es el techo de rendimiento para inferencia LLM en NVIDIA. Complejo de desplegar pero 2-3x más rápido que vLLM en casos óptimos. Cuándo merece la complejidad.

64 11 min November 4, 2024

Arquitectura

vLLM: Serving LLMs in Production with Very High Throughput

vLLM se ha convertido en la referencia para servir LLM en GPU. PagedAttention, batching continuo y API compatible con OpenAI. Cómo desplegarlo bien y cuándo compensa.

61 13 min October 5, 2024 4.5

Desarrollo de Software

Zed: A Modern Editor Built for Collaboration

Zed es el editor de los creadores de Atom reescrito desde cero en Rust. Cuándo es una alternativa seria a VS Code y qué colaboración ofrece de verdad.

55 9 min February 23, 2024 4.4

Inteligencia Artificial

Hugging Face TGI: Serving Open Models at Scale

Text Generation Inference es la pila de servicio de Hugging Face para LLM abiertos. Cuándo tiene sentido, qué optimizaciones aporta gratis y sus límites reales.

85 9 min January 3, 2024 4.4