Saltar al contenido
lunes, abril 20, 2026
Entradas recientes
  • Pair programming con IA en 2025: hábitos que quedan
  • vLLM en 2025: las mejoras que importan a quien sirve LLM
  • GraphRAG de Microsoft en empresa: patrones que funcionan
  • Evaluación de alineamiento: RLHF, DPO y alternativas recientes
  • Gemma 2: el modelo abierto de Google un año después

Jacar

Pasión por la tecnología

  • es
    • en

Etiqueta: gpu

vLLM en 2025: las mejoras que importan a quien sirve LLM

febrero 14, 2025 javi
Tarjetas gráficas GPU alineadas en un chasis abierto con luces azules

vLLM se ha consolidado como el motor de serving de LLM más adoptado en producción. Repaso de las mejoras recientes, qué cambia para quien lo opera y qué sigue siendo punto débil.

Leer más
Inteligencia Artificial 

TensorRT-LLM: aceleración en GPUs NVIDIA para LLM

noviembre 4, 2024 javi
Chip de procesador iluminado en verde neón representando GPU de alta performance

TensorRT-LLM es el ceiling de rendimiento en GPUs NVIDIA. Compleja pero 2-3x faster que vLLM en casos óptimos.

Leer más
Inteligencia Artificial 

vLLM: servir LLM en producción con altísimo throughput

octubre 5, 2024 javi
Tarjeta gráfica GPU con iluminación azul en entorno de servidor

vLLM se ha convertido en la referencia para servir LLM en GPU. PagedAttention, batching continuo y API compatible con OpenAI. Cómo desplegarlo bien y cuándo compensa.

Leer más
Arquitectura Inteligencia Artificial 

Zed: un editor moderno pensado para la colaboración

febrero 23, 2024 javi
Pantalla de editor con código en tema oscuro y alta densidad de líneas

Zed es el editor de los creadores de Atom reescrito desde cero en Rust. Cuándo es una alternativa seria a VS Code y qué colaboración ofrece de verdad.

Leer más
Desarrollo de Software Herramientas 

TGI de Hugging Face: servir modelos abiertos a escala

enero 3, 2024 javi
Procesador chip de silicio en primer plano representando hardware de inferencia

Text Generation Inference es la pila de servicio de Hugging Face para LLM. Cuándo tiene sentido, qué optimizaciones da gratis y sus límites reales.

Leer más
Inteligencia Artificial 

Entradas recientes

  • Pair programming con IA en 2025: hábitos que quedan
  • vLLM en 2025: las mejoras que importan a quien sirve LLM
  • GraphRAG de Microsoft en empresa: patrones que funcionan
  • Evaluación de alineamiento: RLHF, DPO y alternativas recientes
  • Gemma 2: el modelo abierto de Google un año después
  • o3 en público: el salto en razonamiento se confirma
  • Gemini 2.0: herramientas integradas y modo agente
  • Home lab: el laboratorio autoalojado como campo de pruebas
  • Full-stack TypeScript en 2025: lo bueno, lo regular, lo malo
  • WASI preview 3: hilos y async en WebAssembly
  • Code review asistido por IA: adopción honesta
  • Llama 3.2 en el edge: Meta apuesta por lo pequeño
  • Cloudflare Workers en 2025: del edge a la empresa
  • Generics en Go: tres años después, qué ha sobrevivido
  • NPU en el PC: IA local más rápida y barata

Copyright © Todos los derechos reservados

Usamos cookies para asegurar que te damos la mejor experiencia en nuestra web. Si continúas usando este sitio, asumiremos que estás de acuerdo con ello. Pulsa en "Aceptar todo" si estás de acuerdo.
Ajustes de CookiesAceptar Todo
Manage consent

Privacy Overview

This website uses cookies to improve your experience while you navigate through the website. Out of these, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may affect your browsing experience.
Necessary
Siempre activado
Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.
Functional
Functional cookies help to perform certain functionalities like sharing the content of the website on social media platforms, collect feedbacks, and other third-party features.
Performance
Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.
Analytics
Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics the number of visitors, bounce rate, traffic source, etc.
Advertisement
Advertisement cookies are used to provide visitors with relevant ads and marketing campaigns. These cookies track visitors across websites and collect information to provide customized ads.
Others
Other uncategorized cookies are those that are being analyzed and have not been classified into a category as yet.
GUARDAR Y ACEPTAR