Artificial Intelligence
Hugging Face TGI: Serving Open Models at Scale
Text Generation Inference es la pila de servicio de Hugging Face para LLM abiertos. Cuándo tiene sentido, qué optimizaciones aporta gratis y sus límites reales.