Artificial Intelligence llama.cpp: Optimisations That Keep Surprising llama.cpp es la base silenciosa del LLM local. 2024 trajo speculative decoding, RPC distribuido y backends de GPU renovados. Cuándo usarlo directo y cuándo dejar que Ollama lo envuelva. December 1, 2024 6 min 214 4.5
Artificial Intelligence Ollama in 2024: Running LLMs Locally Without Pain Ollama consolidó como estándar para LLMs locales. Catálogo curado, API compatible con OpenAI, soporte multiplataforma y cuándo usarlo frente a vLLM. November 28, 2024 6 min 172 4.2
Artificial Intelligence Model Quantization and llama.cpp on Your Laptop Con cuantización y llama.cpp se puede ejecutar Llama 2 7B/13B en un portátil moderno. Cómo funciona y qué calidad esperar realmente. November 4, 2023 5 min 219 4.5