Ollama en 2024: ejecutar LLM localmente sin dolor

Ollama consolidó como estándar para LLMs locales. Catálogo curado, API compatible con OpenAI, soporte multiplataforma y cuándo usarlo frente a vLLM.

28 de noviembre de 2024 6 min 198 4,2

Arquitectura

Model Context Protocol: la propuesta abierta de Anthropic

Anthropic presenta MCP, un estándar abierto para conectar modelos de lenguaje con datos y herramientas. Qué resuelve, cómo se diferencia del function calling y por qué puede convertirse en el LSP de los agentes.

25 de noviembre de 2024 7 min 218 4,6

Inteligencia Artificial

Product-market fit en la era de la IA: lo que cambia

Las reglas del product-market fit han cambiado en la era de la IA. Baseline de calidad alto, moats distintos y nuevas métricas. Una guía pragmática para evaluar PMF en productos con LLM.

22 de noviembre de 2024 10 min 251 4,2

Tecnología

eBPF para profiling continuo: Parca y Beyla

Profiling 24/7 en todo el clúster sin instrumentar aplicaciones. Parca, Grafana Beyla y Pyroscope conforman el stack moderno de observabilidad de rendimiento.

19 de noviembre de 2024 8 min 312 4,3

Tecnología

NIST PQC: los estándares de criptografía post-cuántica

NIST publicó los primeros estándares PQC en agosto de 2024: ML-KEM, ML-DSA y SLH-DSA. Qué significa para tu stack de seguridad y cómo prepararse para la transición.

16 de noviembre de 2024 8 min 3,9K 4,4

Arquitectura

MariaDB 11.7: el fork que mantiene su propio camino

MariaDB 11.7 trajo vector search nativo, mejoras en JSON y optimizaciones de rendimiento. Cómo se diferencia de MySQL 8 y cuándo sigue siendo la elección correcta.

13 de noviembre de 2024 7 min 184 4,4

Inteligencia Artificial

Observabilidad de LLM: trazas, costes y calidad

Las aplicaciones LLM necesitan observabilidad específica: trazas de prompt/respuesta, costes de tokens y métricas de calidad. Herramientas y patrones para 2024.

10 de noviembre de 2024 8 min 232

Desarrollo de Software

Rust 1.75 y 1.76: mejoras que se notan en el día a día

Rust 1.75 estabilizó async fn en traits y return-position impl Trait. Rust 1.76 mejoró el debug info y los tipos de puntero. Releases iterativas que acumulan ergonomía real.

7 de noviembre de 2024 7 min 201 4,3

Inteligencia Artificial

TensorRT-LLM: aceleración extrema en GPUs NVIDIA para LLM

TensorRT-LLM es el techo de rendimiento para inferencia LLM en NVIDIA. Complejo de desplegar pero 2-3x más rápido que vLLM en casos óptimos. Cuándo merece la complejidad.

4 de noviembre de 2024 7 min 199

Arquitectura

DuckDB: analítica rápida sin mover los datos

DuckDB es el motor analítico embebido que ha cambiado el panorama. Lee Parquet y CSV directamente, vectoriza la ejecución y cabe dentro de tu proceso Python. Un repaso a cuándo sustituye de verdad a un data warehouse.

1 de noviembre de 2024 7 min 182 4,4