llm – Jacar

Vista Tarjetas

Modo Infinito

Por página Por lote 24

Inteligencia Artificial

Cómo instalar oMLX en M5 Max 128 GB y exprimirlo al máximo

Receta probada en mayo de 2026: oMLX 0.3.8 en Mac M5 Max con 128 GB, TurboQuant a 3,5-bit, stack Qwen 3.6 35B-A3B, wiring para Claude Code y benchmarks reales.

17 de mayo de 2026 14 min 2,7K 5,0

Experiencia de Usuario

UI generada en tiempo real: primer año en serio

La idea de que la UI se genere sobre la marcha en lugar de ser prediseñada llegó a producción en 2025. Tras un año de casos reales, el balance es más matizado que el entusiasmo inicial.

28 de abril de 2026 4 min 396 4,2

Inteligencia Artificial

DPO y alternativas a RLHF: estado práctico en 2026

Direct Preference Optimization y sus primas han desplazado a RLHF como alineamiento preferido en gran parte del ecosistema. Este es el estado práctico del campo en 2026.

28 de abril de 2026 3 min 1,2K 4,6

Inteligencia Artificial

Datos sintéticos para entrenamiento en 2026: cuándo funcionan

Los datos sintéticos han dejado de ser sustituto precario de datos reales para convertirse en componente central del entrenamiento moderno. Estos son los patrones probados y los que todavía fallan.

28 de abril de 2026 3 min 239 4,3

RAG híbrido en 2026: los patrones que siguen ganando

Tres años después del boom inicial, el RAG en producción ha convergido en patrones híbridos que combinan búsqueda densa, léxica y reranking. Estos son los que sobreviven al paso del tiempo.

28 de abril de 2026 3 min 519 4,6

Inteligencia Artificial

FinOps de tokens en agentes: la cuenta que sorprende

La primera factura de un agente en producción suele ser más alta de lo que el equipo esperaba. Este artículo recoge las palancas reales para controlar el coste sin sacrificar calidad.

28 de abril de 2026 4 min 263 4,2

Inteligencia Artificial

LLM red teaming: manual práctico

El red teaming de modelos de lenguaje ha pasado de actividad esotérica a práctica obligatoria. Con OWASP Agentic Top 10 y CSA Agentic AI Red Teaming Guide convergiendo en un vocabulario común, este es el manual operativo que cualquier equipo que despliegue agentes necesita tener.

26 de abril de 2026 7 min 195 4,2

Inteligencia Artificial

Prompt engineering: de truco a disciplina madura

Prompt engineering ha pasado de ser una colección de trucos virales a una disciplina con patrones reproducibles, librerías dedicadas y herramientas de observabilidad.

17 de abril de 2026 5 min 244 4,7

Inteligencia Artificial

FinOps para cargas de IA en 2026: el dolor real

La factura de IA en las empresas ha dejado de ser anecdótica. Entre tokens de modelos frontera, GPUs reservadas que nadie usa y pipelines RAG con cachés mal configuradas, muchos equipos pagan diez veces lo que deberían. Guía de FinOps específico para IA sin relatos promocionales.

5 de marzo de 2026 7 min 255 4,4

Inteligencia Artificial

Renacimiento del grafo de conocimiento con LLM

Los grafos de conocimiento llevaban dos décadas esperando su momento. Con los LLM como puente entre texto y ontología, y el patrón GraphRAG ya maduro, la tecnología vuelve al primer plano. Toca revisar por qué ahora sí encaja y dónde conviene usarla.

31 de enero de 2026 8 min 214 4,4

Inteligencia Artificial

Documentación automática con LLM: cuándo aporta y cuándo molesta

Los modelos grandes de lenguaje llevan dos años prometiendo documentar código, APIs y arquitecturas sin esfuerzo. Después de ver docenas de proyectos intentarlo, hay patrones claros de dónde funciona y dónde acaba siendo una deuda más.

17 de diciembre de 2025 7 min 211 4,3

Inteligencia Artificial

Guardrails en LLM: frameworks y su coste real

Los frameworks de guardrails prometen filtrar entradas y salidas de modelos de lenguaje para bloquear fugas de datos, contenido dañino o alucinaciones. Tras evaluar cuatro de los más populares en producción, repaso qué hacen realmente, qué coste en latencia y factura añaden y cuándo compensan frente a controles más simples.

11 de diciembre de 2025 9 min 326 4,4

Inteligencia Artificial

Observabilidad de agentes de IA: qué instrumentar primero

Los agentes que encadenan llamadas a modelos, herramientas y memoria son difíciles de depurar sin una instrumentación pensada para ellos. Después de un año largo operando agentes en producción, repaso qué hay que medir primero, qué estándares están consolidándose y qué errores caros evita tener trazas bien hechas desde el inicio.

8 de diciembre de 2025 9 min 220

Cachés para LLM: ahorrar tokens sin tirar la calidad

Un proxy con caché delante de un modelo de lenguaje puede reducir la factura de tokens de forma significativa, pero introduce riesgos sutiles si el diseño no es cuidadoso. Qué tipos de caché funcionan en producción, dónde están las trampas habituales y cómo integrarlos sin degradar la experiencia.

29 de noviembre de 2025 6 min 205

Enrutadores de inferencia: elegir modelo según la petición

Un enrutador de inferencia decide qué modelo atiende cada petición en función de coste, latencia y complejidad. Bien diseñados reducen la factura de tokens sin que el usuario perciba degradación; mal diseñados introducen fallos sutiles difíciles de depurar.

26 de noviembre de 2025 6 min 209 4,1

Inteligencia Artificial

Testing con IA: el problema del determinismo

Probar sistemas que incluyen modelos de lenguaje rompe la primera regla del testing: la misma entrada da la misma salida. Analizo las estrategias que han funcionado tras un año largo integrando IA en productos reales, por qué los tests deterministas tradicionales no bastan y cómo plantear un cinturón de pruebas que capture regresiones sin bloquearse en la varianza.

11 de noviembre de 2025 8 min 193

Agent OS: el concepto que está moldeando la nueva capa

El término Agent OS lleva un año ganando tracción entre investigación y producto. Describe una capa que va más allá de una biblioteca de agentes: planificador, gestión de contexto, memoria persistente y aislamiento. Una lectura del estado real de ese concepto.

12 de octubre de 2025 6 min 279 4,5

Model Context Protocol en 2025: del anuncio al ecosistema

Model Context Protocol cumple diez meses desde su anuncio de Anthropic y ya no es una propuesta: hay cientos de servidores, implementaciones cruzadas entre proveedores y un registro público. Repaso de qué ha funcionado, qué sigue flojo y por qué 2025 marca el paso de curiosidad a infraestructura básica.

21 de septiembre de 2025 8 min 268 4,4

Inteligencia Artificial

GPT-5: disponibilidad pública y primeras impresiones

Tras meses de rumores, OpenAI publicó GPT-5 a principios de agosto. Las primeras semanas de uso real dejan una imagen menos espectacular que el marketing y más útil que lo que muchos esperaban. Vale la pena separar lo nuevo de lo incremental.

28 de agosto de 2025 6 min 194 4,4

SLM en el edge industrial: cuando el modelo pequeño es mejor

Los modelos pequeños de lenguaje se han vuelto útiles de verdad. Phi-3.5, Gemma 2 o Llama 3.2 caben en dispositivos modestos y resuelven tareas acotadas sin salir a la nube. Repaso de dónde encajan en planta y cuándo compensa saltarse el modelo grande.

1 de agosto de 2025 8 min 194 4,2

Inteligencia Artificial

RAG 2.0: grafos de conocimiento, vectores e híbrido

El RAG de 2023 era búsqueda vectorial con un LLM detrás. El de 2025 es un sistema híbrido que combina vectores, búsqueda léxica y grafos de conocimiento. Qué ha cambiado, dónde funciona cada pieza y qué decisiones marcan la diferencia entre un RAG útil y uno decepcionante.

17 de julio de 2025 8 min 305 4,2

Inteligencia Artificial

Gemini 2.5: escalado de contexto y multimodalidad

Google publicó Gemini 2.5 Pro en vista previa en marzo y la versión general llegó en junio. El salto respecto a Gemini 2.0 no está solo en puntuaciones sino en dos frentes prácticos: ventana de contexto utilizable en serio y multimodalidad que deja de ser demostración para convertirse en herramienta.

29 de junio de 2025 7 min 262 4,3

Inteligencia Artificial

Familia Claude 4 inicial: primeras pruebas de calidad

Anthropic presentó Claude Opus 4 y Claude Sonnet 4 el 22 de mayo de 2025, el primer salto grande de nomenclatura desde la serie 3.5. Un mes de uso real en código, documentación técnica y agentes para separar lo que ha mejorado de lo que sigue igual.

23 de junio de 2025 6 min 200 4,3

Inteligencia Artificial

La era del grafo de conocimiento renace con los LLM

Durante una década los grafos de conocimiento fueron una idea académica con pocos casos vivos. Los LLM han cambiado esa ecuación: ahora sirven para anclar respuestas, auditar razonamiento y sostener agentes sin alucinar.

21 de mayo de 2025 6 min 214 4,5