Inteligencia Artificial

#discord #diseño #ia generativa #imagen generada #midjourney #prompt

Midjourney v5: calidad fotorrealista al alcance del prompt

20 de septiembre de 2023 5 min 274 4,3

Arte generado con Midjourney, ejemplo de la calidad fotorrealista alcanzada con la versión 5 del modelo

Índice de contenidos

Puntos clave
Qué cambia respecto a v4
El parámetro --style raw
Parámetros útiles
Flujo en Discord
Comparativa frente a SDXL y DALL-E 3
Casos de uso en producto
Implicaciones legales
Conclusión
Fuentes

Actualizado: 2026-07-07

Midjourney v5^[1], lanzada en marzo de 2023, ha consolidado su posición como la opción de máxima calidad visual en generación de imágenes por IA. A varios meses de la release, es un buen momento para evaluar qué hace bien, dónde no llega y cómo encaja en flujos profesionales.

Puntos clave

v5 produce fotorrealismo consistente donde v4 fallaba: texturas de piel, luz ambiental y profundidad de campo.
--style raw desactiva el estilo artístico implícito del modelo, algo imprescindible para uso empresarial y fotografía de producto.
Los parámetros --ar, --stylize y --chaos permiten ajustar composición y variabilidad sin cambiar el prompt.
La ausencia de API oficial es la mayor limitación para integrar Midjourney en pipelines automatizados.
Para automatización real, Stable Diffusion XL o DALL-E 3 siguen siendo opciones más prácticas.

Qué cambia respecto a v4

Tres mejoras clave marcan la diferencia:

Fotorrealismo. v5 produce imágenes casi indistinguibles de fotos reales: texturas de piel, luz ambiental y profundidad de campo, los puntos flacos históricos de v4, ahora son consistentes.
Seguimiento de prompt mejorado. Composiciones complejas con múltiples elementos y relaciones espaciales funcionan sin tantas iteraciones.
Manos y texto. Dos talones de Aquiles históricos. v5 no los resuelve perfectamente, pero sí con mucho menos frecuencia de error que v4. Manos con cinco dedos la mayoría de las veces; texto legible en algunos casos, aunque sigue siendo poco fiable para logos.

El parámetro –style raw

Una opción fundamental añadida tras el lanzamiento GA: --style raw. Por defecto, Midjourney aplica un estilo artístico sutil sobre cualquier prompt. Útil para creatividad, pero indeseable cuando se necesita realismo máximo. --style raw desactiva ese estilo y produce salidas más literales al prompt.

Para uso empresarial (fotografía de producto, recreaciones realistas, ilustraciones técnicas), --style raw es casi siempre el mejor punto de partida.

Parámetros útiles

Más allá del texto del prompt, v5 ofrece cuatro parámetros de ajuste principales:

--ar 16:9: relación de aspecto. v5 puede producir en 1:1, 16:9, 3:2, 9:16 y otras proporciones.
--stylize 100-1000 (o --s): intensidad del estilo artístico. 100 = sutil, 1000 = muy marcado. Con --style raw este efecto se reduce.
--chaos 0-100: variabilidad entre las cuatro imágenes que Midjourney genera por prompt. 0 = variaciones consistentes, 100 = muy variadas.
--no X: exclusiones. --no text suele ayudar a evitar texto garabateado en la imagen.

Arte generado con Midjourney que ilustra la capacidad de fotorrealismo y estilo artístico de la versión 5

Flujo en Discord

Midjourney se accede vía Discord^[2], lo que es contraintuitivo para producción profesional. Ventajas e inconvenientes relevantes:

Ventajas: colaboración natural, historial por conversación, sin necesidad de infraestructura propia.
Inconvenientes: sin API oficial (queja muy extendida), difícil de integrar en pipelines automatizados, sujeto a rate limits de Discord.

Herramientas de terceros para automatización existen pero son frágiles y dependen de scraping de la interfaz. Para automatización real, Stable Diffusion o DALL-E 3 siguen siendo más prácticos.

Comparativa frente a SDXL y DALL-E 3

Los tres líderes en generación de imágenes cubren perfiles distintos:

Midjourney v5: mejor calidad estética media, especialmente en estilos artísticos y fotorrealismo. Menor control técnico y sin API oficial.
Stable Diffusion XL: máximo control técnico (LoRA, ControlNet, inpainting), open-source. Requiere más ajuste y hardware propio o API de tercero.
DALL-E 3^[3]: mejor seguimiento de prompts en lenguaje natural, integrado con ChatGPT Plus. Tiene API oficial y coste por imagen.

Para equipos serios de diseño, probar los tres con prompts propios reales antes de decidir es la única validación fiable.

Casos de uso en producto

Tres áreas donde Midjourney v5 añade valor real en entornos profesionales:

Moodboards y concepts visuales. Rapidez para explorar direcciones estéticas antes de fotografía o ilustración profesional.
Marketing y redes sociales. Imágenes de fondo, ilustraciones temáticas, composiciones para campañas.
Prototipado de interfaces. Junto con Figma, ayuda a visualizar estéticas antes del diseño detallado.

Lo que no sustituye: fotografía de producto real (problemas de coherencia visual y legales), dirección creativa profesional e ilustración narrativa compleja.

Implicaciones legales

La licencia de Midjourney establece en sus Terms of Service^[4]:

Usuarios con plan Pro o superior tienen derechos comerciales sobre las imágenes generadas.
Plan gratuito (trial, ahora muy limitado): sin uso comercial.
Midjourney retiene el derecho de usar los prompts e imágenes para entrenar modelos futuros.

Las demandas sobre entrenamiento con imágenes protegidas están en proceso. La situación legal puede evolucionar.

Conclusión

Midjourney v5 es la opción de referencia cuando la calidad estética es la prioridad máxima. Para integración en pipelines, automatización o control técnico fino, Stable Diffusion XL sigue siendo superior. Para seguimiento de prompts complejos en lenguaje natural, DALL-E 3 aporta su diferencial con API oficial. Los tres coexistirán con roles distintos en el ecosistema de IA generativa para imagen.

Esta entrada también está disponible en inglés: Midjourney v5: Photorealistic Quality at Prompt’s Reach.

Midjourney v5: calidad fotorrealista al alcance del prompt

Puntos clave

Qué cambia respecto a v4

El parámetro –style raw

Parámetros útiles

Flujo en Discord

Comparativa frente a SDXL y DALL-E 3

Casos de uso en producto

Implicaciones legales

Conclusión

Fuentes

Comparte este artículo

¿Te ha resultado útil este artículo?

Entradas relacionadas

Qué es Docker Agent, el plugin para crear agentes de IA con YAML

Qué es Open GSD, el flujo Git-Ship-Done para agentes de programación

Qué es un embedding vectorial y para qué sirve

RAG con Postgres y pgvector en producción: del PoC al SLO