Cómo generar imágenes con IA desde la línea de comandos en 2026

Cada imagen de marketing que creas sigue el mismo ciclo: abres Canva o Midjourney, escribes un prompt, esperas, descargas, reformateas, subes a otro lado. Si produces más de unas pocas imágenes por semana, esas pestañas del navegador y cambios de contexto suman horas perdidas.
Hay una forma más rápida. Si ya trabajas en una terminal, puedes generar imágenes con IA desde la línea de comandos, descargarlas y conectarlas directamente a tu flujo de publicación. Un comando por imagen. Sin navegador. Sin arrastrar y soltar.
Esta guía cubre el flujo de trabajo práctico: qué modelos usar, cómo escribir prompts efectivos y cómo pasar de un prompt de texto a una imagen publicada en redes sociales en menos de 60 segundos usando Wonda CLI.
Puntos clave
- Wonda CLI te da acceso a múltiples modelos de generación de imágenes con un solo comando
generate image- La elección del modelo depende de tu caso de uso: fotos de producto fotorrealistas, ilustraciones, gráficos con texto o iteraciones rápidas
- Las imágenes generadas por CLI se conectan directamente a flujos de edición y publicación, eliminando el ciclo de descargar-subir-reformatear
- La generación por lotes con scripts de shell te permite producir decenas de variaciones en minutos
¿Por qué generar imágenes desde la terminal?
El argumento para la generación de imágenes basada en CLI no es una preferencia estética. Es eficiencia operativa.
Un flujo de trabajo de marketing típico requiere de cinco a seis herramientas: una herramienta de diseño para la creación, un servicio de almacenamiento en la nube para los assets, una herramienta de programación para la distribución y pestañas separadas del navegador para cada plataforma. Cada cambio de herramienta cuesta entre 30 y 60 segundos de cambio de contexto, y las investigaciones demuestran de forma reiterada que el cambio de contexto reduce la productividad entre un 20 y un 40 por ciento.
La generación basada en CLI comprime el pipeline:
- Generar — un comando produce la imagen
- Editar (opcional) — añadir texto superpuesto, redimensionar o ajustar
- Publicar — enviar directamente a Instagram, TikTok o descargar localmente
Son tres pasos en lugar de doce. Y como cada paso es un comando, puedes scriptear todo el pipeline para producción por lotes.

Si ya leíste No necesitas aprender la CLI: deja que Claude Code ejecute Wonda por ti, sabes que Claude Code puede traducir peticiones en lenguaje natural a comandos de Wonda. Esta guía va un nivel más profundo: los comandos reales, los flags y la lógica de selección de modelos.
¿Qué modelos de imagen deberías usar?
Wonda expone múltiples modelos de imagen a través de un solo comando generate image. El modelo correcto depende de lo que necesites.
Empieza con el modelo por defecto
NanoBanana 2 (nano-banana-2) es el punto de partida por defecto y cubre bien la mayoría de los casos de uso cotidianos de marketing: fotos de producto, imágenes lifestyle, visuales para redes sociales e iteraciones rápidas.
wonda generate image \
--model nano-banana-2 \
--prompt "flat lay of skincare products on white marble, soft diffused lighting, editorial product photography" \
--aspect-ratio 1:1 \
--wait -o product-shot.pngSube el nivel para imágenes de mayor calidad
NanoBanana Pro (nano-banana-pro) es la opción cuando quieres más pulido para una imagen principal, visual de landing page o asset de campaña importante.
wonda generate image \
--model nano-banana-pro \
--prompt "coffee shop interior, morning light streaming through windows, warm tones, shallow depth of field, editorial photography" \
--aspect-ratio 16:9 \
--wait -o hero-image.pngPara imágenes con texto
GPT Image 1.5 (gpt-image-1-5) es la opción correcta cuando la imagen necesita texto legible, como tarjetas de citas, gráficos promocionales o assets sociales con mucho texto.
wonda generate image \
--model gpt-image-1-5 \
--prompt "minimalist social media graphic with text 'Ship Faster' in bold sans-serif, dark background, neon green accent" \
--aspect-ratio 9:16 \
--wait -o text-graphic.pngPara un look diferente o una alternativa
Si quieres un estilo visual distinto, o NanoBanana no cumple con el brief, cambia de modelo en vez de forzar el mismo prompt una y otra vez. grok-imagine es una alternativa útil para imágenes más estilizadas o con dirección artística más evidente.
wonda generate image \
--model grok-imagine \
--prompt "abstract geometric pattern, brand colors blue and white, clean background" \
--aspect-ratio 1:1 \
--wait -o test-variation.pngCómo escribir prompts de imagen efectivos
La diferencia entre una imagen de IA mediocre y una usable casi siempre está en el prompt. Estas son las reglas que producen mejores resultados de forma sistemática.
Sé específico con la composición
Malo: "una foto de café"
Bueno: "vista cenital de un setup de pour-over en cerámica sobre mesa de madera, una sola taza de café, granos esparcidos, luz suave de mañana desde la izquierda, espacio negativo mínimo"
El prompt específico le indica al modelo el ángulo de cámara (cenital), la composición (flat lay), los materiales (cerámica, madera), la dirección de iluminación (desde la izquierda) y el uso del espacio (espacio negativo mínimo).
Describe el estilo, no solo el sujeto
Incluye siempre pistas de estilo visual: "fotografía editorial de producto", "color grading cinematográfico", "diseño gráfico minimalista", "estilo documental". Estas frases llevan el resultado de genérico a intencional.
Usa la relación de aspecto con intención
- 1:1 — Feed de Instagram, catálogo de productos
- 9:16 — Instagram Stories, TikTok, anuncios verticales
- 16:9 — Imágenes hero de blog, thumbnails de YouTube, anuncios horizontales
- 4:5 — Posts retrato de Instagram (la proporción con mayor engagement)
# Instagram Story
wonda generate image --model nano-banana-2 \
--prompt "your prompt" --aspect-ratio 9:16 --wait -o story.png
# Blog hero
wonda generate image --model nano-banana-pro \
--prompt "your prompt" --aspect-ratio 16:9 --wait -o hero.pngGeneración por lotes: produce decenas de variaciones en minutos
Aquí es donde la generación basada en CLI tiene una ventaja clara sobre las herramientas en el navegador. Un simple bucle en bash puede producir 10 o 50 variaciones mientras haces otra cosa.
#!/bin/bash
# generate-variations.sh — Batch generate ad creative variations
PROMPTS=(
"ceramic coffee mug, morning light, minimal background, product photography"
"ceramic coffee mug, overhead angle, scattered beans, warm tones"
"ceramic coffee mug held in two hands, bokeh background, cozy"
"ceramic coffee mug on wooden desk, laptop in background, workspace"
"ceramic coffee mug with latte art, close-up macro, shallow DOF"
)
for i in "${!PROMPTS[@]}"; do
echo "Generating variation $((i+1))..."
wonda generate image \
--model nano-banana-2 \
--prompt "${PROMPTS[$i]}" \
--aspect-ratio 1:1 \
--wait -o "variation-$((i+1)).png"
done
echo "Done — $((${#PROMPTS[@]})) variations generated."Este enfoque encaja directamente con la estrategia de marketing basado en volumen que supera a los enfoques de creatividad única. En vez de pasar una hora perfeccionando una imagen, genera diez variaciones en cinco minutos y deja que los datos de engagement elijan la ganadora.
De imagen a publicación: el pipeline completo
El verdadero poder está en encadenar la generación con el resto del flujo de trabajo de Wonda. Aquí tienes un pipeline completo desde el prompt hasta una publicación de Instagram:
# 1. Generate the image
JOB_ID=$(wonda generate image \
--model nano-banana-2 \
--prompt "flat lay of new product launch, clean white background, editorial" \
--aspect-ratio 4:5 \
--wait --quiet)
# 2. Get the media reference
MEDIA_ID=$(wonda jobs get inference "$JOB_ID" --jq '.outputs[0].media.mediaId')
# 3. Publish to Instagram
ACCOUNT_ID=$(wonda accounts instagram --jq '.[0].id')
wonda publish instagram \
--media "$MEDIA_ID" \
--account "$ACCOUNT_ID" \
--caption "New drop. Available now. Link in bio. #productlaunch #newrelease" \
--product IMAGE \
--share-to-feedTres comandos. Del prompt a la publicación. Sin abrir una sola pestaña del navegador.
Para el flujo completo de automatización de Instagram con más detalle sobre pies de foto y programación, consulta Cómo automatizar publicaciones en Instagram desde la terminal.
De imagen a vídeo: encadena con generación de vídeo
Las imágenes generadas con IA no son solo resultados finales. Son inputs para flujos de trabajo de vídeo. Genera una imagen de producto y luego anímala en un anuncio en vídeo:
# Generate the reference image
IMG_JOB=$(wonda generate image \
--model nano-banana-pro \
--prompt "sleek wireless headphones on a reflective surface, studio lighting, product hero shot" \
--aspect-ratio 9:16 --wait --quiet)
IMG_MEDIA=$(wonda jobs get inference "$IMG_JOB" --jq '.outputs[0].media.mediaId')
# Animate it into a 5-second video
VID_JOB=$(wonda generate video \
--model kling_3_pro \
--attach "$IMG_MEDIA" \
--prompt "slow camera push-in, subtle reflections shifting on the surface, ambient lighting pulse" \
--duration 5 --aspect-ratio 9:16 --wait --quiet)Este pipeline de imagen a vídeo se cubre en profundidad en Guía para desarrolladores sobre generación de vídeo con IA en 2026. El punto clave: las imágenes generadas por CLI fluyen directamente a la generación de vídeo sin manipulación manual de archivos.
Errores comunes a evitar
Prompts demasiado cortos. "Una foto de producto" no le da al modelo nada con qué trabajar. Especifica composición, iluminación, ángulo, estilo y atmósfera.
Ignorar la relación de aspecto. Generar una imagen 1:1 cuando necesitas 9:16 significa que pierdes resolución al recortarla. Define la relación de aspecto en el momento de la generación.
Usar un solo modelo para todo. GPT Image 1.5 maneja mejor el texto. NanoBanana es la opción por defecto. NanoBanana Pro y Grok Imagine son mejores cuando quieres un look diferente o más pulido. Ajusta el modelo a la tarea.
No generar por lotes. Si generas imágenes de una en una en un navegador, estás desaprovechando la mayor ventaja de la generación basada en CLI. Scriptéalo.
Saltarse el paso de revisión. Las imágenes con IA no siempre quedan perfectas al primer intento. Genera de 3 a 5 variaciones y elige la mejor. La diferencia de coste es insignificante; la diferencia de calidad es significativa.
Preguntas frecuentes
¿Cuánto cuesta generar imágenes con IA usando Wonda?
Los costes varían según el modelo y la resolución. Ejecuta wonda pricing list para ver las tarifas actuales, o wonda pricing estimate si quieres consultar el coste antes de generar.
¿Puedo usar estas imágenes comercialmente?
Sí. Las imágenes generadas a través de Wonda son tuyas para uso comercial. Cada modelo tiene sus propios términos de licencia, pero el caso de uso estándar — contenido de marketing, publicaciones en redes sociales, fotografía de producto — está cubierto en todos los modelos disponibles.
¿Necesito instalar algo además de la CLI?
No. Wonda es un binario independiente sin dependencias de runtime. Instálalo con un comando y funciona inmediatamente. No requiere Docker, Python ni Node.js.
¿Puede Claude Code hacer todo esto por mí?
Sí. Si describes lo que quieres en lenguaje natural, Claude Code lee el archivo de skill de Wonda y ejecuta los comandos correctos. Consulta Deja que Claude Code ejecute Wonda por ti para ver el tutorial completo.
¿Y la edición de imágenes? ¿Puedo añadir texto superpuesto o redimensionar?
El pipeline de edición de Wonda admite operaciones de vídeo. Para posprocesamiento de imágenes como añadir texto superpuesto, puedes encadenar la imagen en un flujo de vídeo o usar herramientas CLI estándar como ImageMagick junto con Wonda. El patrón de generar-luego-editar es el mismo independientemente de si el resultado final es una imagen fija o un vídeo.
¿Qué sigue?
Una vez que tengas la generación de imágenes funcionando desde la terminal, los siguientes pasos naturales son:
- Generación de vídeo — anima tus imágenes o genera desde texto con Guía para desarrolladores sobre generación de vídeo con IA
- Publicación en redes sociales — envía imágenes directamente a Instagram y TikTok con Automatizar publicaciones en Instagram desde la terminal
- Contenido estilo UGC — genera contenido de usuario de apariencia auténtica para testeo de creatividades publicitarias con UGC con IA en piloto automático
- Testeo por volumen — genera variaciones de anuncios por lotes para encontrar ganadores con Marketing basado en volumen
La terminal es la superficie más rápida para generación de imágenes con IA en 2026. No porque las líneas de comando estén de moda, sino porque se componen, se scriptean y permiten que los agentes las operen. Esa es la ventaja de flujo de trabajo que las herramientas en navegador no pueden igualar.