PixVerse CLI: Generación de Video e Imagen con IA para Desarrolladores

Aprenda a instalar PixVerse CLI, generar su primera imagen y video con IA, y automatizar flujos de trabajo creativos en Claude Code, Cursor y agentes de IA.

Product Update
PixVerse CLI: Generación de Video e Imagen con IA para Desarrolladores

PixVerse CLI: Generación de Video e Imagen con IA para Desarrolladores

Introducción

Todo flujo de trabajo creativo tiene un cuello de botella: el momento en que debe abandonar su editor de código, abrir un navegador y hacer clic manualmente en una interfaz web para generar un elemento multimedia. Para los desarrolladores, los agentes de IA y cualquier persona que construya canales de contenido automatizados, ese cambio de contexto genera una fricción que se acumula rápidamente.

PixVerse CLI elimina ese cuello de botella. Es la interfaz de línea de comandos oficial de PixVerse, que le brinda acceso a todos los modelos, todas las funciones y todas las capacidades de la plataforma PixVerse — directamente desde su terminal. Texto a video, imagen a video, texto a imagen, sincronización labial de voz, efectos de sonido, escalado de resolución — todo scriptable, todo encadenable, todo disponible sin necesidad de tocar un navegador.

Lo que hace que PixVerse CLI sea especialmente potente es su filosofía de diseño: fue creado pensando en los agentes de IA. Cada comando devuelve JSON estructurado, cada código de salida es determinista y cada paso de la canalización es componible. Esto significa que puede enseñar a Claude Code, Cursor, Codex o cualquier otro agente a generar imágenes y videos en su nombre — y lo harán correctamente, en todo momento.

Esta guía le acompaña a lo largo de todo el recorrido: desde la instalación hasta su primera generación, pasando por canales de automatización de múltiples pasos y flujos de trabajo nativos para agentes.

Requisitos Previos

Antes de comenzar, necesita:

  • Node.js 20 o superior — verifique con node --version
  • Una cuenta de PixVerse — regístrese en pixverse.ai
  • Una suscripción activa de PixVerse — la CLI utiliza el mismo sistema de créditos que el sitio web; solo los usuarios con suscripción pueden generar contenido

PixVerse CLI no requiere que se copien claves de API manualmente. La autenticación se gestiona mediante un flujo OAuth basado en navegador que almacena su token de forma local.

Paso 1: Instalar la CLI

Instale globalmente con npm:

npm install -g pixverse

Verifique la instalación:

pixverse --version

Si prefiere no instalar globalmente, también puede ejecutar comandos mediante npx:

npx pixverse create video --prompt "Un gato caminando en Marte"

Paso 2: Autenticarse

Ejecute el comando de inicio de sesión:

pixverse auth login

La CLI mostrará una URL corta y un código. Abra la URL en su navegador, ingrese el código y autorice con su cuenta de PixVerse. Su token se almacena automáticamente en ~/.pixverse/ y es válido durante 30 días.

Para verificar que ha iniciado sesión y comprobar sus créditos disponibles:

pixverse auth status
pixverse account info

El comando account info muestra su nivel de suscripción, los créditos restantes y el programa de restablecimiento diario de créditos. Siempre verifique su saldo antes de ejecutar trabajos por lotes.

Paso 3: Generar Su Primera Imagen

La generación de texto a imagen es la forma más rápida de probar su configuración. Ejecute:

pixverse create image --prompt "Un sendero forestal fotorrealista a la hora dorada" --json

El indicador --json devuelve una salida estructurada:

{
  "image_id": 789012,
  "status": "completed",
  "image_url": "https://...",
  "prompt": "A photorealistic forest path at golden hour",
  "model": "qwen-image",
  "width": 1024,
  "height": 1024
}

Para obtener una salida de mayor resolución, especifique un modelo que lo admita:

pixverse create image \
  --prompt "Un sendero forestal fotorrealista a la hora dorada" \
  --model seedream-5.0-lite \
  --quality 1800p \
  --aspect-ratio 16:9 \
  --json

PixVerse admite varios modelos de imagen, cada uno con diferentes límites de resolución máxima y fortalezas:

ModeloResolución MáximaIdeal Para
qwen-image1080pGeneración rápida, uso general
seedream-5.0-lite1800pImágenes creativas de alto detalle
seedream-4.52160pUltra alta resolución
gemini-3.1-flash (Nano Banana 2)2160pAmplio rango de resolución, rápido
gemini-3.0 (Nano Banana Pro)2160pAlta calidad a escala
gemini-2.5-flash (Nano Banana)1080pLigero, entrega rápida

Para descargar la imagen generada:

pixverse asset download 789012

Paso 4: Generar Su Primer Video

El texto a video funciona de la misma manera. Genere un clip de 5 segundos:

pixverse create video --prompt "Una puesta de sol sobre las olas del océano" --json

Para una generación completamente personalizada:

pixverse create video \
  --prompt "Una toma cinematográfica de dron sobre un brumoso valle montañoso al amanecer" \
  --model v5.6 \
  --quality 1080p \
  --aspect-ratio 16:9 \
  --duration 8 \
  --audio \
  --json

El indicador --audio habilita el sonido ambiental generado por IA que coincide con el contenido de su video. El indicador --json devuelve una video_url al completarse, que puede pasar directamente a un comando de descarga o al siguiente paso en una canalización.

PixVerse proporciona múltiples modelos de video con diferentes capacidades:

ModeloCalidad MáximaRango de DuraciónNotas
v5.61080p1–10 segEl más flexible; mayor rango de duración
sora-2-pro1080p4, 8, 12 segSalida cinematográfica de alta calidad
veo-3.1-standard1080p4, 6, 8 segAdmite el modo Transición
grok-imagine720p1–15 segMayor duración máxima

Animar una Imagen Estática

Para convertir una foto o imagen generada en un video, proporcione el indicador --image:

pixverse create video \
  --prompt "Una brisa suave se mueve a través de la escena" \
  --image ./product-photo.jpg \
  --model v5.6 \
  --quality 1080p \
  --json

Puede pasar una ruta de archivo local o una URL. Los archivos locales se cargan automáticamente — no se requiere ningún paso de carga manual.

Paso 5: Ejecutar el Asistente Interactivo

Si está explorando por primera vez y aún no está familiarizado con todos los indicadores disponibles, ejecute cualquier comando de creación sin argumentos para ingresar al asistente guiado:

pixverse create video
pixverse create image

El asistente le guía paso a paso a través del prompt, la selección del modelo, la calidad, la relación de aspecto, la duración y otras opciones — útil para descubrir qué parámetros están disponibles antes de escribirlos en un script.

Enseñar a Su Agente de IA a Generar Contenido Multimedia

Aquí es donde PixVerse CLI se vuelve genuinamente transformador. Debido a que cada comando devuelve JSON estructurado y utiliza códigos de salida deterministas, cualquier agente de IA que pueda ejecutar comandos de shell puede ser instruido para generar imágenes y videos bajo demanda.

Instalación de PixVerse Skills

PixVerse Skills es una biblioteca de archivos de habilidades estructurados que enseña a los agentes exactamente cómo usar la CLI: qué indicadores acepta cada comando, qué modelos admiten qué parámetros, cómo encadenar comandos en canalizaciones y cómo manejar errores.

Para Claude Code y otros agentes que admiten el formato de habilidades, agregue las habilidades de PixVerse directamente:

npx skills add https://github.com/pixverseai/skills --skill pixverse-ai-image-and-video-generator

Para Cursor, las habilidades se encuentran en skills/ en el repositorio de GitHub de PixVerse Skills y pueden cargarse como contexto directamente en su editor. Para Codex y agentes basados en LangChain, cada archivo de habilidad es un markdown autocontenido que puede inyectarse en el prompt del sistema del agente.

Una vez que su agente tenga las habilidades de PixVerse cargadas, puede darle instrucciones en lenguaje natural como:

  • “Genera un video de demostración de producto de 10 segundos a partir de esta captura de pantalla”
  • “Crea cuatro variaciones de esta imagen de portada de blog en formato 16:9”
  • “Anima este diagrama en un clip explicativo de 5 segundos con sonido ambiental”

El agente traducirá esas instrucciones a los comandos CLI correctos, analizará la salida JSON y gestionará el sondeo y las descargas — sin intervención manual requerida.

Claude Code

En Claude Code, PixVerse CLI se convierte en una herramienta nativa que el agente usa de forma autónoma. Después de cargar las habilidades de PixVerse, puede incluir la generación de contenido multimedia directamente en cualquier tarea:

Genera una imagen de portada para esta publicación de blog sobre aprendizaje automático,
usa el modelo seedream-5.0-lite a 1800p en formato 16:9,
descárgala en ./assets/cover.webp

Claude Code invocará los comandos CLI correctos, analizará la URL de la imagen desde la respuesta JSON y descargará el archivo en la ruta especificada — todo dentro de la misma sesión en la que también está escribiendo su código.

Un flujo de trabajo típico de Claude Code:

# Claude Code ejecuta esto de forma autónoma según su instrucción
IMG=$(pixverse create image \
  --prompt "Visualización abstracta de capas de redes neuronales, fondo oscuro, tonos azules y púrpuras" \
  --model seedream-5.0-lite \
  --quality 1800p \
  --aspect-ratio 16:9 \
  --json | jq -r '.image_url')
 
# Luego la anima
pixverse create video \
  --prompt "Panorámica lenta a través de conexiones neuronales brillantes" \
  --image "$IMG" \
  --model v5.6 \
  --quality 1080p \
  --duration 6 \
  --json

Cursor

Los usuarios de Cursor pueden cargar PixVerse Skills como un archivo de contexto de proyecto. Coloque los archivos de habilidades relevantes en su directorio .cursor/ o agréguelos a las reglas de su espacio de trabajo. Una vez cargado, Cursor tiene pleno conocimiento de cada comando de PixVerse CLI y puede generar contenido multimedia como parte de cualquier tarea de codificación.

Un flujo de trabajo común en Cursor: pida al agente que genere una imagen de maqueta basada en un diseño que está construyendo y luego úsela como referencia directamente en su sesión del IDE — sin salir del editor en ningún momento.

Codex y Otros Agentes

PixVerse CLI es compatible con cualquier agente que pueda ejecutar comandos de shell y analizar JSON. El formato de salida estructurado — nombres de campo consistentes, códigos de error predecibles y mensajes de error separados por stderr — garantiza que incluso los agentes de scripting simples puedan integrar la generación de forma confiable.

El contrato de código de salida simplifica el manejo de errores:

CódigoSignificadoAcción del Agente
0ÉxitoAnalizar la salida JSON
2Tiempo de espera agotadoReintentar con --timeout mayor
3Autenticación expiradaVolver a ejecutar pixverse auth login
4Créditos insuficientesVerificar saldo, notificar al usuario
5Generación fallidaProbar parámetros diferentes
6Error de validaciónRevisar valores de los indicadores

Canalizaciones de Automatización

Una vez que comprenda los comandos individuales, PixVerse CLI habilita potentes flujos de trabajo de múltiples pasos que se ejecutan completamente sin interacción del usuario.

Texto a Imagen a Video

Una de las canalizaciones más útiles: generar una imagen de alta resolución a partir de un prompt de texto y luego animarla en un video.

# Paso 1: Generar una imagen base
IMG_RESULT=$(pixverse create image \
  --prompt "Un paisaje urbano cyberpunk de noche, luces de neón reflejadas en el pavimento mojado" \
  --model gemini-3.1-flash \
  --quality 2160p \
  --aspect-ratio 16:9 \
  --json)
 
IMAGE_URL=$(echo "$IMG_RESULT" | jq -r '.image_url')
 
# Paso 2: Animarla en un video
VID_RESULT=$(pixverse create video \
  --prompt "La cámara hace una panorámica lenta por las calles iluminadas con neón" \
  --image "$IMAGE_URL" \
  --model v5.6 \
  --quality 1080p \
  --duration 8 \
  --json)
 
VIDEO_ID=$(echo "$VID_RESULT" | jq -r '.video_id')
 
# Paso 3: Descargar el video final
pixverse asset download "$VIDEO_ID" --json

Canalización de Producción de Video Completa

Para una salida pulida, encadene la creación con pasos de postprocesamiento:

# Paso 1: Crear el video base
RESULT=$(pixverse create video \
  --prompt "Un producto siendo ensamblado en cámara lenta" \
  --model v5.6 \
  --quality 720p \
  --duration 5 \
  --json)
 
VID=$(echo "$RESULT" | jq -r '.video_id')
 
# Paso 2: Extender la duración
EXTENDED=$(pixverse create extend \
  --video "$VID" \
  --prompt "Continuar la secuencia de ensamblaje" \
  --duration 5 \
  --json | jq -r '.video_id')
 
pixverse task wait "$EXTENDED" --json
 
# Paso 3: Agregar sonido ambiental
WITH_SOUND=$(pixverse create sound \
  --video "$EXTENDED" \
  --prompt "Ambiente de taller industrial, sonidos mecánicos suaves" \
  --json | jq -r '.video_id')
 
pixverse task wait "$WITH_SOUND" --json
 
# Paso 4: Escalar a 1080p
FINAL=$(pixverse create upscale \
  --video "$WITH_SOUND" \
  --quality 1080p \
  --json | jq -r '.video_id')
 
pixverse task wait "$FINAL" --json
 
# Paso 5: Descargar
pixverse asset download "$FINAL" --json

Generación por Lotes

Para canalizaciones de contenido que requieren múltiples variaciones, ejecute trabajos en paralelo:

# Verificar créditos primero
CREDITS=$(pixverse account info --json | jq -r '.credits.total')
echo "Créditos disponibles: $CREDITS"
 
# Enviar cuatro generaciones en paralelo
pixverse create video --prompt "Amanecer sobre montañas" --no-wait --json > /tmp/v1.json &
pixverse create video --prompt "Atardecer sobre el océano" --no-wait --json > /tmp/v2.json &
pixverse create video --prompt "Estrellas sobre un desierto" --no-wait --json > /tmp/v3.json &
pixverse create video --prompt "Aurora sobre un lago congelado" --no-wait --json > /tmp/v4.json &
wait
 
# Esperar cada uno y descargar
for f in /tmp/v1.json /tmp/v2.json /tmp/v3.json /tmp/v4.json; do
  ID=$(jq -r '.video_id' "$f")
  pixverse task wait "$ID" --json
  pixverse asset download "$ID" --json
done

El indicador --no-wait envía el trabajo y retorna inmediatamente con un ID de tarea, lo que permite enviar múltiples trabajos antes de sondear. El comando pixverse task wait gestiona el sondeo adaptativo por usted — no se requieren bucles de espera manuales.

Configuración de Valores Predeterminados

Si utiliza consistentemente el mismo modelo, calidad o relación de aspecto, configúrelos como valores predeterminados para no tener que repetir los indicadores cada vez:

pixverse config defaults set --mode video --model v5.6 --quality 1080p --aspect-ratio 16:9
pixverse config defaults set --mode image --model seedream-5.0-lite --quality 1800p
pixverse config set output-dir ~/Downloads/pixverse

Los indicadores de la línea de comandos siempre anulan sus valores predeterminados configurados, por lo que conserva toda la flexibilidad mientras reduce la repetición.

Qué Puede Construir

Con PixVerse CLI integrado en su flujo de trabajo de agente, el rango de tareas automatizables se amplía considerablemente:

  • Documentación — genere automáticamente videos de demostración de productos y capturas de pantalla como parte de su proceso de construcción de documentación
  • Marketing — ejecute trabajos por lotes nocturnos que produzcan variaciones de contenido para redes sociales a partir de una única biblioteca de prompts
  • Desarrollo de aplicaciones — deje que su agente de codificación genere imágenes de marcador de posición, animaciones de maqueta o videos de pantalla de carga mientras construye la interfaz de usuario
  • Canalizaciones de contenido — encadene llamadas CLI con otras herramientas (ffmpeg, ImageMagick, almacenamiento en la nube) para construir flujos de trabajo de producción multimedia completamente automatizados
  • Prototipado — genere conceptos de movimiento rápidos en segundos para validar ideas antes de comprometerse con la producción completa

La CLI está diseñada para encajar de forma natural en cualquier flujo de trabajo basado en shell. Si su automatización existente se ejecuta en bash, Python, Node o una canalización de CI/CD, PixVerse CLI se integra sin ninguna sobrecarga de integración adicional.

Lista de Verificación para Comenzar

  • Instalar Node.js 20 o superior
  • Ejecutar npm install -g pixverse
  • Ejecutar pixverse auth login y autorizar en el navegador
  • Ejecutar pixverse account info para verificar créditos
  • Generar su primera imagen: pixverse create image --prompt "..." --json
  • Generar su primer video: pixverse create video --prompt "..." --json
  • Instalar PixVerse Skills para su agente (Claude Code, Cursor o Codex)
  • Configurar sus valores predeterminados preferidos con pixverse config defaults set
  • Construir su primera canalización de automatización

Próximos Pasos

PixVerse CLI en npm (npm install -g pixverse) le brinda acceso inmediato a todas las capacidades de generación. El repositorio de PixVerse Skills proporciona los archivos de habilidades estructurados que enseñan a su agente de IA cómo usar esas capacidades correctamente en cualquier contexto.

La combinación de una CLI confiable y una biblioteca de habilidades lista para agentes significa que la generación de imágenes y videos ahora puede vivir dentro del mismo flujo de trabajo que su código — gestionado por el mismo agente, en el mismo terminal, sin cambiar de herramientas.

Comience con un solo comando. Construya a partir de ahí.