PixVerse CLI: generación de video e imágenes con IA para desarrollo
Instale PixVerse CLI, use los modelos más recientes de video e imagen, gestione assets y plantillas, y automatice media en agentes de IA.
Introducción
Todo flujo de trabajo creativo tiene un cuello de botella: el momento en que necesita salir de su editor de código, abrir un navegador y recorrer manualmente una interfaz web para generar una pieza de contenido. Para desarrolladores, agentes de IA y cualquier equipo que construya pipelines de contenido automatizados, ese cambio de contexto es una fricción que se acumula rápidamente.
PixVerse CLI elimina ese cuello de botella. Es la interfaz oficial de línea de comandos de PixVerse y le da acceso a generación y workflows de workspace de PixVerse directamente desde su terminal. Texto a video, imagen a video, texto a imagen, imagen a imagen, transiciones, sincronización labial, video de referencia, control de movimiento, plantillas, upscaling y gestión de assets: todo es scriptable, encadenable y utilizable sin tocar el navegador.
Lo que hace especialmente potente a PixVerse CLI es su filosofía de diseño: fue creado pensando en agentes de IA. Cada comando devuelve JSON estructurado, cada código de salida es determinista y cada paso del pipeline es componible. Eso significa que puede enseñar a Claude Code, Cursor, Codex o cualquier otro agente a generar imágenes y videos por usted, y lo hará correctamente cada vez.
Esta guía refleja PixVerse CLI v1.1.9 y le acompaña en todo el recorrido: desde la instalación hasta su primera generación, y después hacia pipelines de automatización de varios pasos y flujos de trabajo nativos para agentes.
Requisitos previos
Antes de empezar, necesita:
- Node.js 20 o superior — compruébelo con
node --version - Una cuenta de PixVerse — regístrese en pixverse.ai
- Una suscripción activa a PixVerse — la CLI usa el mismo sistema de créditos del sitio web; solo usuarios suscritos pueden generar contenido
PixVerse CLI no requiere copiar claves API manualmente. La autenticación se gestiona mediante un flujo OAuth en navegador que guarda su token en local.
Paso 1: Instalar la CLI
Instálela globalmente con npm:
npm install -g pixverseVerifique la instalación:
pixverse --versionSi prefiere no instalarla de forma global, también puede ejecutar comandos con npx:
npx pixverse create video --prompt "A cat walking on Mars"Paso 2: Autenticarse
Ejecute el comando de inicio de sesión:
pixverse auth loginLa CLI abre un navegador para la autorización OAuth por dispositivo. También puede copiar la URL y completar la autorización desde cualquier navegador y dispositivo, algo útil en entornos SSH o headless. Su token se guarda automáticamente en ~/.pixverse/ y tiene validez de 30 días.
Para verificar que inició sesión y consultar sus créditos disponibles:
pixverse auth status
pixverse account info
pixverse account slotsEl comando account info muestra su nivel de suscripción, créditos del workspace y contexto de uso. pixverse account usage le ayuda a revisar el consumo de créditos, mientras que pixverse account slots muestra los slots actuales de generación concurrente para jobs de imagen y video. Revise siempre saldo y slots antes de ejecutar lotes.
Paso 3: Generar su primera imagen
La generación de texto a imagen es la forma más rápida de probar su entorno. Ejecute:
pixverse create image --prompt "A photorealistic forest path at golden hour" --jsonEn v1.1.9, create image usa GPT Image 2 por defecto. La bandera --json devuelve salida estructurada:
{
"image_id": 789012,
"status": "completed",
"image_url": "https://...",
"prompt": "A photorealistic forest path at golden hour",
"model": "gpt-image-2.0",
"width": 1440,
"height": 1440
}Para resultados de mayor resolución, especifique un modelo compatible:
pixverse create image \
--prompt "A photorealistic forest path at golden hour" \
--model seedream-5.0-lite \
--quality 2160p \
--aspect-ratio 16:9 \
--jsonPixVerse admite varios modelos de imagen, cada uno con distintos límites de resolución y soporte de relación de aspecto:
| Modelo | Valor --model | Calidad | Notas |
|---|---|---|---|
| GPT Image 2 | gpt-image-2.0 | 1080p, 1440p, 2160p | Modelo de imagen por defecto; admite formatos horizontales y verticales |
| Nano Banana 2 | gemini-3.1-flash | 512p, 1080p, 1440p, 2160p | Soporte flexible para auto y relaciones estándar |
| Qwen Image | qwen-image | 720p, 1080p | Generación rápida para tareas creativas comunes |
| Nano Banana Pro | gemini-3.0 | 1080p, 1440p, 2160p | Creación de imágenes de alta calidad a mayor escala |
| Nano Banana | gemini-2.5-flash | 1080p | Generación ligera con respuesta rápida |
| Seedream 5.0 Lite | seedream-5.0-lite | 1440p, 1800p, 2160p | Imágenes creativas con alto nivel de detalle |
| Seedream 4.5 | seedream-4.5 | 1440p, 2160p | Generación de imagen de alta resolución |
| Seedream 4.0 | seedream-4.0 | 1080p, 1440p, 2160p | Opción adicional de Seedream para workflows de imagen |
| Kling Image O3 | kling-image-o3 | 1080p, 1440p, 2160p | Resultados visuales estilizados con encuadre flexible |
| Kling Image V3 | kling-image-v3 | 1080p, 1440p | Equilibrio entre calidad y velocidad |
También puede transformar una imagen existente con image-to-image:
pixverse create image \
--prompt "Turn this product photo into a clean watercolor illustration" \
--image ./product-photo.png \
--model gpt-image-2.0 \
--jsonPara descargar la imagen generada:
pixverse asset download 789012Paso 4: Generar su primer video
Texto a video funciona igual. Genere un clip de 5 segundos:
pixverse create video --prompt "A sunset over ocean waves" --jsonPara una generación totalmente personalizada:
pixverse create video \
--prompt "A cinematic drone shot over a misty mountain valley at dawn" \
--model v6 \
--quality 1080p \
--aspect-ratio 16:9 \
--duration 8 \
--audio \
--jsonLa bandera --audio habilita sonido ambiental generado por IA que coincide con su contenido de video. La bandera --json devuelve video_url al finalizar, que puede pasar directamente a un comando de descarga o al siguiente paso del pipeline.
PixVerse ofrece múltiples modelos de video con distintas capacidades de calidad, duración y modo:
| Modelo | Valor --model | Calidad máxima | Duración | Notas |
|---|---|---|---|---|
| PixVerse V6 | v6 | 1080p | 1–15 sec | Modelo de video por defecto; amplio soporte de relaciones de aspecto |
| PixVerse C1 | pixverse-c1 | 1080p | 1–15 sec | Soporte sólido para video, referencia y transición |
| Seedance 2.0 Standard | seedance-2.0-standard | 1080p | 4–15 sec | Admite modos de video, referencia y transición |
| Seedance 2.0 Fast | seedance-2.0-fast | 720p | 4–15 sec | Opción Seedance más rápida para video, referencia y transición |
| Happy Horse 1.0 | happyhorse-1.0 | 1080p | 3–15 sec | Opción de video sensible al audio disponible para create video |
| Kling O3 Pro | kling-o3-pro | 720p | 3–15 sec | Admite workflows de video, referencia y transición |
| Kling O3 Standard | kling-o3-standard | 720p | 3–15 sec | Opción estándar de Kling O3 |
| Kling 3.0 Pro | kling-3.0-pro | 720p | 3–15 sec | Admite workflows de video y transición |
| Kling 3.0 Standard | kling-3.0-standard | 720p | 3–15 sec | Opción estándar de Kling 3.0 |
| Grok Imagine | grok-imagine | 720p | 1–15 sec | Admite video, extend y reference |
| Veo 3.1 Lite | veo-3.1-lite | 1080p | 4, 6 u 8 sec | Admite video y transiciones de 2 frames |
| Veo 3.1 Standard | veo-3.1-standard | 2160p | 4, 6 u 8 sec | Opción Veo de mayor resolución |
| Veo 3.1 Fast | veo-3.1-fast | 2160p | 4, 6 u 8 sec | Opción Veo más rápida |
| Sora 2 Pro | sora-2-pro | 1080p | 4, 8 o 12 sec | Opción Sora de duración fija |
| Sora 2 | sora-2 | 720p | 4, 8 o 12 sec | Opción Sora estándar |
| PixVerse v5.6 | v5.6 | 1080p | 1–10 sec | Todavía se usa para motion-control y ciertos workflows de generación |
Animar una imagen estática
Para convertir una foto o imagen generada en video, utilice la bandera --image:
pixverse create video \
--prompt "Gentle wind moves through the scene" \
--image ./product-photo.jpg \
--model v6 \
--quality 1080p \
--jsonPuede pasar una ruta local o una URL. Los archivos locales se cargan automáticamente, sin paso manual de subida. Las imágenes locales superiores a 1920x1920 o 5MB se redimensionan o comprimen automáticamente antes de subir; las URL remotas se validan en backend tal cual.
Usar referencia, transición, control de movimiento y plantillas
La CLI actual admite más que texto a video e imagen a video. Estos modos de creación son útiles cuando necesita más control sobre personajes, keyframes, ediciones o efectos:
# Crear una transición entre keyframes
pixverse create transition --images ./frame1.png ./frame2.png
# Añadir lip-sync con TTS o un archivo de audio
pixverse create speech --video <video_id> --tts-text "Welcome to the launch"
pixverse create speech --video <video_id> --audio ./voiceover.mp3
# Extender un video generado
pixverse create extend --video <video_id>
# Modificar un video existente
pixverse create modify --video <video_id> --prompt "Change the background to a beach"
# Aumentar resolución del video
pixverse create upscale --video <video_id> --quality 1080p
# Generar video con imágenes de referencia
pixverse create reference --images ./char1.png ./char2.png --prompt "Two friends walking in a park"
# Seedance 2.0 reference puede mezclar imágenes y videos
pixverse create reference \
--model seedance-2.0-standard \
--images ./character.png \
--videos ./motion.mp4 \
--prompt "@image1 follows the motion in @video1"
# Control de movimiento con imagen de personaje y video de movimiento
pixverse create motion-control --image ./character.png --video ./dance.mp4
# Crear desde una plantilla o efecto
pixverse create template --template-id 12345 --image ./photo.pngNo todos los modelos admiten todos los modos. Por ejemplo, create reference ahora admite v6, pixverse-c1, Seedance 2.0, Kling O3, grok-imagine y v5.6; create modify está ligado a v5.5; create motion-control usa v5.6; y lip-sync usa v5.
Paso 5: Ejecutar el asistente interactivo
Si está explorando por primera vez y todavía no conoce todas las banderas disponibles, ejecute cualquier comando de creación sin argumentos para abrir el asistente guiado:
pixverse create video
pixverse create imageEl asistente le guía paso a paso por prompt, selección de modelo, calidad, relación de aspecto, duración y otras opciones, útil para descubrir parámetros antes de llevarlos a scripts.
Más allá de generar: gestionar assets y workspace
La versión más reciente de PixVerse CLI también incluye comandos de gestión para construir flujos terminal end-to-end:
pixverse task status <id>ypixverse task wait <id>para sondeo de tareaspixverse task status --ids 123,456,789 --type video --jsonpara revisar estados en lotepixverse asset list,asset upload,asset info,asset downloadyasset deletepara operaciones de ciclo de vida de assetspixverse saved list,saved items,saved new,saved rename,saved add,saved removeysaved deletepara carpetas guardadaspixverse template categories,template list,template searchytemplate infopara descubrir efectos y plantillaspixverse workspace list,workspace status,workspace switchyworkspace managepara operaciones con múltiples workspacespixverse account info,account usageyaccount slotspara revisar créditos, uso y concurrenciapixverse config set,config list,config pathyconfig defaultspara defaults locales reutilizables
Esto facilita automatizar no solo la generación, sino también la organización, el descubrimiento de plantillas, la descarga, el routing por workspace y la entrega en un único script. Si necesita ejecutar un comando contra otro workspace, use la bandera global --workspace-id <id>; 0 apunta al workspace personal.
Banderas útiles para scripts
La mayoría de la automatización depende de salidas y comportamiento predecibles. Estas banderas son especialmente útiles en scripts y workflows con agentes de IA:
| Bandera | Uso |
|---|---|
--json | Devuelve salida JSON estructurada |
-p | Alias corto de --json |
--count <n> | Genera 1–4 variaciones desde una solicitud |
--seed <number> | Facilita reproducir una generación |
--off-peak | Usa precio off-peak cuando esté disponible |
--audio / --no-audio | Activa o desactiva audio en comandos compatibles |
--multi-shot / --no-multi-shot | Activa o desactiva multi-shot para video |
--no-wait | Envía el job y regresa de inmediato |
--timeout <sec> | Define el timeout de polling, por defecto 300 segundos |
--workspace-id <id> | Sobrescribe el workspace activo para un comando |
Enseñar a su agente de IA a generar contenido multimedia
Aquí es donde PixVerse CLI se vuelve realmente transformador. Como cada comando devuelve JSON estructurado y usa códigos de salida deterministas, cualquier agente de IA capaz de ejecutar comandos shell puede aprender a generar imágenes y videos bajo demanda.
Instalar PixVerse Skills
PixVerse Skills es una biblioteca de skills estructurada que enseña a los agentes a usar la CLI correctamente: banderas de comandos, límites de modelos, pipelines de varios pasos y manejo robusto de errores.
Para Claude Code y otros agentes compatibles con formato de skills, agregue las skills de PixVerse directamente:
npx skills add https://github.com/pixverseai/skills --skill pixverse-ai-image-and-video-generatorPara Cursor, Claude Code, Codex y otros marcos de agentes, esta skill mejora la confiabilidad porque da restricciones explícitas al agente en vez de forzarlo a inferirlas desde cero.
Una vez que su agente cargue PixVerse Skills, puede darle instrucciones en lenguaje natural como:
- “Generate a 10-second product demo video from this screenshot”
- “Create four variations of this blog cover image in 16:9 format”
- “Animate this diagram into a 5-second explainer clip with ambient sound”
- “Generate three 8-second 16:9 promo clips with different camera motions”
El agente traducirá esas instrucciones en comandos CLI correctos, analizará la salida JSON y gestionará sondeo y descargas sin intervención manual.
Claude Code
En Claude Code, PixVerse CLI se convierte en una herramienta nativa que el agente usa de forma autónoma. Tras cargar PixVerse Skills, puede incluir generación de contenido multimedia directamente en cualquier tarea:
Generate a cover image for this blog post about machine learning,
use the seedream-5.0-lite model at 2160p in 16:9 format,
download it to ./assets/cover.webp
Claude Code invocará los comandos CLI correctos, analizará la URL de imagen desde la respuesta JSON y descargará el archivo en la ruta indicada, todo en la misma sesión donde también escribe su código.
Un flujo típico en Claude Code:
# Claude Code runs this autonomously based on your instruction
IMG=$(pixverse create image \
--prompt "Abstract visualization of neural network layers, dark background, blue and purple tones" \
--model seedream-5.0-lite \
--quality 2160p \
--aspect-ratio 16:9 \
--json | jq -r '.image_url')
# Then animates it
pixverse create video \
--prompt "Slow pan across glowing neural connections" \
--image "$IMG" \
--model v6 \
--quality 1080p \
--duration 6 \
--jsonCursor
Los usuarios de Cursor pueden cargar PixVerse Skills como archivo de contexto de proyecto. Coloque los archivos de skill relevantes en su directorio .cursor/ o añádalos a las reglas de su workspace. Una vez cargados, Cursor conoce todos los comandos de PixVerse CLI y puede generar contenido multimedia como parte de cualquier tarea de desarrollo.
Un flujo común en Cursor: pedir al agente que genere una imagen mockup basada en un diseño que está construyendo y usarla como referencia directamente en su sesión del IDE, sin salir del editor.
Codex y otros agentes
PixVerse CLI es compatible con cualquier agente que pueda ejecutar comandos shell y analizar JSON. El formato de salida estructurado, con nombres de campo consistentes, códigos de error predecibles y mensajes de error separados por stderr, garantiza que incluso agentes de scripting simples integren la generación con confiabilidad.
El contrato de códigos de salida simplifica el manejo de errores:
| Código | Significado | Acción del agente |
|---|---|---|
| 0 | Éxito | Analizar salida JSON |
| 1 | Error general | Revisar stderr y reintentar con entradas validadas |
| 2 | Timeout | Reintentar con --timeout más largo |
| 3 | Auth expirada | Ejecutar pixverse auth login de nuevo |
| 4 | Sin créditos | Revisar saldo y avisar al usuario |
| 5 | Fallo de generación | Probar parámetros distintos |
| 6 | Error de validación | Revisar valores de banderas |
Pipelines de automatización
Una vez que comprende los comandos individuales, PixVerse CLI habilita potentes flujos de varios pasos que se ejecutan por completo sin interacción del usuario.
Texto a imagen a video
Uno de los pipelines más útiles: generar una imagen en alta resolución desde un prompt de texto y luego animarla en video.
# Step 1: Generate a base image
IMG_RESULT=$(pixverse create image \
--prompt "A cyberpunk cityscape at night, neon lights reflecting on wet pavement" \
--model gemini-3.1-flash \
--quality 2160p \
--aspect-ratio 16:9 \
--json)
IMAGE_URL=$(echo "$IMG_RESULT" | jq -r '.image_url')
# Step 2: Animate it into a video
VID_RESULT=$(pixverse create video \
--prompt "Camera slowly pans across the neon-lit streets" \
--image "$IMAGE_URL" \
--model v6 \
--quality 1080p \
--duration 8 \
--json)
VIDEO_ID=$(echo "$VID_RESULT" | jq -r '.video_id')
# Step 3: Download the final video
pixverse asset download "$VIDEO_ID" --jsonPipeline completo de producción de video
Para obtener resultados pulidos, encadene la creación con pasos de postprocesado. create sound se eliminó en v1.1.8, así que use --audio o --no-audio en comandos de creación compatibles en vez de añadir sonido con un comando separado:
# Step 1: Create the base video
RESULT=$(pixverse create video \
--prompt "A product being assembled in slow motion" \
--model v6 \
--quality 720p \
--duration 5 \
--audio \
--json)
VID=$(echo "$RESULT" | jq -r '.video_id')
# Step 2: Extend duration
EXTENDED=$(pixverse create extend \
--video "$VID" \
--json | jq -r '.video_id')
pixverse task wait "$EXTENDED" --json
# Step 3: Upscale to 1080p
FINAL=$(pixverse create upscale \
--video "$EXTENDED" \
--quality 1080p \
--json | jq -r '.video_id')
pixverse task wait "$FINAL" --json
# Step 4: Download
pixverse asset download "$FINAL" --jsonGeneración por lotes
Para pipelines de contenido que requieren múltiples variaciones, ejecute trabajos en paralelo:
# Check credits and concurrent generation slots first
pixverse account info --json
pixverse account slots --json
# Submit four parallel generations
pixverse create video --prompt "Sunrise over mountains" --no-wait --json > /tmp/v1.json &
pixverse create video --prompt "Sunset over ocean" --no-wait --json > /tmp/v2.json &
pixverse create video --prompt "Stars over a desert" --no-wait --json > /tmp/v3.json &
pixverse create video --prompt "Aurora over a frozen lake" --no-wait --json > /tmp/v4.json &
wait
# Check all returned task IDs in one batch status call
IDS=$(jq -r '.video_id' /tmp/v1.json /tmp/v2.json /tmp/v3.json /tmp/v4.json | paste -sd, -)
pixverse task status --ids "$IDS" --type video --json
# Wait for each and download
for f in /tmp/v1.json /tmp/v2.json /tmp/v3.json /tmp/v4.json; do
ID=$(jq -r '.video_id' "$f")
pixverse task wait "$ID" --json
pixverse asset download "$ID" --json
doneLa bandera --no-wait envía el trabajo y devuelve de inmediato un ID de tarea, lo que permite enviar varios trabajos antes del sondeo. En versiones recientes, --no-wait --json también devuelve los parámetros de creación resueltos, útil para logs y reproducibilidad. Use --count <n> cuando quiera varias variaciones de un prompt y task status --ids cuando quiera una respuesta de estado para varios jobs en ejecución. El comando pixverse task wait gestiona el sondeo adaptativo por usted, sin bucles manuales de sleep.
Configurar valores predeterminados
Si usa siempre el mismo modelo, calidad o relación de aspecto, defínalos como predeterminados para evitar repetir banderas:
pixverse config defaults set video model v6
pixverse config defaults set video quality 1080p
pixverse config defaults set image model seedream-5.0-lite
pixverse config set output-dir ~/Downloads/pixverse
pixverse config defaults show
pixverse config list
pixverse config pathLas banderas de línea de comandos siempre prevalecen sobre los valores predeterminados configurados, de modo que conserva flexibilidad total mientras reduce repetición. Para automatización específica de workspace, añada --workspace-id <id> cuando quiera sobrescribir el workspace activo solo para esa ejecución.
Qué puede construir
Con PixVerse CLI integrado en su flujo de trabajo con agentes, el rango de tareas automatizables se amplía de forma considerable:
- Documentación — generar automáticamente videos de demo de producto y capturas de pantalla dentro de su build de documentación
- Marketing — ejecutar lotes nocturnos que producen variaciones para redes sociales desde una sola biblioteca de prompts
- Desarrollo de apps — permitir que su agente de código genere visuales placeholder, animaciones mockup o videos de carga mientras desarrolla la UI
- Pipelines de contenido — encadenar llamadas CLI con otras herramientas (ffmpeg, ImageMagick, cloud storage) para crear producción multimedia totalmente automatizada
- Prototipado — generar conceptos de movimiento en segundos para validar ideas antes de comprometer producción completa
La CLI está diseñada para integrarse de forma natural en cualquier flujo basado en shell. Si su automatización actual se ejecuta en bash, Python, Node o un pipeline CI/CD, PixVerse CLI se integra sin sobrecarga adicional.
Lista de inicio rápido
- Instalar Node.js 20 o superior
- Ejecutar
npm install -g pixverse - Ejecutar
pixverse auth loginy autorizar en navegador - Ejecutar
pixverse account infopara verificar créditos - Ejecutar
pixverse account slotsantes de trabajo batch concurrente - Generar su primera imagen:
pixverse create image --prompt "..." --json - Generar su primer video:
pixverse create video --prompt "..." --json - Explorar plantillas con
pixverse template list - Instalar PixVerse Skills para su agente (Claude Code, Cursor o Codex)
- Configurar sus predeterminados con
pixverse config defaults set - Construir su primer pipeline de automatización
Mantener la CLI actualizada
Utilice npm para mantener su CLI local actualizada:
npm update -g pixversePara cambios por release y nuevos modelos compatibles, revise el changelog oficial de la CLI:
Desde v1.1.9, los cambios recientes incluyen GPT Image 2 como modelo de imagen por defecto, soporte de v6 para create reference, soporte 2160p para Seedream 5.0 Lite, referencias mixtas de imagen y video en Seedance 2.0 y la eliminación del comando obsoleto create sound.
Próximos pasos
PixVerse CLI en npm (npm install -g pixverse) le da acceso inmediato a generación, sondeo de tareas, gestión de assets, plantillas, carpetas guardadas, controles de cuenta y control de workspaces desde una única interfaz. El repositorio PixVerse Skills añade guía preparada para agentes para que Claude Code, Cursor, Codex y otras herramientas ejecuten estos flujos con mayor confiabilidad.
La combinación de una CLI confiable y una biblioteca de skills preparada para agentes permite que la generación de imagen y video viva en el mismo flujo que su código: gestionada por el mismo agente, en el mismo terminal y sin cambiar de herramienta.
Empiece con un solo comando. Escale desde ahí.