PixVerse CLI: Generación de Video e Imagen con IA para Desarrolladores
Aprenda a instalar PixVerse CLI, generar su primera imagen y video con IA, y automatizar flujos de trabajo creativos en Claude Code, Cursor y agentes de IA.
PixVerse CLI: Generación de Video e Imagen con IA para Desarrolladores
Introducción
Todo flujo de trabajo creativo tiene un cuello de botella: el momento en que debe abandonar su editor de código, abrir un navegador y hacer clic manualmente en una interfaz web para generar un elemento multimedia. Para los desarrolladores, los agentes de IA y cualquier persona que construya canales de contenido automatizados, ese cambio de contexto genera una fricción que se acumula rápidamente.
PixVerse CLI elimina ese cuello de botella. Es la interfaz de línea de comandos oficial de PixVerse, que le brinda acceso a todos los modelos, todas las funciones y todas las capacidades de la plataforma PixVerse — directamente desde su terminal. Texto a video, imagen a video, texto a imagen, sincronización labial de voz, efectos de sonido, escalado de resolución — todo scriptable, todo encadenable, todo disponible sin necesidad de tocar un navegador.
Lo que hace que PixVerse CLI sea especialmente potente es su filosofía de diseño: fue creado pensando en los agentes de IA. Cada comando devuelve JSON estructurado, cada código de salida es determinista y cada paso de la canalización es componible. Esto significa que puede enseñar a Claude Code, Cursor, Codex o cualquier otro agente a generar imágenes y videos en su nombre — y lo harán correctamente, en todo momento.
Esta guía le acompaña a lo largo de todo el recorrido: desde la instalación hasta su primera generación, pasando por canales de automatización de múltiples pasos y flujos de trabajo nativos para agentes.
Requisitos Previos
Antes de comenzar, necesita:
- Node.js 20 o superior — verifique con
node --version - Una cuenta de PixVerse — regístrese en pixverse.ai
- Una suscripción activa de PixVerse — la CLI utiliza el mismo sistema de créditos que el sitio web; solo los usuarios con suscripción pueden generar contenido
PixVerse CLI no requiere que se copien claves de API manualmente. La autenticación se gestiona mediante un flujo OAuth basado en navegador que almacena su token de forma local.
Paso 1: Instalar la CLI
Instale globalmente con npm:
npm install -g pixverseVerifique la instalación:
pixverse --versionSi prefiere no instalar globalmente, también puede ejecutar comandos mediante npx:
npx pixverse create video --prompt "Un gato caminando en Marte"Paso 2: Autenticarse
Ejecute el comando de inicio de sesión:
pixverse auth loginLa CLI mostrará una URL corta y un código. Abra la URL en su navegador, ingrese el código y autorice con su cuenta de PixVerse. Su token se almacena automáticamente en ~/.pixverse/ y es válido durante 30 días.
Para verificar que ha iniciado sesión y comprobar sus créditos disponibles:
pixverse auth status
pixverse account infoEl comando account info muestra su nivel de suscripción, los créditos restantes y el programa de restablecimiento diario de créditos. Siempre verifique su saldo antes de ejecutar trabajos por lotes.
Paso 3: Generar Su Primera Imagen
La generación de texto a imagen es la forma más rápida de probar su configuración. Ejecute:
pixverse create image --prompt "Un sendero forestal fotorrealista a la hora dorada" --jsonEl indicador --json devuelve una salida estructurada:
{
"image_id": 789012,
"status": "completed",
"image_url": "https://...",
"prompt": "A photorealistic forest path at golden hour",
"model": "qwen-image",
"width": 1024,
"height": 1024
}Para obtener una salida de mayor resolución, especifique un modelo que lo admita:
pixverse create image \
--prompt "Un sendero forestal fotorrealista a la hora dorada" \
--model seedream-5.0-lite \
--quality 1800p \
--aspect-ratio 16:9 \
--jsonPixVerse admite varios modelos de imagen, cada uno con diferentes límites de resolución máxima y fortalezas:
| Modelo | Resolución Máxima | Ideal Para |
|---|---|---|
qwen-image | 1080p | Generación rápida, uso general |
seedream-5.0-lite | 1800p | Imágenes creativas de alto detalle |
seedream-4.5 | 2160p | Ultra alta resolución |
gemini-3.1-flash (Nano Banana 2) | 2160p | Amplio rango de resolución, rápido |
gemini-3.0 (Nano Banana Pro) | 2160p | Alta calidad a escala |
gemini-2.5-flash (Nano Banana) | 1080p | Ligero, entrega rápida |
Para descargar la imagen generada:
pixverse asset download 789012Paso 4: Generar Su Primer Video
El texto a video funciona de la misma manera. Genere un clip de 5 segundos:
pixverse create video --prompt "Una puesta de sol sobre las olas del océano" --jsonPara una generación completamente personalizada:
pixverse create video \
--prompt "Una toma cinematográfica de dron sobre un brumoso valle montañoso al amanecer" \
--model v5.6 \
--quality 1080p \
--aspect-ratio 16:9 \
--duration 8 \
--audio \
--jsonEl indicador --audio habilita el sonido ambiental generado por IA que coincide con el contenido de su video. El indicador --json devuelve una video_url al completarse, que puede pasar directamente a un comando de descarga o al siguiente paso en una canalización.
PixVerse proporciona múltiples modelos de video con diferentes capacidades:
| Modelo | Calidad Máxima | Rango de Duración | Notas |
|---|---|---|---|
v5.6 | 1080p | 1–10 seg | El más flexible; mayor rango de duración |
sora-2-pro | 1080p | 4, 8, 12 seg | Salida cinematográfica de alta calidad |
veo-3.1-standard | 1080p | 4, 6, 8 seg | Admite el modo Transición |
grok-imagine | 720p | 1–15 seg | Mayor duración máxima |
Animar una Imagen Estática
Para convertir una foto o imagen generada en un video, proporcione el indicador --image:
pixverse create video \
--prompt "Una brisa suave se mueve a través de la escena" \
--image ./product-photo.jpg \
--model v5.6 \
--quality 1080p \
--jsonPuede pasar una ruta de archivo local o una URL. Los archivos locales se cargan automáticamente — no se requiere ningún paso de carga manual.
Paso 5: Ejecutar el Asistente Interactivo
Si está explorando por primera vez y aún no está familiarizado con todos los indicadores disponibles, ejecute cualquier comando de creación sin argumentos para ingresar al asistente guiado:
pixverse create video
pixverse create imageEl asistente le guía paso a paso a través del prompt, la selección del modelo, la calidad, la relación de aspecto, la duración y otras opciones — útil para descubrir qué parámetros están disponibles antes de escribirlos en un script.
Enseñar a Su Agente de IA a Generar Contenido Multimedia
Aquí es donde PixVerse CLI se vuelve genuinamente transformador. Debido a que cada comando devuelve JSON estructurado y utiliza códigos de salida deterministas, cualquier agente de IA que pueda ejecutar comandos de shell puede ser instruido para generar imágenes y videos bajo demanda.
Instalación de PixVerse Skills
PixVerse Skills es una biblioteca de archivos de habilidades estructurados que enseña a los agentes exactamente cómo usar la CLI: qué indicadores acepta cada comando, qué modelos admiten qué parámetros, cómo encadenar comandos en canalizaciones y cómo manejar errores.
Para Claude Code y otros agentes que admiten el formato de habilidades, agregue las habilidades de PixVerse directamente:
npx skills add https://github.com/pixverseai/skills --skill pixverse-ai-image-and-video-generatorPara Cursor, las habilidades se encuentran en skills/ en el repositorio de GitHub de PixVerse Skills y pueden cargarse como contexto directamente en su editor. Para Codex y agentes basados en LangChain, cada archivo de habilidad es un markdown autocontenido que puede inyectarse en el prompt del sistema del agente.
Una vez que su agente tenga las habilidades de PixVerse cargadas, puede darle instrucciones en lenguaje natural como:
- “Genera un video de demostración de producto de 10 segundos a partir de esta captura de pantalla”
- “Crea cuatro variaciones de esta imagen de portada de blog en formato 16:9”
- “Anima este diagrama en un clip explicativo de 5 segundos con sonido ambiental”
El agente traducirá esas instrucciones a los comandos CLI correctos, analizará la salida JSON y gestionará el sondeo y las descargas — sin intervención manual requerida.
Claude Code
En Claude Code, PixVerse CLI se convierte en una herramienta nativa que el agente usa de forma autónoma. Después de cargar las habilidades de PixVerse, puede incluir la generación de contenido multimedia directamente en cualquier tarea:
Genera una imagen de portada para esta publicación de blog sobre aprendizaje automático,
usa el modelo seedream-5.0-lite a 1800p en formato 16:9,
descárgala en ./assets/cover.webp
Claude Code invocará los comandos CLI correctos, analizará la URL de la imagen desde la respuesta JSON y descargará el archivo en la ruta especificada — todo dentro de la misma sesión en la que también está escribiendo su código.
Un flujo de trabajo típico de Claude Code:
# Claude Code ejecuta esto de forma autónoma según su instrucción
IMG=$(pixverse create image \
--prompt "Visualización abstracta de capas de redes neuronales, fondo oscuro, tonos azules y púrpuras" \
--model seedream-5.0-lite \
--quality 1800p \
--aspect-ratio 16:9 \
--json | jq -r '.image_url')
# Luego la anima
pixverse create video \
--prompt "Panorámica lenta a través de conexiones neuronales brillantes" \
--image "$IMG" \
--model v5.6 \
--quality 1080p \
--duration 6 \
--jsonCursor
Los usuarios de Cursor pueden cargar PixVerse Skills como un archivo de contexto de proyecto. Coloque los archivos de habilidades relevantes en su directorio .cursor/ o agréguelos a las reglas de su espacio de trabajo. Una vez cargado, Cursor tiene pleno conocimiento de cada comando de PixVerse CLI y puede generar contenido multimedia como parte de cualquier tarea de codificación.
Un flujo de trabajo común en Cursor: pida al agente que genere una imagen de maqueta basada en un diseño que está construyendo y luego úsela como referencia directamente en su sesión del IDE — sin salir del editor en ningún momento.
Codex y Otros Agentes
PixVerse CLI es compatible con cualquier agente que pueda ejecutar comandos de shell y analizar JSON. El formato de salida estructurado — nombres de campo consistentes, códigos de error predecibles y mensajes de error separados por stderr — garantiza que incluso los agentes de scripting simples puedan integrar la generación de forma confiable.
El contrato de código de salida simplifica el manejo de errores:
| Código | Significado | Acción del Agente |
|---|---|---|
| 0 | Éxito | Analizar la salida JSON |
| 2 | Tiempo de espera agotado | Reintentar con --timeout mayor |
| 3 | Autenticación expirada | Volver a ejecutar pixverse auth login |
| 4 | Créditos insuficientes | Verificar saldo, notificar al usuario |
| 5 | Generación fallida | Probar parámetros diferentes |
| 6 | Error de validación | Revisar valores de los indicadores |
Canalizaciones de Automatización
Una vez que comprenda los comandos individuales, PixVerse CLI habilita potentes flujos de trabajo de múltiples pasos que se ejecutan completamente sin interacción del usuario.
Texto a Imagen a Video
Una de las canalizaciones más útiles: generar una imagen de alta resolución a partir de un prompt de texto y luego animarla en un video.
# Paso 1: Generar una imagen base
IMG_RESULT=$(pixverse create image \
--prompt "Un paisaje urbano cyberpunk de noche, luces de neón reflejadas en el pavimento mojado" \
--model gemini-3.1-flash \
--quality 2160p \
--aspect-ratio 16:9 \
--json)
IMAGE_URL=$(echo "$IMG_RESULT" | jq -r '.image_url')
# Paso 2: Animarla en un video
VID_RESULT=$(pixverse create video \
--prompt "La cámara hace una panorámica lenta por las calles iluminadas con neón" \
--image "$IMAGE_URL" \
--model v5.6 \
--quality 1080p \
--duration 8 \
--json)
VIDEO_ID=$(echo "$VID_RESULT" | jq -r '.video_id')
# Paso 3: Descargar el video final
pixverse asset download "$VIDEO_ID" --jsonCanalización de Producción de Video Completa
Para una salida pulida, encadene la creación con pasos de postprocesamiento:
# Paso 1: Crear el video base
RESULT=$(pixverse create video \
--prompt "Un producto siendo ensamblado en cámara lenta" \
--model v5.6 \
--quality 720p \
--duration 5 \
--json)
VID=$(echo "$RESULT" | jq -r '.video_id')
# Paso 2: Extender la duración
EXTENDED=$(pixverse create extend \
--video "$VID" \
--prompt "Continuar la secuencia de ensamblaje" \
--duration 5 \
--json | jq -r '.video_id')
pixverse task wait "$EXTENDED" --json
# Paso 3: Agregar sonido ambiental
WITH_SOUND=$(pixverse create sound \
--video "$EXTENDED" \
--prompt "Ambiente de taller industrial, sonidos mecánicos suaves" \
--json | jq -r '.video_id')
pixverse task wait "$WITH_SOUND" --json
# Paso 4: Escalar a 1080p
FINAL=$(pixverse create upscale \
--video "$WITH_SOUND" \
--quality 1080p \
--json | jq -r '.video_id')
pixverse task wait "$FINAL" --json
# Paso 5: Descargar
pixverse asset download "$FINAL" --jsonGeneración por Lotes
Para canalizaciones de contenido que requieren múltiples variaciones, ejecute trabajos en paralelo:
# Verificar créditos primero
CREDITS=$(pixverse account info --json | jq -r '.credits.total')
echo "Créditos disponibles: $CREDITS"
# Enviar cuatro generaciones en paralelo
pixverse create video --prompt "Amanecer sobre montañas" --no-wait --json > /tmp/v1.json &
pixverse create video --prompt "Atardecer sobre el océano" --no-wait --json > /tmp/v2.json &
pixverse create video --prompt "Estrellas sobre un desierto" --no-wait --json > /tmp/v3.json &
pixverse create video --prompt "Aurora sobre un lago congelado" --no-wait --json > /tmp/v4.json &
wait
# Esperar cada uno y descargar
for f in /tmp/v1.json /tmp/v2.json /tmp/v3.json /tmp/v4.json; do
ID=$(jq -r '.video_id' "$f")
pixverse task wait "$ID" --json
pixverse asset download "$ID" --json
doneEl indicador --no-wait envía el trabajo y retorna inmediatamente con un ID de tarea, lo que permite enviar múltiples trabajos antes de sondear. El comando pixverse task wait gestiona el sondeo adaptativo por usted — no se requieren bucles de espera manuales.
Configuración de Valores Predeterminados
Si utiliza consistentemente el mismo modelo, calidad o relación de aspecto, configúrelos como valores predeterminados para no tener que repetir los indicadores cada vez:
pixverse config defaults set --mode video --model v5.6 --quality 1080p --aspect-ratio 16:9
pixverse config defaults set --mode image --model seedream-5.0-lite --quality 1800p
pixverse config set output-dir ~/Downloads/pixverseLos indicadores de la línea de comandos siempre anulan sus valores predeterminados configurados, por lo que conserva toda la flexibilidad mientras reduce la repetición.
Qué Puede Construir
Con PixVerse CLI integrado en su flujo de trabajo de agente, el rango de tareas automatizables se amplía considerablemente:
- Documentación — genere automáticamente videos de demostración de productos y capturas de pantalla como parte de su proceso de construcción de documentación
- Marketing — ejecute trabajos por lotes nocturnos que produzcan variaciones de contenido para redes sociales a partir de una única biblioteca de prompts
- Desarrollo de aplicaciones — deje que su agente de codificación genere imágenes de marcador de posición, animaciones de maqueta o videos de pantalla de carga mientras construye la interfaz de usuario
- Canalizaciones de contenido — encadene llamadas CLI con otras herramientas (ffmpeg, ImageMagick, almacenamiento en la nube) para construir flujos de trabajo de producción multimedia completamente automatizados
- Prototipado — genere conceptos de movimiento rápidos en segundos para validar ideas antes de comprometerse con la producción completa
La CLI está diseñada para encajar de forma natural en cualquier flujo de trabajo basado en shell. Si su automatización existente se ejecuta en bash, Python, Node o una canalización de CI/CD, PixVerse CLI se integra sin ninguna sobrecarga de integración adicional.
Lista de Verificación para Comenzar
- Instalar Node.js 20 o superior
- Ejecutar
npm install -g pixverse - Ejecutar
pixverse auth loginy autorizar en el navegador - Ejecutar
pixverse account infopara verificar créditos - Generar su primera imagen:
pixverse create image --prompt "..." --json - Generar su primer video:
pixverse create video --prompt "..." --json - Instalar PixVerse Skills para su agente (Claude Code, Cursor o Codex)
- Configurar sus valores predeterminados preferidos con
pixverse config defaults set - Construir su primera canalización de automatización
Próximos Pasos
PixVerse CLI en npm (npm install -g pixverse) le brinda acceso inmediato a todas las capacidades de generación. El repositorio de PixVerse Skills proporciona los archivos de habilidades estructurados que enseñan a su agente de IA cómo usar esas capacidades correctamente en cualquier contexto.
La combinación de una CLI confiable y una biblioteca de habilidades lista para agentes significa que la generación de imágenes y videos ahora puede vivir dentro del mismo flujo de trabajo que su código — gestionado por el mismo agente, en el mismo terminal, sin cambiar de herramientas.
Comience con un solo comando. Construya a partir de ahí.