PixVerse CLI: geracao de video e imagem com IA para desenvolvimento

Aprenda a instalar o PixVerse CLI, gerar seu primeiro video e imagem com IA e automatizar fluxos criativos no Claude Code, Cursor e em agentes de IA.

Product Update
PixVerse CLI: geracao de video e imagem com IA para desenvolvimento

Introducao

Todo fluxo de trabalho criativo tem um gargalo: o momento em que voce precisa sair do editor de codigo, abrir um navegador e clicar manualmente em uma interface web para gerar uma midia. Para desenvolvedores, agentes de IA e qualquer equipe que construa pipelines automatizados de conteudo, essa troca de contexto cria atrito que se acumula rapidamente.

PixVerse CLI elimina esse gargalo. Ele e a interface oficial de linha de comando da PixVerse e oferece acesso a cada modelo, cada recurso e cada capacidade da plataforma PixVerse diretamente no terminal. Texto para video, imagem para video, texto para imagem, lip-sync de fala, efeitos sonoros, upscaling: tudo e scriptavel, encadeavel e disponivel sem abrir o navegador.

O que torna o PixVerse CLI especialmente poderoso e sua filosofia de design: ele foi criado com agentes de IA em mente. Cada comando retorna JSON estruturado, cada codigo de saida e deterministico e cada etapa do pipeline e composavel. Isso significa que voce pode ensinar Claude Code, Cursor, Codex ou qualquer outro agente a gerar imagens e videos em seu nome, e ele fara isso corretamente todas as vezes.

Este guia conduz voce por toda a jornada: da instalacao a primeira geracao, e depois para pipelines de automacao em varias etapas e fluxos nativos para agentes.

Pre-requisitos

Antes de comecar, voce precisa de:

  • Node.js 20 ou superior — verifique com node --version
  • Uma conta PixVerse — cadastre-se em pixverse.ai
  • Uma assinatura PixVerse ativa — o CLI usa o mesmo sistema de creditos do site; apenas usuarios assinantes podem gerar conteudo

O PixVerse CLI nao exige copia manual de chaves de API. A autenticacao e feita por um fluxo OAuth via navegador que armazena seu token localmente.

Passo 1: Instalar o CLI

Instale globalmente com npm:

npm install -g pixverse

Verifique a instalacao:

pixverse --version

Se preferir nao instalar globalmente, voce tambem pode executar comandos via npx:

npx pixverse create video --prompt "A cat walking on Mars"

Passo 2: Autenticar

Execute o comando de login:

pixverse auth login

O CLI abre um navegador para autorizacao OAuth por dispositivo. Voce tambem pode copiar a URL e concluir a autorizacao em qualquer navegador e dispositivo, o que e util em ambientes SSH e headless. Seu token e armazenado automaticamente em ~/.pixverse/ e tem validade de 30 dias.

Para verificar se voce esta autenticado e conferir os creditos disponiveis:

pixverse auth status
pixverse account info

O comando account info mostra seu nivel de assinatura, creditos restantes e a programacao de recarga diaria de creditos. Sempre confira o saldo antes de rodar jobs em lote.

Passo 3: Gerar sua primeira imagem

A geracao de texto para imagem e a forma mais rapida de validar sua configuracao. Execute:

pixverse create image --prompt "A photorealistic forest path at golden hour" --json

A flag --json retorna saida estruturada:

{
  "image_id": 789012,
  "status": "completed",
  "image_url": "https://...",
  "prompt": "A photorealistic forest path at golden hour",
  "model": "qwen-image",
  "width": 1024,
  "height": 1024
}

Para gerar em resolucao maior, especifique um modelo que suporte esse nivel:

pixverse create image \
  --prompt "A photorealistic forest path at golden hour" \
  --model seedream-5.0-lite \
  --quality 1800p \
  --aspect-ratio 16:9 \
  --json

O PixVerse suporta varios modelos de imagem, cada um com limites de resolucao e pontos fortes diferentes:

ModeloResolucao maximaMelhor para
qwen-image1080pGeracao rapida, uso geral
gpt-image-2.02160pSaidas criativas em alta resolucao em multiplos formatos
seedream-5.0-lite1800pImagens criativas com alto nivel de detalhe
seedream-4.52160pUltra alta resolucao
gemini-3.1-flash (Nano Banana 2)2160pFaixa ampla de resolucao, rapido
gemini-3.0 (Nano Banana Pro)2160pAlta qualidade em escala
gemini-2.5-flash (Nano Banana)1080pLeve, retorno rapido
kling-image-o32160pSaidas visuais estilizadas com enquadramento flexivel
kling-image-v31440pEquilibrio entre qualidade e velocidade

Para baixar a imagem gerada:

pixverse asset download 789012

Passo 4: Gerar seu primeiro video

Texto para video funciona da mesma forma. Gere um clipe de 5 segundos:

pixverse create video --prompt "A sunset over ocean waves" --json

Para uma geracao totalmente personalizada:

pixverse create video \
  --prompt "A cinematic drone shot over a misty mountain valley at dawn" \
  --model v6 \
  --quality 1080p \
  --aspect-ratio 16:9 \
  --duration 8 \
  --audio \
  --json

A flag --audio ativa som ambiente gerado por IA que combina com o conteudo do video. A flag --json retorna video_url ao concluir, que voce pode encaminhar diretamente para download ou para a proxima etapa do pipeline.

O PixVerse oferece varios modelos de video com capacidades diferentes:

ModeloQualidade maximaFaixa de duracaoNotas
v61080p1–15 secModelo padrao da PixVerse com amplo suporte de proporcao
pixverse-c11080p1–15 secForte suporte em fluxos de video e referencia
v5.61080p1–10 secSuporta modo de criacao com controle de movimento
veo-3.1-standard2160p4, 6, 8 secSuporta fluxos de video e de transicao
grok-imagine720p1–15 secSuporta create video, extend e reference
sora-2-pro1080p4, 8, 12 secAlta fidelidade com opcoes de duracao fixa

Animar uma imagem estatica

Para transformar uma foto ou imagem gerada em video, use a flag --image:

pixverse create video \
  --prompt "Gentle wind moves through the scene" \
  --image ./product-photo.jpg \
  --model v6 \
  --quality 1080p \
  --json

Voce pode informar um caminho local ou uma URL. Arquivos locais sao enviados automaticamente, sem etapa manual de upload.

Passo 5: Executar o assistente interativo

Se voce esta explorando pela primeira vez e ainda nao conhece todas as flags disponiveis, execute qualquer comando de criacao sem argumentos para entrar no assistente guiado:

pixverse create video
pixverse create image

O assistente guia voce por prompt, selecao de modelo, qualidade, proporcao, duracao e outras opcoes passo a passo, o que ajuda a descobrir parametros antes de transformar tudo em script.

Alem da geracao: gerencie assets e workspace

A versao mais recente do PixVerse CLI tambem inclui comandos de gerenciamento para fluxos completos no terminal:

  • pixverse task status <id> e pixverse task wait <id> para polling de tarefas
  • pixverse asset list|upload|info|download|delete para operacoes de ciclo de vida de assets
  • pixverse saved list|items|new|rename|add|remove|delete para pastas salvas
  • pixverse workspace list|status|switch|manage para operacoes multi-workspace

Isso permite automatizar nao apenas a criacao, mas tambem organizacao, download e entrega em um unico script.

Ensine seu agente de IA a gerar midia

E aqui que o PixVerse CLI se torna realmente transformador. Como cada comando retorna JSON estruturado e usa codigos de saida deterministicos, qualquer agente de IA que execute comandos shell pode aprender a gerar imagens e videos sob demanda.

Instalando PixVerse Skills

PixVerse Skills e uma biblioteca estruturada de skills que ensina os agentes a usar o CLI corretamente: flags de comando, limites de modelos, pipelines em varias etapas e tratamento robusto de erros.

Para Claude Code e outros agentes que suportam o formato de skills, adicione as PixVerse skills diretamente:

npx skills add https://github.com/pixverseai/skills --skill pixverse-ai-image-and-video-generator

Para Cursor, Claude Code, Codex e outros frameworks de agentes, essa skill melhora a confiabilidade porque fornece restricoes explicitas ao agente, em vez de forca-lo a inferir tudo do zero.

Depois de carregar as PixVerse Skills no agente, voce pode dar instrucoes em linguagem natural como:

  • “Generate a 10-second product demo video from this screenshot”
  • “Create four variations of this blog cover image in 16:9 format”
  • “Animate this diagram into a 5-second explainer clip with ambient sound”
  • “Generate three 8-second 16:9 promo clips with different camera motions”

O agente traduz essas instrucoes para os comandos CLI corretos, interpreta a saida JSON e cuida de polling e downloads sem intervencao manual.

Claude Code

No Claude Code, o PixVerse CLI vira uma ferramenta nativa que o agente usa de forma autonoma. Depois de carregar as PixVerse Skills, voce pode incluir geracao de midia em qualquer tarefa:

Generate a cover image for this blog post about machine learning,
use the seedream-5.0-lite model at 1800p in 16:9 format,
download it to ./assets/cover.webp

O Claude Code executa os comandos CLI corretos, extrai a URL da imagem da resposta JSON e baixa o arquivo para o caminho especificado, tudo na mesma sessao em que tambem escreve seu codigo.

Um fluxo tipico no Claude Code:

# Claude Code runs this autonomously based on your instruction
IMG=$(pixverse create image \
  --prompt "Abstract visualization of neural network layers, dark background, blue and purple tones" \
  --model seedream-5.0-lite \
  --quality 1800p \
  --aspect-ratio 16:9 \
  --json | jq -r '.image_url')
 
# Then animates it
pixverse create video \
  --prompt "Slow pan across glowing neural connections" \
  --image "$IMG" \
  --model v6 \
  --quality 1080p \
  --duration 6 \
  --json

Cursor

Usuarios do Cursor podem carregar PixVerse Skills como arquivo de contexto de projeto. Coloque os arquivos de skill relevantes no diretorio .cursor/ ou adicione-os as regras do workspace. Depois de carregado, o Cursor conhece todos os comandos PixVerse CLI e pode gerar midia como parte de qualquer tarefa de desenvolvimento.

Um fluxo comum no Cursor: pedir ao agente para gerar uma imagem de mockup com base no design que voce esta construindo e usala como referencia diretamente na sessao do IDE, sem sair do editor.

Codex e outros agentes

PixVerse CLI e compativel com qualquer agente capaz de executar comandos shell e interpretar JSON. O formato de saida estruturado, com nomes de campo consistentes, codigos de erro previsiveis e mensagens separadas em stderr, garante integracao confiavel mesmo para agentes de script simples.

O contrato de codigos de saida simplifica o tratamento de erros:

CodigoSignificadoAcao do agente
1Erro geralVerificar stderr e tentar novamente com entradas validadas
0SucessoInterpretar saida JSON
2TimeoutTentar novamente com --timeout maior
3Auth expiradaExecutar pixverse auth login novamente
4Sem creditosVerificar saldo e notificar o usuario
5Falha de geracaoTentar parametros diferentes
6Erro de validacaoRevisar valores de flags

Pipelines de automacao

Depois de dominar os comandos individuais, o PixVerse CLI libera fluxos poderosos em varias etapas que rodam sem interacao do usuario.

Texto para imagem para video

Um dos pipelines mais uteis: gerar uma imagem em alta resolucao a partir de um prompt de texto e depois anima-la em video.

# Step 1: Generate a base image
IMG_RESULT=$(pixverse create image \
  --prompt "A cyberpunk cityscape at night, neon lights reflecting on wet pavement" \
  --model gemini-3.1-flash \
  --quality 2160p \
  --aspect-ratio 16:9 \
  --json)
 
IMAGE_URL=$(echo "$IMG_RESULT" | jq -r '.image_url')
 
# Step 2: Animate it into a video
VID_RESULT=$(pixverse create video \
  --prompt "Camera slowly pans across the neon-lit streets" \
  --image "$IMAGE_URL" \
  --model v6 \
  --quality 1080p \
  --duration 8 \
  --json)
 
VIDEO_ID=$(echo "$VID_RESULT" | jq -r '.video_id')
 
# Step 3: Download the final video
pixverse asset download "$VIDEO_ID" --json

Pipeline completo de producao de video

Para uma saida mais polida, encadeie criacao com etapas de pos-processamento:

# Step 1: Create the base video
RESULT=$(pixverse create video \
  --prompt "A product being assembled in slow motion" \
  --model v6 \
  --quality 720p \
  --duration 5 \
  --json)
 
VID=$(echo "$RESULT" | jq -r '.video_id')
 
# Step 2: Extend duration
EXTENDED=$(pixverse create extend \
  --video "$VID" \
  --prompt "Continue the assembly sequence" \
  --duration 5 \
  --json | jq -r '.video_id')
 
pixverse task wait "$EXTENDED" --json
 
# Step 3: Add ambient sound
WITH_SOUND=$(pixverse create sound \
  --video "$EXTENDED" \
  --prompt "Industrial workshop ambience, soft mechanical sounds" \
  --json | jq -r '.video_id')
 
pixverse task wait "$WITH_SOUND" --json
 
# Step 4: Upscale to 1080p
FINAL=$(pixverse create upscale \
  --video "$WITH_SOUND" \
  --quality 1080p \
  --json | jq -r '.video_id')
 
pixverse task wait "$FINAL" --json
 
# Step 5: Download
pixverse asset download "$FINAL" --json

Geracao em lote

Para pipelines de conteudo que exigem varias variacoes, execute jobs em paralelo:

# Check credits first
CREDITS=$(pixverse account info --json | jq -r '.credits.total')
echo "Available credits: $CREDITS"
 
# Submit four parallel generations
pixverse create video --prompt "Sunrise over mountains" --no-wait --json > /tmp/v1.json &
pixverse create video --prompt "Sunset over ocean" --no-wait --json > /tmp/v2.json &
pixverse create video --prompt "Stars over a desert" --no-wait --json > /tmp/v3.json &
pixverse create video --prompt "Aurora over a frozen lake" --no-wait --json > /tmp/v4.json &
wait
 
# Wait for each and download
for f in /tmp/v1.json /tmp/v2.json /tmp/v3.json /tmp/v4.json; do
  ID=$(jq -r '.video_id' "$f")
  pixverse task wait "$ID" --json
  pixverse asset download "$ID" --json
done

A flag --no-wait envia o job e retorna imediatamente com um ID de tarefa, permitindo enviar varios jobs antes do polling. O comando pixverse task wait faz o polling adaptativo para voce, sem loops manuais com sleep.

Configurando padroes

Se voce usa sempre o mesmo modelo, qualidade ou proporcao, defina esses valores como padrao para nao repetir flags em toda execucao:

pixverse config defaults set video model v6
pixverse config defaults set video quality 1080p
pixverse config defaults set image model seedream-5.0-lite
pixverse config set output-dir ~/Downloads/pixverse
pixverse config defaults show

As flags de linha de comando sempre sobrescrevem os padroes configurados, entao voce mantem flexibilidade total com menos repeticao.

O que voce pode construir

Com o PixVerse CLI integrado ao fluxo com agentes, o alcance das tarefas automatizaveis cresce bastante:

  • Documentacao — gere automaticamente videos de demo de produto e screenshots como parte do build da documentacao
  • Marketing — execute jobs noturnos em lote para produzir variacoes de conteudo para redes sociais a partir de uma unica biblioteca de prompts
  • Desenvolvimento de apps — deixe seu agente de codigo gerar visuais placeholder, mockups animados e videos de tela de carregamento enquanto voce constroi a UI
  • Pipelines de conteudo — encadeie chamadas CLI com outras ferramentas (ffmpeg, ImageMagick, cloud storage) para criar fluxos de producao de midia totalmente automatizados
  • Prototipagem — gere conceitos de movimento em segundos para validar ideias antes de investir em producao completa

O CLI foi projetado para se encaixar naturalmente em qualquer fluxo baseado em shell. Se sua automacao atual roda em bash, Python, Node ou em pipeline de CI/CD, o PixVerse CLI entra sem sobrecarga adicional de integracao.

Checklist para comecar

  • Instalar Node.js 20 ou superior
  • Executar npm install -g pixverse
  • Executar pixverse auth login e autorizar no navegador
  • Executar pixverse account info para validar creditos
  • Gerar sua primeira imagem: pixverse create image --prompt "..." --json
  • Gerar seu primeiro video: pixverse create video --prompt "..." --json
  • Instalar PixVerse Skills para seu agente (Claude Code, Cursor ou Codex)
  • Configurar seus padroes com pixverse config defaults set
  • Montar seu primeiro pipeline de automacao

Mantendo o CLI atualizado

Use npm para manter seu CLI local atualizado:

npm update -g pixverse

Para mudancas por release e novos modelos suportados, consulte o changelog oficial da CLI:

Proximos passos

O PixVerse CLI no npm (npm install -g pixverse) oferece acesso imediato a geracao, polling de tarefas, gerenciamento de assets, pastas salvas e controles de workspace em uma unica interface. O repositorio PixVerse Skills adiciona orientacao pronta para agentes para que Claude Code, Cursor, Codex e outras ferramentas executem esses fluxos com mais confiabilidade.

A combinacao de um CLI confiavel com uma biblioteca de skills pronta para agentes permite manter geracao de imagem e video no mesmo fluxo do seu codigo, gerenciada pelo mesmo agente, no mesmo terminal e sem troca de ferramentas.

Comece com um unico comando. Evolua a partir dele.