PixVerse CLI: geracao de video e imagem com IA para desenvolvimento
Aprenda a instalar o PixVerse CLI, gerar seu primeiro video e imagem com IA e automatizar fluxos criativos no Claude Code, Cursor e em agentes de IA.
Introducao
Todo fluxo de trabalho criativo tem um gargalo: o momento em que voce precisa sair do editor de codigo, abrir um navegador e clicar manualmente em uma interface web para gerar uma midia. Para desenvolvedores, agentes de IA e qualquer equipe que construa pipelines automatizados de conteudo, essa troca de contexto cria atrito que se acumula rapidamente.
PixVerse CLI elimina esse gargalo. Ele e a interface oficial de linha de comando da PixVerse e oferece acesso a cada modelo, cada recurso e cada capacidade da plataforma PixVerse diretamente no terminal. Texto para video, imagem para video, texto para imagem, lip-sync de fala, efeitos sonoros, upscaling: tudo e scriptavel, encadeavel e disponivel sem abrir o navegador.
O que torna o PixVerse CLI especialmente poderoso e sua filosofia de design: ele foi criado com agentes de IA em mente. Cada comando retorna JSON estruturado, cada codigo de saida e deterministico e cada etapa do pipeline e composavel. Isso significa que voce pode ensinar Claude Code, Cursor, Codex ou qualquer outro agente a gerar imagens e videos em seu nome, e ele fara isso corretamente todas as vezes.
Este guia conduz voce por toda a jornada: da instalacao a primeira geracao, e depois para pipelines de automacao em varias etapas e fluxos nativos para agentes.
Pre-requisitos
Antes de comecar, voce precisa de:
- Node.js 20 ou superior — verifique com
node --version - Uma conta PixVerse — cadastre-se em pixverse.ai
- Uma assinatura PixVerse ativa — o CLI usa o mesmo sistema de creditos do site; apenas usuarios assinantes podem gerar conteudo
O PixVerse CLI nao exige copia manual de chaves de API. A autenticacao e feita por um fluxo OAuth via navegador que armazena seu token localmente.
Passo 1: Instalar o CLI
Instale globalmente com npm:
npm install -g pixverseVerifique a instalacao:
pixverse --versionSe preferir nao instalar globalmente, voce tambem pode executar comandos via npx:
npx pixverse create video --prompt "A cat walking on Mars"Passo 2: Autenticar
Execute o comando de login:
pixverse auth loginO CLI abre um navegador para autorizacao OAuth por dispositivo. Voce tambem pode copiar a URL e concluir a autorizacao em qualquer navegador e dispositivo, o que e util em ambientes SSH e headless. Seu token e armazenado automaticamente em ~/.pixverse/ e tem validade de 30 dias.
Para verificar se voce esta autenticado e conferir os creditos disponiveis:
pixverse auth status
pixverse account infoO comando account info mostra seu nivel de assinatura, creditos restantes e a programacao de recarga diaria de creditos. Sempre confira o saldo antes de rodar jobs em lote.
Passo 3: Gerar sua primeira imagem
A geracao de texto para imagem e a forma mais rapida de validar sua configuracao. Execute:
pixverse create image --prompt "A photorealistic forest path at golden hour" --jsonA flag --json retorna saida estruturada:
{
"image_id": 789012,
"status": "completed",
"image_url": "https://...",
"prompt": "A photorealistic forest path at golden hour",
"model": "qwen-image",
"width": 1024,
"height": 1024
}Para gerar em resolucao maior, especifique um modelo que suporte esse nivel:
pixverse create image \
--prompt "A photorealistic forest path at golden hour" \
--model seedream-5.0-lite \
--quality 1800p \
--aspect-ratio 16:9 \
--jsonO PixVerse suporta varios modelos de imagem, cada um com limites de resolucao e pontos fortes diferentes:
| Modelo | Resolucao maxima | Melhor para |
|---|---|---|
qwen-image | 1080p | Geracao rapida, uso geral |
gpt-image-2.0 | 2160p | Saidas criativas em alta resolucao em multiplos formatos |
seedream-5.0-lite | 1800p | Imagens criativas com alto nivel de detalhe |
seedream-4.5 | 2160p | Ultra alta resolucao |
gemini-3.1-flash (Nano Banana 2) | 2160p | Faixa ampla de resolucao, rapido |
gemini-3.0 (Nano Banana Pro) | 2160p | Alta qualidade em escala |
gemini-2.5-flash (Nano Banana) | 1080p | Leve, retorno rapido |
kling-image-o3 | 2160p | Saidas visuais estilizadas com enquadramento flexivel |
kling-image-v3 | 1440p | Equilibrio entre qualidade e velocidade |
Para baixar a imagem gerada:
pixverse asset download 789012Passo 4: Gerar seu primeiro video
Texto para video funciona da mesma forma. Gere um clipe de 5 segundos:
pixverse create video --prompt "A sunset over ocean waves" --jsonPara uma geracao totalmente personalizada:
pixverse create video \
--prompt "A cinematic drone shot over a misty mountain valley at dawn" \
--model v6 \
--quality 1080p \
--aspect-ratio 16:9 \
--duration 8 \
--audio \
--jsonA flag --audio ativa som ambiente gerado por IA que combina com o conteudo do video. A flag --json retorna video_url ao concluir, que voce pode encaminhar diretamente para download ou para a proxima etapa do pipeline.
O PixVerse oferece varios modelos de video com capacidades diferentes:
| Modelo | Qualidade maxima | Faixa de duracao | Notas |
|---|---|---|---|
v6 | 1080p | 1–15 sec | Modelo padrao da PixVerse com amplo suporte de proporcao |
pixverse-c1 | 1080p | 1–15 sec | Forte suporte em fluxos de video e referencia |
v5.6 | 1080p | 1–10 sec | Suporta modo de criacao com controle de movimento |
veo-3.1-standard | 2160p | 4, 6, 8 sec | Suporta fluxos de video e de transicao |
grok-imagine | 720p | 1–15 sec | Suporta create video, extend e reference |
sora-2-pro | 1080p | 4, 8, 12 sec | Alta fidelidade com opcoes de duracao fixa |
Animar uma imagem estatica
Para transformar uma foto ou imagem gerada em video, use a flag --image:
pixverse create video \
--prompt "Gentle wind moves through the scene" \
--image ./product-photo.jpg \
--model v6 \
--quality 1080p \
--jsonVoce pode informar um caminho local ou uma URL. Arquivos locais sao enviados automaticamente, sem etapa manual de upload.
Passo 5: Executar o assistente interativo
Se voce esta explorando pela primeira vez e ainda nao conhece todas as flags disponiveis, execute qualquer comando de criacao sem argumentos para entrar no assistente guiado:
pixverse create video
pixverse create imageO assistente guia voce por prompt, selecao de modelo, qualidade, proporcao, duracao e outras opcoes passo a passo, o que ajuda a descobrir parametros antes de transformar tudo em script.
Alem da geracao: gerencie assets e workspace
A versao mais recente do PixVerse CLI tambem inclui comandos de gerenciamento para fluxos completos no terminal:
pixverse task status <id>epixverse task wait <id>para polling de tarefaspixverse asset list|upload|info|download|deletepara operacoes de ciclo de vida de assetspixverse saved list|items|new|rename|add|remove|deletepara pastas salvaspixverse workspace list|status|switch|managepara operacoes multi-workspace
Isso permite automatizar nao apenas a criacao, mas tambem organizacao, download e entrega em um unico script.
Ensine seu agente de IA a gerar midia
E aqui que o PixVerse CLI se torna realmente transformador. Como cada comando retorna JSON estruturado e usa codigos de saida deterministicos, qualquer agente de IA que execute comandos shell pode aprender a gerar imagens e videos sob demanda.
Instalando PixVerse Skills
PixVerse Skills e uma biblioteca estruturada de skills que ensina os agentes a usar o CLI corretamente: flags de comando, limites de modelos, pipelines em varias etapas e tratamento robusto de erros.
Para Claude Code e outros agentes que suportam o formato de skills, adicione as PixVerse skills diretamente:
npx skills add https://github.com/pixverseai/skills --skill pixverse-ai-image-and-video-generatorPara Cursor, Claude Code, Codex e outros frameworks de agentes, essa skill melhora a confiabilidade porque fornece restricoes explicitas ao agente, em vez de forca-lo a inferir tudo do zero.
Depois de carregar as PixVerse Skills no agente, voce pode dar instrucoes em linguagem natural como:
- “Generate a 10-second product demo video from this screenshot”
- “Create four variations of this blog cover image in 16:9 format”
- “Animate this diagram into a 5-second explainer clip with ambient sound”
- “Generate three 8-second 16:9 promo clips with different camera motions”
O agente traduz essas instrucoes para os comandos CLI corretos, interpreta a saida JSON e cuida de polling e downloads sem intervencao manual.
Claude Code
No Claude Code, o PixVerse CLI vira uma ferramenta nativa que o agente usa de forma autonoma. Depois de carregar as PixVerse Skills, voce pode incluir geracao de midia em qualquer tarefa:
Generate a cover image for this blog post about machine learning,
use the seedream-5.0-lite model at 1800p in 16:9 format,
download it to ./assets/cover.webp
O Claude Code executa os comandos CLI corretos, extrai a URL da imagem da resposta JSON e baixa o arquivo para o caminho especificado, tudo na mesma sessao em que tambem escreve seu codigo.
Um fluxo tipico no Claude Code:
# Claude Code runs this autonomously based on your instruction
IMG=$(pixverse create image \
--prompt "Abstract visualization of neural network layers, dark background, blue and purple tones" \
--model seedream-5.0-lite \
--quality 1800p \
--aspect-ratio 16:9 \
--json | jq -r '.image_url')
# Then animates it
pixverse create video \
--prompt "Slow pan across glowing neural connections" \
--image "$IMG" \
--model v6 \
--quality 1080p \
--duration 6 \
--jsonCursor
Usuarios do Cursor podem carregar PixVerse Skills como arquivo de contexto de projeto. Coloque os arquivos de skill relevantes no diretorio .cursor/ ou adicione-os as regras do workspace. Depois de carregado, o Cursor conhece todos os comandos PixVerse CLI e pode gerar midia como parte de qualquer tarefa de desenvolvimento.
Um fluxo comum no Cursor: pedir ao agente para gerar uma imagem de mockup com base no design que voce esta construindo e usala como referencia diretamente na sessao do IDE, sem sair do editor.
Codex e outros agentes
PixVerse CLI e compativel com qualquer agente capaz de executar comandos shell e interpretar JSON. O formato de saida estruturado, com nomes de campo consistentes, codigos de erro previsiveis e mensagens separadas em stderr, garante integracao confiavel mesmo para agentes de script simples.
O contrato de codigos de saida simplifica o tratamento de erros:
| Codigo | Significado | Acao do agente |
|---|---|---|
| 1 | Erro geral | Verificar stderr e tentar novamente com entradas validadas |
| 0 | Sucesso | Interpretar saida JSON |
| 2 | Timeout | Tentar novamente com --timeout maior |
| 3 | Auth expirada | Executar pixverse auth login novamente |
| 4 | Sem creditos | Verificar saldo e notificar o usuario |
| 5 | Falha de geracao | Tentar parametros diferentes |
| 6 | Erro de validacao | Revisar valores de flags |
Pipelines de automacao
Depois de dominar os comandos individuais, o PixVerse CLI libera fluxos poderosos em varias etapas que rodam sem interacao do usuario.
Texto para imagem para video
Um dos pipelines mais uteis: gerar uma imagem em alta resolucao a partir de um prompt de texto e depois anima-la em video.
# Step 1: Generate a base image
IMG_RESULT=$(pixverse create image \
--prompt "A cyberpunk cityscape at night, neon lights reflecting on wet pavement" \
--model gemini-3.1-flash \
--quality 2160p \
--aspect-ratio 16:9 \
--json)
IMAGE_URL=$(echo "$IMG_RESULT" | jq -r '.image_url')
# Step 2: Animate it into a video
VID_RESULT=$(pixverse create video \
--prompt "Camera slowly pans across the neon-lit streets" \
--image "$IMAGE_URL" \
--model v6 \
--quality 1080p \
--duration 8 \
--json)
VIDEO_ID=$(echo "$VID_RESULT" | jq -r '.video_id')
# Step 3: Download the final video
pixverse asset download "$VIDEO_ID" --jsonPipeline completo de producao de video
Para uma saida mais polida, encadeie criacao com etapas de pos-processamento:
# Step 1: Create the base video
RESULT=$(pixverse create video \
--prompt "A product being assembled in slow motion" \
--model v6 \
--quality 720p \
--duration 5 \
--json)
VID=$(echo "$RESULT" | jq -r '.video_id')
# Step 2: Extend duration
EXTENDED=$(pixverse create extend \
--video "$VID" \
--prompt "Continue the assembly sequence" \
--duration 5 \
--json | jq -r '.video_id')
pixverse task wait "$EXTENDED" --json
# Step 3: Add ambient sound
WITH_SOUND=$(pixverse create sound \
--video "$EXTENDED" \
--prompt "Industrial workshop ambience, soft mechanical sounds" \
--json | jq -r '.video_id')
pixverse task wait "$WITH_SOUND" --json
# Step 4: Upscale to 1080p
FINAL=$(pixverse create upscale \
--video "$WITH_SOUND" \
--quality 1080p \
--json | jq -r '.video_id')
pixverse task wait "$FINAL" --json
# Step 5: Download
pixverse asset download "$FINAL" --jsonGeracao em lote
Para pipelines de conteudo que exigem varias variacoes, execute jobs em paralelo:
# Check credits first
CREDITS=$(pixverse account info --json | jq -r '.credits.total')
echo "Available credits: $CREDITS"
# Submit four parallel generations
pixverse create video --prompt "Sunrise over mountains" --no-wait --json > /tmp/v1.json &
pixverse create video --prompt "Sunset over ocean" --no-wait --json > /tmp/v2.json &
pixverse create video --prompt "Stars over a desert" --no-wait --json > /tmp/v3.json &
pixverse create video --prompt "Aurora over a frozen lake" --no-wait --json > /tmp/v4.json &
wait
# Wait for each and download
for f in /tmp/v1.json /tmp/v2.json /tmp/v3.json /tmp/v4.json; do
ID=$(jq -r '.video_id' "$f")
pixverse task wait "$ID" --json
pixverse asset download "$ID" --json
doneA flag --no-wait envia o job e retorna imediatamente com um ID de tarefa, permitindo enviar varios jobs antes do polling. O comando pixverse task wait faz o polling adaptativo para voce, sem loops manuais com sleep.
Configurando padroes
Se voce usa sempre o mesmo modelo, qualidade ou proporcao, defina esses valores como padrao para nao repetir flags em toda execucao:
pixverse config defaults set video model v6
pixverse config defaults set video quality 1080p
pixverse config defaults set image model seedream-5.0-lite
pixverse config set output-dir ~/Downloads/pixverse
pixverse config defaults showAs flags de linha de comando sempre sobrescrevem os padroes configurados, entao voce mantem flexibilidade total com menos repeticao.
O que voce pode construir
Com o PixVerse CLI integrado ao fluxo com agentes, o alcance das tarefas automatizaveis cresce bastante:
- Documentacao — gere automaticamente videos de demo de produto e screenshots como parte do build da documentacao
- Marketing — execute jobs noturnos em lote para produzir variacoes de conteudo para redes sociais a partir de uma unica biblioteca de prompts
- Desenvolvimento de apps — deixe seu agente de codigo gerar visuais placeholder, mockups animados e videos de tela de carregamento enquanto voce constroi a UI
- Pipelines de conteudo — encadeie chamadas CLI com outras ferramentas (ffmpeg, ImageMagick, cloud storage) para criar fluxos de producao de midia totalmente automatizados
- Prototipagem — gere conceitos de movimento em segundos para validar ideias antes de investir em producao completa
O CLI foi projetado para se encaixar naturalmente em qualquer fluxo baseado em shell. Se sua automacao atual roda em bash, Python, Node ou em pipeline de CI/CD, o PixVerse CLI entra sem sobrecarga adicional de integracao.
Checklist para comecar
- Instalar Node.js 20 ou superior
- Executar
npm install -g pixverse - Executar
pixverse auth logine autorizar no navegador - Executar
pixverse account infopara validar creditos - Gerar sua primeira imagem:
pixverse create image --prompt "..." --json - Gerar seu primeiro video:
pixverse create video --prompt "..." --json - Instalar PixVerse Skills para seu agente (Claude Code, Cursor ou Codex)
- Configurar seus padroes com
pixverse config defaults set - Montar seu primeiro pipeline de automacao
Mantendo o CLI atualizado
Use npm para manter seu CLI local atualizado:
npm update -g pixversePara mudancas por release e novos modelos suportados, consulte o changelog oficial da CLI:
Proximos passos
O PixVerse CLI no npm (npm install -g pixverse) oferece acesso imediato a geracao, polling de tarefas, gerenciamento de assets, pastas salvas e controles de workspace em uma unica interface. O repositorio PixVerse Skills adiciona orientacao pronta para agentes para que Claude Code, Cursor, Codex e outras ferramentas executem esses fluxos com mais confiabilidade.
A combinacao de um CLI confiavel com uma biblioteca de skills pronta para agentes permite manter geracao de imagem e video no mesmo fluxo do seu codigo, gerenciada pelo mesmo agente, no mesmo terminal e sem troca de ferramentas.
Comece com um unico comando. Evolua a partir dele.