PixVerse CLI: Geração de Vídeo e Imagem com IA para Desenvolvedores

Aprenda a instalar o PixVerse CLI, gerar sua primeira imagem e vídeo com IA e automatizar fluxos de trabalho criativos no Claude Code, Cursor e agentes de IA.

Product Update
PixVerse CLI: Geração de Vídeo e Imagem com IA para Desenvolvedores

PixVerse CLI: Geração de Vídeo e Imagem com IA para Desenvolvedores

Introdução

Todo fluxo de trabalho criativo tem um gargalo — o momento em que você precisa sair do editor de código, abrir um navegador e clicar manualmente em uma interface web para gerar uma mídia. Para desenvolvedores, agentes de IA e qualquer pessoa que construa pipelines automatizados de conteúdo, essa troca de contexto gera atrito que se acumula rapidamente.

O PixVerse CLI elimina esse gargalo. É a interface de linha de comando oficial do PixVerse, dando a você acesso a todos os modelos, todos os recursos e todas as capacidades da plataforma PixVerse — diretamente do seu terminal. Texto para vídeo, imagem para vídeo, texto para imagem, sincronização labial com voz, efeitos sonoros, upscaling — tudo scriptável, tudo encadeável, tudo disponível sem tocar em um navegador.

O que torna o PixVerse CLI particularmente poderoso é sua filosofia de design: ele foi criado com agentes de IA em mente. Cada comando retorna JSON estruturado, cada código de saída é determinístico e cada etapa do pipeline é composável. Isso significa que você pode ensinar o Claude Code, o Cursor, o Codex ou qualquer outro agente a gerar imagens e vídeos em seu nome — e eles farão isso corretamente, sempre.

Este guia percorre toda a jornada: da instalação à sua primeira geração, passando por pipelines de automação em várias etapas e fluxos de trabalho nativos para agentes.

Pré-requisitos

Antes de começar, você precisa de:

  • Node.js 20 ou superior — verifique com node --version
  • Uma conta PixVerse — cadastre-se em pixverse.ai
  • Uma assinatura ativa do PixVerse — o CLI usa o mesmo sistema de créditos do site; apenas usuários com assinatura podem gerar conteúdo

O PixVerse CLI não exige que nenhuma chave de API seja copiada manualmente. A autenticação é feita por meio de um fluxo OAuth baseado em navegador que armazena seu token localmente.

Passo 1: Instalar o CLI

Instale globalmente com npm:

npm install -g pixverse

Verifique a instalação:

pixverse --version

Se preferir não instalar globalmente, você também pode executar comandos via npx:

npx pixverse create video --prompt "Um gato caminhando em Marte"

Passo 2: Autenticar

Execute o comando de login:

pixverse auth login

O CLI exibirá uma URL curta e um código. Abra a URL no seu navegador, insira o código e autorize com sua conta PixVerse. Seu token é armazenado automaticamente em ~/.pixverse/ e é válido por 30 dias.

Para verificar se você está logado e conferir seus créditos disponíveis:

pixverse auth status
pixverse account info

O comando account info exibe seu nível de assinatura, créditos restantes e o cronograma de recarga diária de créditos. Sempre verifique seu saldo antes de executar tarefas em lote.

Passo 3: Gerar Sua Primeira Imagem

A geração de texto para imagem é a forma mais rápida de testar sua configuração. Execute:

pixverse create image --prompt "Um caminho florestal fotorrealista na hora dourada" --json

O flag --json retorna uma saída estruturada:

{
  "image_id": 789012,
  "status": "completed",
  "image_url": "https://...",
  "prompt": "A photorealistic forest path at golden hour",
  "model": "qwen-image",
  "width": 1024,
  "height": 1024
}

Para saída em resolução mais alta, especifique um modelo que suporte isso:

pixverse create image \
  --prompt "Um caminho florestal fotorrealista na hora dourada" \
  --model seedream-5.0-lite \
  --quality 1800p \
  --aspect-ratio 16:9 \
  --json

O PixVerse oferece suporte a vários modelos de imagem, cada um com diferentes limites de resolução e pontos fortes:

ModeloResolução MáximaMelhor Para
qwen-image1080pGeração rápida, uso geral
seedream-5.0-lite1800pImagens criativas com alto nível de detalhe
seedream-4.52160pUltra-alta resolução
gemini-3.1-flash (Nano Banana 2)2160pAmpla gama de resoluções, rápido
gemini-3.0 (Nano Banana Pro)2160pAlta qualidade em escala
gemini-2.5-flash (Nano Banana)1080pLeve, retorno rápido

Para baixar a imagem gerada:

pixverse asset download 789012

Passo 4: Gerar Seu Primeiro Vídeo

Texto para vídeo funciona da mesma forma. Gere um clipe de 5 segundos:

pixverse create video --prompt "Um pôr do sol sobre as ondas do oceano" --json

Para uma geração totalmente personalizada:

pixverse create video \
  --prompt "Uma tomada cinematográfica de drone sobre um vale montanhoso neblinoso ao amanhecer" \
  --model v5.6 \
  --quality 1080p \
  --aspect-ratio 16:9 \
  --duration 8 \
  --audio \
  --json

O flag --audio ativa som ambiente gerado por IA que combina com o conteúdo do seu vídeo. O flag --json retorna uma video_url ao concluir, que você pode passar diretamente para um comando de download ou para o próximo passo em um pipeline.

O PixVerse oferece múltiplos modelos de vídeo com capacidades diferentes:

ModeloQualidade MáximaDuraçãoObservações
v5.61080p1–10 segMais flexível; maior variedade de duração
sora-2-pro1080p4, 8, 12 segSaída cinematográfica de alta qualidade
veo-3.1-standard1080p4, 6, 8 segSuporta modo Transição
grok-imagine720p1–15 segMaior duração máxima

Animar uma Imagem Estática

Para transformar uma foto ou imagem gerada em um vídeo, use o flag --image:

pixverse create video \
  --prompt "Uma brisa suave move-se pela cena" \
  --image ./product-photo.jpg \
  --model v5.6 \
  --quality 1080p \
  --json

Você pode passar um caminho de arquivo local ou uma URL. Arquivos locais são enviados automaticamente — nenhuma etapa manual de upload é necessária.

Passo 5: Executar o Assistente Interativo

Se você está explorando pela primeira vez e ainda não está familiarizado com todos os flags disponíveis, execute qualquer comando de criação sem argumentos para entrar no assistente guiado:

pixverse create video
pixverse create image

O assistente guia você passo a passo pelo prompt, seleção de modelo, qualidade, proporção de tela, duração e outras opções — útil para descobrir quais parâmetros estão disponíveis antes de scriptá-los.

Ensinando Seu Agente de IA a Gerar Mídia

É aqui que o PixVerse CLI se torna verdadeiramente transformador. Como cada comando retorna JSON estruturado e usa códigos de saída determinísticos, qualquer agente de IA capaz de executar comandos shell pode ser ensinado a gerar imagens e vídeos sob demanda.

Instalando as PixVerse Skills

PixVerse Skills é uma biblioteca de arquivos de skill estruturados que ensina aos agentes exatamente como usar o CLI: quais flags cada comando aceita, quais modelos suportam quais parâmetros, como encadear comandos em pipelines e como tratar erros.

Para o Claude Code e outros agentes que suportam o formato de skills, adicione as PixVerse skills diretamente:

npx skills add https://github.com/pixverseai/skills --skill pixverse-ai-image-and-video-generator

Para o Cursor, as skills ficam em skills/ no repositório GitHub do PixVerse Skills e podem ser carregadas como contexto diretamente no seu editor. Para o Codex e agentes baseados em LangChain, cada arquivo de skill é um markdown autocontido que pode ser injetado no prompt de sistema do agente.

Depois que seu agente tiver as PixVerse skills carregadas, você pode dar a ele instruções em linguagem natural como:

  • “Gere um vídeo de demonstração de produto de 10 segundos a partir deste screenshot”
  • “Crie quatro variações desta imagem de capa de blog no formato 16:9”
  • “Anime este diagrama em um clipe explicativo de 5 segundos com som ambiente”

O agente traduzirá essas instruções nos comandos CLI corretos, analisará a saída JSON e gerenciará polling e downloads — sem intervenção manual.

Claude Code

No Claude Code, o PixVerse CLI torna-se uma ferramenta nativa que o agente usa de forma autônoma. Depois de carregar as PixVerse skills, você pode incluir a geração de mídia diretamente em qualquer tarefa:

Gere uma imagem de capa para este post do blog sobre machine learning,
use o modelo seedream-5.0-lite em 1800p no formato 16:9,
faça o download para ./assets/cover.webp

O Claude Code invocará os comandos CLI corretos, analisará a URL da imagem a partir da resposta JSON e fará o download do arquivo para o caminho especificado — tudo dentro da mesma sessão em que também está escrevendo seu código.

Um fluxo de trabalho típico no Claude Code:

# Claude Code executa isso de forma autônoma com base na sua instrução
IMG=$(pixverse create image \
  --prompt "Visualização abstrata de camadas de rede neural, fundo escuro, tons de azul e roxo" \
  --model seedream-5.0-lite \
  --quality 1800p \
  --aspect-ratio 16:9 \
  --json | jq -r '.image_url')
 
# Em seguida, anima a imagem
pixverse create video \
  --prompt "Panorâmica lenta pelas conexões neurais brilhantes" \
  --image "$IMG" \
  --model v5.6 \
  --quality 1080p \
  --duration 6 \
  --json

Cursor

Os usuários do Cursor podem carregar as PixVerse Skills como um arquivo de contexto do projeto. Coloque os arquivos de skill relevantes no seu diretório .cursor/ ou adicione-os às regras do seu workspace. Uma vez carregado, o Cursor tem pleno conhecimento de todos os comandos do PixVerse CLI e pode gerar mídia como parte de qualquer tarefa de codificação.

Um fluxo de trabalho comum no Cursor: pedir ao agente para gerar uma imagem de mockup baseada em um design que você está criando, e então usá-la como referência diretamente na sessão do IDE — sem sair do editor.

Codex e Outros Agentes

O PixVerse CLI é compatível com qualquer agente capaz de executar comandos shell e analisar JSON. O formato de saída estruturado — nomes de campos consistentes, códigos de erro previsíveis e mensagens de erro separadas via stderr — garante que mesmo agentes de script simples possam integrar a geração de forma confiável.

O contrato de código de saída torna o tratamento de erros simples:

CódigoSignificadoAção do Agente
0SucessoAnalisar saída JSON
2TimeoutTentar novamente com --timeout maior
3Autenticação expiradaExecutar pixverse auth login novamente
4Sem créditosVerificar saldo, notificar usuário
5Falha na geraçãoTentar parâmetros diferentes
6Erro de validaçãoRevisar valores dos flags

Pipelines de Automação

Depois de entender os comandos individuais, o PixVerse CLI desbloqueia fluxos de trabalho poderosos em várias etapas que rodam completamente sem interação do usuário.

Texto para Imagem para Vídeo

Um dos pipelines mais úteis: gerar uma imagem de alta resolução a partir de um prompt de texto e então animá-la em um vídeo.

# Passo 1: Gerar uma imagem base
IMG_RESULT=$(pixverse create image \
  --prompt "Uma paisagem urbana cyberpunk à noite, luzes de néon refletidas no asfalto molhado" \
  --model gemini-3.1-flash \
  --quality 2160p \
  --aspect-ratio 16:9 \
  --json)
 
IMAGE_URL=$(echo "$IMG_RESULT" | jq -r '.image_url')
 
# Passo 2: Animá-la em um vídeo
VID_RESULT=$(pixverse create video \
  --prompt "A câmera faz uma panorâmica lenta pelas ruas iluminadas de néon" \
  --image "$IMAGE_URL" \
  --model v5.6 \
  --quality 1080p \
  --duration 8 \
  --json)
 
VIDEO_ID=$(echo "$VID_RESULT" | jq -r '.video_id')
 
# Passo 3: Baixar o vídeo final
pixverse asset download "$VIDEO_ID" --json

Pipeline Completo de Produção de Vídeo

Para uma saída polida, encadeie criação com etapas de pós-processamento:

# Passo 1: Criar o vídeo base
RESULT=$(pixverse create video \
  --prompt "Um produto sendo montado em câmera lenta" \
  --model v5.6 \
  --quality 720p \
  --duration 5 \
  --json)
 
VID=$(echo "$RESULT" | jq -r '.video_id')
 
# Passo 2: Estender a duração
EXTENDED=$(pixverse create extend \
  --video "$VID" \
  --prompt "Continuar a sequência de montagem" \
  --duration 5 \
  --json | jq -r '.video_id')
 
pixverse task wait "$EXTENDED" --json
 
# Passo 3: Adicionar som ambiente
WITH_SOUND=$(pixverse create sound \
  --video "$EXTENDED" \
  --prompt "Ambiente de oficina industrial, sons mecânicos suaves" \
  --json | jq -r '.video_id')
 
pixverse task wait "$WITH_SOUND" --json
 
# Passo 4: Fazer upscale para 1080p
FINAL=$(pixverse create upscale \
  --video "$WITH_SOUND" \
  --quality 1080p \
  --json | jq -r '.video_id')
 
pixverse task wait "$FINAL" --json
 
# Passo 5: Baixar
pixverse asset download "$FINAL" --json

Geração em Lote

Para pipelines de conteúdo que requerem múltiplas variações, execute tarefas em paralelo:

# Verificar créditos primeiro
CREDITS=$(pixverse account info --json | jq -r '.credits.total')
echo "Créditos disponíveis: $CREDITS"
 
# Enviar quatro gerações em paralelo
pixverse create video --prompt "Nascer do sol sobre montanhas" --no-wait --json > /tmp/v1.json &
pixverse create video --prompt "Pôr do sol sobre o oceano" --no-wait --json > /tmp/v2.json &
pixverse create video --prompt "Estrelas sobre um deserto" --no-wait --json > /tmp/v3.json &
pixverse create video --prompt "Aurora boreal sobre um lago congelado" --no-wait --json > /tmp/v4.json &
wait
 
# Aguardar cada um e baixar
for f in /tmp/v1.json /tmp/v2.json /tmp/v3.json /tmp/v4.json; do
  ID=$(jq -r '.video_id' "$f")
  pixverse task wait "$ID" --json
  pixverse asset download "$ID" --json
done

O flag --no-wait envia a tarefa e retorna imediatamente com um ID de tarefa, permitindo que você envie múltiplas tarefas antes de fazer polling. O comando pixverse task wait gerencia o polling adaptativo para você — sem necessidade de loops manuais com sleep.

Configurando Padrões

Se você usa consistentemente o mesmo modelo, qualidade ou proporção de tela, defina-os como padrões para não precisar repetir os flags toda vez:

pixverse config defaults set --mode video --model v5.6 --quality 1080p --aspect-ratio 16:9
pixverse config defaults set --mode image --model seedream-5.0-lite --quality 1800p
pixverse config set output-dir ~/Downloads/pixverse

Os flags da linha de comando sempre substituem os padrões configurados, então você mantém total flexibilidade enquanto reduz a repetição.

O Que Você Pode Construir

Com o PixVerse CLI integrado ao seu fluxo de trabalho de agente, a variedade de tarefas automatizáveis se expande consideravelmente:

  • Documentação — gere automaticamente vídeos de demonstração de produtos e screenshots como parte do seu processo de build de documentação
  • Marketing — execute tarefas noturnas em lote que produzem variações de conteúdo para redes sociais a partir de uma única biblioteca de prompts
  • Desenvolvimento de apps — deixe seu agente de codificação gerar visuais de placeholder, animações de mockup ou vídeos de tela de carregamento enquanto você constrói a interface
  • Pipelines de conteúdo — encadeie chamadas CLI com outras ferramentas (ffmpeg, ImageMagick, armazenamento em nuvem) para criar fluxos de trabalho de produção de mídia totalmente automatizados
  • Prototipagem — gere conceitos de movimento rápidos em segundos para validar ideias antes de se comprometer com a produção completa

O CLI foi projetado para se encaixar naturalmente em qualquer fluxo de trabalho baseado em shell. Se sua automação existente roda em bash, Python, Node ou um pipeline de CI/CD, o PixVerse CLI se integra sem nenhuma sobrecarga adicional de integração.

Lista de Verificação para Começar

  • Instalar Node.js 20 ou superior
  • Executar npm install -g pixverse
  • Executar pixverse auth login e autorizar no navegador
  • Executar pixverse account info para verificar créditos
  • Gerar sua primeira imagem: pixverse create image --prompt "..." --json
  • Gerar seu primeiro vídeo: pixverse create video --prompt "..." --json
  • Instalar as PixVerse Skills para seu agente (Claude Code, Cursor ou Codex)
  • Configurar seus padrões preferidos com pixverse config defaults set
  • Criar seu primeiro pipeline de automação

Próximos Passos

O PixVerse CLI no npm (npm install -g pixverse) dá a você acesso imediato a todas as capacidades de geração. O repositório PixVerse Skills fornece os arquivos de skill estruturados que ensinam seu agente de IA a usar essas capacidades corretamente em qualquer contexto.

A combinação de um CLI confiável e uma biblioteca de skills pronta para agentes significa que a geração de imagens e vídeos agora pode viver dentro do mesmo fluxo de trabalho que o seu código — gerenciado pelo mesmo agente, no mesmo terminal, sem troca de ferramentas.

Comece com um único comando. Construa a partir daí.