PixVerse CLI: geração de vídeo, imagem e áudio com IA
Instale o PixVerse CLI v1.2.1, gere vídeos, imagens, voz e música, gerencie assets e automatize fluxos de mídia com agentes de IA.
Introducao
Todo fluxo de trabalho criativo tem um gargalo: o momento em que voce precisa sair do editor de codigo, abrir um navegador e clicar manualmente em uma interface web para gerar uma midia. Para desenvolvedores, agentes de IA e qualquer equipe que construa pipelines automatizados de conteudo, essa troca de contexto cria atrito que se acumula rapidamente.
PixVerse CLI elimina esse gargalo. Ele e a interface oficial de linha de comando da PixVerse e oferece acesso a geracao e workflows de workspace da PixVerse diretamente no terminal. Texto para video, imagem para video, texto para imagem, imagem para imagem, transicoes, lip-sync de fala, video de referencia, controle de movimento, templates, upscaling e gerenciamento de assets: tudo e scriptavel, encadeavel e disponivel sem abrir o navegador.
O que torna o PixVerse CLI especialmente poderoso e sua filosofia de design: ele foi criado com agentes de IA em mente. Cada comando retorna JSON estruturado, cada codigo de saida e deterministico e cada etapa do pipeline e composavel. Isso significa que voce pode ensinar Claude Code, Cursor, Codex ou qualquer outro agente a gerar imagens e videos em seu nome, e ele fara isso corretamente todas as vezes.
Este guia reflete o PixVerse CLI v1.2.1 e conduz voce por toda a jornada: da instalacao a primeira geracao, e depois para pipelines de automacao em varias etapas e fluxos nativos para agentes.
Pre-requisitos
Antes de comecar, voce precisa de:
- Node.js 20 ou superior — verifique com
node --version - Uma conta PixVerse — cadastre-se em pixverse.ai
- Uma assinatura PixVerse ativa — o CLI usa o mesmo sistema de creditos do site; apenas usuarios assinantes podem gerar conteudo
O PixVerse CLI nao exige copia manual de chaves de API. A autenticacao e feita por um fluxo OAuth via navegador que armazena seu token localmente.
Passo 1: Instalar o CLI
Instale globalmente com npm:
Verifique a instalacao:
Se preferir nao instalar globalmente, voce tambem pode executar comandos via npx:
Passo 2: Autenticar
Execute o comando de login:
O CLI abre um navegador para autorizacao OAuth por dispositivo. Voce tambem pode copiar a URL e concluir a autorizacao em qualquer navegador e dispositivo, o que e util em ambientes SSH e headless. Seu token e armazenado automaticamente em ~/.pixverse/ e tem validade de 30 dias.
Para verificar se voce esta autenticado e conferir os creditos disponiveis:
O comando account info mostra seu nivel de assinatura, creditos do workspace e contexto de uso. pixverse account usage ajuda a revisar o consumo de creditos, enquanto pixverse account slots mostra os slots atuais de geracao concorrente para jobs de imagem e video. Sempre confira saldo e slots antes de rodar jobs em lote.
Passo 3: Gerar sua primeira imagem
A geracao de texto para imagem e a forma mais rapida de validar sua configuracao. Execute:
Na v1.2.1, create image usa GPT Image 2 por padrao. A flag --json retorna saida estruturada:
Para gerar em resolucao maior, especifique um modelo que suporte esse nivel:
O PixVerse suporta varios modelos de imagem, cada um com limites de resolucao e suporte de proporcao diferentes:
| Modelo | Valor --model | Qualidade | Notas |
|---|---|---|---|
| GPT Image 2 | gpt-image-2.0 | 1080p, 1440p, 2160p | Modelo de imagem padrao; suporta proporcoes horizontais e verticais |
| Nano Banana 2 | gemini-3.1-flash | 512p, 1080p, 1440p, 2160p | Suporte flexivel para auto e proporcoes padrao |
| Qwen Image | qwen-image | 720p, 1080p | Geracao rapida para tarefas criativas comuns |
| Nano Banana Pro | gemini-3.0 | 1080p, 1440p, 2160p | Criacao de imagens de alta qualidade em tamanhos maiores |
| Nano Banana | gemini-2.5-flash | 1080p | Geracao leve com retorno rapido |
| Seedream 5.0 Lite | seedream-5.0-lite | 1440p, 1800p, 2160p | Imagens criativas com alto nivel de detalhe |
| Seedream 4.5 | seedream-4.5 | 1440p, 2160p | Geracao de imagens em alta resolucao |
| Seedream 4.0 | seedream-4.0 | 1080p, 1440p, 2160p | Opcao Seedream adicional para workflows de imagem |
| Kling Image O3 | kling-image-o3 | 1080p, 1440p, 2160p | Saidas visuais estilizadas com enquadramento flexivel |
| Kling Image V3 | kling-image-v3 | 1080p, 1440p | Equilibrio entre qualidade e velocidade |
Voce tambem pode transformar uma imagem existente com image-to-image:
Para baixar a imagem gerada:
Passo 4: Gerar seu primeiro video
Texto para video funciona da mesma forma. Gere um clipe de 5 segundos:
Para uma geracao totalmente personalizada:
A flag --audio ativa som ambiente gerado por IA que combina com o conteudo do video. A flag --json retorna video_url ao concluir, que voce pode encaminhar diretamente para download ou para a proxima etapa do pipeline.
O PixVerse oferece varios modelos de video com diferentes capacidades de qualidade, duracao e modo:
| Modelo | Valor --model | Qualidade maxima | Duracao | Notas |
|---|---|---|---|---|
| PixVerse V6 | v6 | 1080p | 1–15 sec | Modelo de video padrao; amplo suporte a proporcoes |
| PixVerse C1 | pixverse-c1 | 1080p | 1–15 sec | Forte suporte para video, referencia e transicao |
| Seedance 2.0 Standard | seedance-2.0-standard | 1080p | 4–15 sec | Suporta modos de video, referencia e transicao |
| Seedance 2.0 Fast | seedance-2.0-fast | 720p | 4–15 sec | Opcao Seedance mais rapida para video, referencia e transicao |
| Happy Horse 1.0 | happyhorse-1.0 | 1080p | 3–15 sec | Opcao de video sensivel a audio disponivel em create video |
| Kling O3 Pro | kling-o3-pro | 720p | 3–15 sec | Suporta workflows de video, referencia e transicao |
| Kling O3 Standard | kling-o3-standard | 720p | 3–15 sec | Opcao Kling O3 padrao |
| Kling 3.0 Pro | kling-3.0-pro | 720p | 3–15 sec | Suporta workflows de video e transicao |
| Kling 3.0 Standard | kling-3.0-standard | 720p | 3–15 sec | Opcao Kling 3.0 padrao |
| Grok Imagine 1.5 | grok-imagine-1.5 | 720p | 1–15 sec | Image-to-video only; requires --image and follows the input image aspect ratio |
| Grok Imagine 1.5 | grok-imagine-1.5 | 720p | 1–15 sec | Image-to-video only; requires --image and follows the input image aspect ratio |
| Grok Imagine 1.5 | grok-imagine-1.5 | 720p | 1–15 sec | Image-to-video only; requires --image and follows the input image aspect ratio |
| Grok Imagine 1.5 | grok-imagine-1.5 | 720p | 1–15 sec | Image-to-video only; requires --image and follows the input image aspect ratio |
| Grok Imagine | grok-imagine | 720p | 1–15 sec | Suporta video, extend e reference |
| Veo 3.1 Lite | veo-3.1-lite | 1080p | 4, 6 ou 8 sec | Suporta video e transicoes de 2 frames |
| Veo 3.1 Standard | veo-3.1-standard | 2160p | 4, 6 ou 8 sec | Opcao Veo de maior resolucao |
| Veo 3.1 Fast | veo-3.1-fast | 2160p | 4, 6 ou 8 sec | Opcao Veo mais rapida |
| Sora 2 Pro | sora-2-pro | 1080p | 4, 8 ou 12 sec | Opcao Sora com duracao fixa |
| Sora 2 | sora-2 | 720p | 4, 8 ou 12 sec | Opcao Sora padrao |
| PixVerse v5.6 | v5.6 | 1080p | 1–10 sec | Ainda usado para motion-control e alguns workflows de geracao |
Animar uma imagem estatica
Para transformar uma foto ou imagem gerada em video, use a flag --image:
Voce pode informar um caminho local ou uma URL. Arquivos locais sao enviados automaticamente, sem etapa manual de upload. Imagens locais maiores que 1920x1920 ou 5MB sao redimensionadas ou comprimidas automaticamente antes do upload; URLs remotas sao validadas pelo backend como estao.
Usar referencia, transicao, controle de movimento e templates
O CLI atual oferece mais do que texto para video e imagem para video. Estes modos de criacao ajudam quando voce precisa de mais controle sobre personagens, keyframes, edicoes ou efeitos:
Nem todo modelo suporta todos os modos de criacao. Por exemplo, create reference agora suporta v6, pixverse-c1, Seedance 2.0, Kling O3, grok-imagine e v5.6; create modify esta ligado ao v5.5; create motion-control usa v5.6; e lip-sync usa v5.
Step 5: Generate Voice and Music
PixVerse CLI v1.2.0 replaced the older lip-sync speech command with dedicated audio creation commands. Use create voice for text-to-speech and create music for prompt-to-music generation. Voice and music outputs are saved as audio assets, so you can track them with task, list them with asset list --type audio, and download them with asset download --type audio.
Generate voice audio:
Browse voice models and preset voices:
Generate music:
Current voice model families include MiniMax Speech 2.8 and ElevenLabs models. Current music model families include MiniMax Music, ElevenLabs Music, and Google Lyria 3 Pro. Use pixverse voice models and pixverse music models for the live catalog before scripting a production workflow.
Passo 6: Executar o assistente interativo
Se voce esta explorando pela primeira vez e ainda nao conhece todas as flags disponiveis, execute qualquer comando de criacao sem argumentos para entrar no assistente guiado:
O assistente guia voce por prompt, selecao de modelo, qualidade, proporcao, duracao e outras opcoes passo a passo, o que ajuda a descobrir parametros antes de transformar tudo em script.
Alem da geracao: gerencie assets e workspace
A versao mais recente do PixVerse CLI tambem inclui comandos de gerenciamento para fluxos completos no terminal:
pixverse task status <id>epixverse task wait <id>para polling de tarefaspixverse task status --ids 123,456,789 --type video --jsonpara checagens de status em lotepixverse asset list,asset upload,asset info,asset downloadeasset deletepara operacoes de ciclo de vida de assetspixverse saved list,saved items,saved new,saved rename,saved add,saved removeesaved deletepara pastas salvaspixverse template categories,template list,template searchetemplate infopara descobrir efeitos e templatespixverse workspace list,workspace status,workspace switcheworkspace managepara operacoes multi-workspacepixverse account info,account usageeaccount slotspara verificar creditos, uso e concorrenciapixverse config set,config list,config patheconfig defaultspara padroes locais reutilizaveis
Isso permite automatizar nao apenas a criacao, mas tambem organizacao, descoberta de templates, download, roteamento de workspace e entrega em um unico script. Se precisar executar um comando em outro workspace, use a flag global --workspace-id <id>; 0 aponta para o workspace pessoal.
Flags amigaveis para scripts
A maior parte da automacao depende de saida e comportamento previsiveis. Estas flags sao especialmente uteis em scripts e workflows com agentes de IA:
| Flag | Uso |
|---|---|
--json | Retorna saida JSON estruturada |
-p | Alias curto para --json |
--count <n> | Gera 1–4 variacoes a partir de uma solicitacao |
--seed <number> | Facilita reproduzir uma geracao |
--off-peak | Usa preco off-peak quando disponivel |
--audio / --no-audio | Ativa ou desativa audio em comandos compativeis |
--multi-shot / --no-multi-shot | Ativa ou desativa multi-shot para video |
--no-wait | Envia o job e retorna imediatamente |
--timeout <sec> | Define o timeout de polling, com padrao de 300 segundos |
--workspace-id <id> | Sobrescreve o workspace ativo para um unico comando |
--trace-id <uuid> | Attach a caller-supplied UUIDv4 to API requests for debugging and observability |
--idempotency-key <key> | Safely retry creation requests without accidentally creating duplicate charged jobs |
--trace-id <uuid> | Attach a caller-supplied UUIDv4 to API requests for debugging and observability |
--idempotency-key <key> | Safely retry creation requests without accidentally creating duplicate charged jobs |
--trace-id <uuid> | Attach a caller-supplied UUIDv4 to API requests for debugging and observability |
--idempotency-key <key> | Safely retry creation requests without accidentally creating duplicate charged jobs |
--trace-id <uuid> | Attach a caller-supplied UUIDv4 to API requests for debugging and observability |
--idempotency-key <key> | Safely retry creation requests without accidentally creating duplicate charged jobs |
Ensine seu agente de IA a gerar midia
E aqui que o PixVerse CLI se torna realmente transformador. Como cada comando retorna JSON estruturado e usa codigos de saida deterministicos, qualquer agente de IA que execute comandos shell pode aprender a gerar imagens e videos sob demanda.
Instalando PixVerse Skills
PixVerse Skills e uma biblioteca estruturada de skills que ensina os agentes a usar o CLI corretamente: flags de comando, limites de modelos, pipelines em varias etapas e tratamento robusto de erros.
Para Claude Code e outros agentes que suportam o formato de skills, adicione as PixVerse skills diretamente:
Para Cursor, Claude Code, Codex e outros frameworks de agentes, essa skill melhora a confiabilidade porque fornece restricoes explicitas ao agente, em vez de forca-lo a inferir tudo do zero.
Depois de carregar as PixVerse Skills no agente, voce pode dar instrucoes em linguagem natural como:
- “Generate a 10-second product demo video from this screenshot”
- “Create four variations of this blog cover image in 16:9 format”
- “Animate this diagram into a 5-second explainer clip with ambient sound”
- “Generate three 8-second 16:9 promo clips with different camera motions”
O agente traduz essas instrucoes para os comandos CLI corretos, interpreta a saida JSON e cuida de polling e downloads sem intervencao manual.
Claude Code
No Claude Code, o PixVerse CLI vira uma ferramenta nativa que o agente usa de forma autonoma. Depois de carregar as PixVerse Skills, voce pode incluir geracao de midia em qualquer tarefa:
O Claude Code executa os comandos CLI corretos, extrai a URL da imagem da resposta JSON e baixa o arquivo para o caminho especificado, tudo na mesma sessao em que tambem escreve seu codigo.
Um fluxo tipico no Claude Code:
Cursor
Usuarios do Cursor podem carregar PixVerse Skills como arquivo de contexto de projeto. Coloque os arquivos de skill relevantes no diretorio .cursor/ ou adicione-os as regras do workspace. Depois de carregado, o Cursor conhece todos os comandos PixVerse CLI e pode gerar midia como parte de qualquer tarefa de desenvolvimento.
Um fluxo comum no Cursor: pedir ao agente para gerar uma imagem de mockup com base no design que voce esta construindo e usala como referencia diretamente na sessao do IDE, sem sair do editor.
Codex e outros agentes
PixVerse CLI e compativel com qualquer agente capaz de executar comandos shell e interpretar JSON. O formato de saida estruturado, com nomes de campo consistentes, codigos de erro previsiveis e mensagens separadas em stderr, garante integracao confiavel mesmo para agentes de script simples.
O contrato de codigos de saida simplifica o tratamento de erros:
| Codigo | Significado | Acao do agente |
|---|---|---|
| 0 | Sucesso | Interpretar saida JSON |
| 1 | Erro geral | Verificar stderr e tentar novamente com entradas validadas |
| 2 | Timeout | Tentar novamente com --timeout maior |
| 3 | Auth expirada | Executar pixverse auth login novamente |
| 4 | Sem creditos | Verificar saldo e notificar o usuario |
| 5 | Falha de geracao | Tentar parametros diferentes |
| 6 | Erro de validacao | Revisar valores de flags |
Pipelines de automacao
Depois de dominar os comandos individuais, o PixVerse CLI libera fluxos poderosos em varias etapas que rodam sem interacao do usuario.
Texto para imagem para video
Um dos pipelines mais uteis: gerar uma imagem em alta resolucao a partir de um prompt de texto e depois anima-la em video.
Pipeline completo de producao de video
For polished output, chain creation with post-processing steps. create sound was removed in v1.1.8 and create speech was removed in v1.2.0, so use --audio or --no-audio on supported video creation commands, create voice for text-to-speech audio, and create music for standalone music assets:
Geracao em lote
Para pipelines de conteudo que exigem varias variacoes, execute jobs em paralelo:
A flag --no-wait envia o job e retorna imediatamente com um ID de tarefa, permitindo enviar varios jobs antes do polling. Em versoes recentes, --no-wait --json tambem retorna os parametros de criacao resolvidos, util para logs e reprodutibilidade. Use --count <n> quando quiser varias variacoes de um prompt e task status --ids quando quiser uma resposta de status para varios jobs em execucao. O comando pixverse task wait faz o polling adaptativo para voce, sem loops manuais com sleep.
Configurando padroes
Se voce usa sempre o mesmo modelo, qualidade ou proporcao, defina esses valores como padrao para nao repetir flags em toda execucao:
As flags de linha de comando sempre sobrescrevem os padroes configurados, entao voce mantem flexibilidade total com menos repeticao. Para automacao especifica de workspace, adicione --workspace-id <id> quando quiser sobrescrever o workspace ativo apenas para aquela execucao.
O que voce pode construir
Com o PixVerse CLI integrado ao fluxo com agentes, o alcance das tarefas automatizaveis cresce bastante:
- Documentacao — gere automaticamente videos de demo de produto e screenshots como parte do build da documentacao
- Marketing — execute jobs noturnos em lote para produzir variacoes de conteudo para redes sociais a partir de uma unica biblioteca de prompts
- Desenvolvimento de apps — deixe seu agente de codigo gerar visuais placeholder, mockups animados e videos de tela de carregamento enquanto voce constroi a UI
- Pipelines de conteudo — encadeie chamadas CLI com outras ferramentas (ffmpeg, ImageMagick, cloud storage) para criar fluxos de producao de midia totalmente automatizados
- Prototipagem — gere conceitos de movimento em segundos para validar ideias antes de investir em producao completa
O CLI foi projetado para se encaixar naturalmente em qualquer fluxo baseado em shell. Se sua automacao atual roda em bash, Python, Node ou em pipeline de CI/CD, o PixVerse CLI entra sem sobrecarga adicional de integracao.
Checklist para comecar
- Instalar Node.js 20 ou superior
- Executar
npm install -g pixverse - Executar
pixverse auth logine autorizar no navegador - Executar
pixverse account infopara validar creditos - Executar
pixverse account slotsantes de trabalho batch concorrente - Gerar sua primeira imagem:
pixverse create image --prompt "..." --json - Gerar seu primeiro video:
pixverse create video --prompt "..." --json - Explorar templates com
pixverse template list - Instalar PixVerse Skills para seu agente (Claude Code, Cursor ou Codex)
- Configurar seus padroes com
pixverse config defaults set - Montar seu primeiro pipeline de automacao
Mantendo o CLI atualizado
Use npm para manter seu CLI local atualizado:
Para mudancas por release e novos modelos suportados, consulte o changelog oficial da CLI:
As of v1.2.1, recent changes include Grok Imagine 1.5 image-to-video support, dedicated create voice and create music commands, audio asset management, capabilities.json for agents, pixverse update, stdin support for text inputs, --trace-id, and expanded Seedance 2.0 reference-image limits.
Proximos passos
O PixVerse CLI no npm (npm install -g pixverse) oferece acesso imediato a geracao, polling de tarefas, gerenciamento de assets, templates, pastas salvas, verificacoes de conta e controles de workspace em uma unica interface. O repositorio PixVerse Skills adiciona orientacao pronta para agentes para que Claude Code, Cursor, Codex e outras ferramentas executem esses fluxos com mais confiabilidade.
A combinacao de um CLI confiavel com uma biblioteca de skills pronta para agentes permite manter geracao de imagem e video no mesmo fluxo do seu codigo, gerenciada pelo mesmo agente, no mesmo terminal e sem troca de ferramentas.
Comece com um unico comando. Evolua a partir dele.