PixVerse CLI: KI-Video-, Bild- und Audiogenerierung
Installieren Sie PixVerse CLI v1.2.1, erzeugen Sie Videos, Bilder, Stimme und Musik, verwalten Sie Assets und automatisieren Sie Medienworkflows mit KI-Agenten.
Einführung
Jeder kreative Workflow hat einen Engpass: den Moment, in dem Sie den Code-Editor verlassen, einen Browser öffnen und sich manuell durch eine Weboberfläche klicken müssen, um ein Medium zu generieren. Für Entwickler, KI-Agenten und Teams, die automatisierte Content-Pipelines aufbauen, summiert sich dieser Kontextwechsel schnell.
PixVerse CLI beseitigt diesen Engpass. Es ist die offizielle Befehlszeilenschnittstelle für PixVerse und gibt Ihnen direkten Zugriff auf PixVerse-Generierung und Workspace-Workflows im Terminal. Text-to-video, image-to-video, text-to-image, image-to-image, transitions, lip-sync speech, reference video, motion control, templates, upscaling und Asset-Management sind skriptfähig, pipe-fähig und ohne Browser nutzbar.
PixVerse CLI ist besonders stark, weil es mit KI-Agenten im Blick entwickelt wurde. Jeder Befehl kann strukturiertes JSON ausgeben, Exit-Codes sind vorhersagbar und jeder Pipeline-Schritt lässt sich kombinieren. Dadurch können Sie Claude Code, Cursor, Codex oder anderen Agenten beibringen, Bilder und Videos zuverlässig für Sie zu erzeugen.
Dieser Leitfaden basiert auf PixVerse CLI v1.2.1 und führt Sie von der Installation über die erste Generierung bis zu mehrstufigen Automatisierungspipelines und agentennativen Workflows.
Voraussetzungen
Bevor Sie beginnen, benötigen Sie:
- Node.js 20 oder höher — prüfen Sie dies mit
node --version - Ein PixVerse-Konto — registrieren Sie sich unter pixverse.ai
- Ein aktives PixVerse-Abonnement — die CLI nutzt dasselbe Kreditsystem wie die Website; nur abonnierte Nutzer können Inhalte generieren
PixVerse CLI erfordert kein manuelles Kopieren von API-Keys. Die Authentifizierung läuft über einen browserbasierten OAuth-Flow, der Ihr Token lokal speichert.
Schritt 1: CLI installieren
Installieren Sie die CLI global mit npm:
Prüfen Sie die Installation:
Wenn Sie keine globale Installation möchten, können Sie Befehle auch über npx ausführen:
Schritt 2: Authentifizieren
Führen Sie den Login-Befehl aus:
Die CLI öffnet einen Browser für die OAuth-Geräteautorisierung. Sie können die URL auch kopieren und die Autorisierung in einem beliebigen Browser auf einem beliebigen Gerät abschließen, was für SSH- und Headless-Umgebungen hilfreich ist. Ihr Token wird automatisch in ~/.pixverse/ gespeichert und ist 30 Tage gültig.
Prüfen Sie Login-Status und verfügbare Credits:
account info zeigt Abonnementstufe, Workspace-Credits und Nutzungskontext. pixverse account usage hilft beim Prüfen des Credit-Verbrauchs, während pixverse account slots die aktuellen parallelen Generierungs-Slots für Bild- und Videojobs zeigt. Prüfen Sie vor Batch-Jobs immer Guthaben und verfügbare Slots.
Schritt 3: Erstes Bild generieren
Text-to-image ist der schnellste Weg, Ihr Setup zu testen. Führen Sie aus:
In v1.2.1 verwendet create image standardmäßig GPT Image 2. Das Flag --json gibt strukturierte Ausgabe zurück:
Für höhere Auflösung wählen Sie ein passendes Modell:
PixVerse unterstützt mehrere Bildmodelle mit unterschiedlichen Auflösungen und Seitenverhältnissen:
| Modell | --model Wert | Qualität | Hinweise |
|---|---|---|---|
| GPT Image 2 | gpt-image-2.0 | 1080p, 1440p, 2160p | Standard-Bildmodell; unterstützt breite und hohe Seitenverhältnisse |
| Nano Banana 2 | gemini-3.1-flash | 512p, 1080p, 1440p, 2160p | Flexible Unterstützung für auto und Standardseitenverhältnisse |
| Qwen Image | qwen-image | 720p, 1080p | Schnelle Generierung für gängige kreative Aufgaben |
| Nano Banana Pro | gemini-3.0 | 1080p, 1440p, 2160p | Hochwertige Bildgenerierung in größeren Formaten |
| Nano Banana | gemini-2.5-flash | 1080p | Leichte Bildgenerierung mit schneller Rückmeldung |
| Seedream 5.0 Lite | seedream-5.0-lite | 1440p, 1800p, 2160p | Detailreiche kreative Bilder |
| Seedream 4.5 | seedream-4.5 | 1440p, 2160p | Hochauflösende Bildgenerierung |
| Seedream 4.0 | seedream-4.0 | 1080p, 1440p, 2160p | Zusätzliche Seedream-Option für Bild-Workflows |
| Kling Image O3 | kling-image-o3 | 1080p, 1440p, 2160p | Stilisierte Ergebnisse mit flexibler Bildkomposition |
| Kling Image V3 | kling-image-v3 | 1080p, 1440p | Balance aus Qualität und Geschwindigkeit |
Sie können auch ein vorhandenes Bild mit image-to-image transformieren:
Laden Sie das generierte Bild herunter:
Schritt 4: Erstes Video generieren
Text-to-video funktioniert ähnlich. Erzeugen Sie einen 5-Sekunden-Clip:
Für eine vollständig angepasste Generierung:
--audio aktiviert KI-generierten Umgebungssound, der zum Videoinhalt passt. --json gibt nach Abschluss eine video_url zurück, die Sie direkt an Download-Befehle oder den nächsten Pipeline-Schritt weitergeben können.
PixVerse bietet mehrere Videomodelle mit unterschiedlicher Qualität, Dauer und Modusunterstützung:
| Modell | --model Wert | Max. Qualität | Dauer | Hinweise |
|---|---|---|---|---|
| PixVerse V6 | v6 | 1080p | 1–15 sec | Standard-Videomodell mit breiter Seitenverhältnis-Unterstützung |
| PixVerse C1 | pixverse-c1 | 1080p | 1–15 sec | Gute Unterstützung für Video-, Reference- und Transition-Workflows |
| Seedance 2.0 Standard | seedance-2.0-standard | 1080p | 4–15 sec | Unterstützt Video-, Reference- und Transition-Modi |
| Seedance 2.0 Fast | seedance-2.0-fast | 720p | 4–15 sec | Schnellere Seedance-Option für Video, Reference und Transition |
| Happy Horse 1.0 | happyhorse-1.0 | 1080p | 3–15 sec | Audio-aware Videooption für create video |
| Kling O3 Pro | kling-o3-pro | 720p | 3–15 sec | Unterstützt Video-, Reference- und Transition-Workflows |
| Kling O3 Standard | kling-o3-standard | 720p | 3–15 sec | Standardoption für Kling O3 |
| Kling 3.0 Pro | kling-3.0-pro | 720p | 3–15 sec | Unterstützt Video- und Transition-Workflows |
| Kling 3.0 Standard | kling-3.0-standard | 720p | 3–15 sec | Standardoption für Kling 3.0 |
| Grok Imagine 1.5 | grok-imagine-1.5 | 720p | 1–15 sec | Image-to-video only; requires --image and follows the input image aspect ratio |
| Grok Imagine 1.5 | grok-imagine-1.5 | 720p | 1–15 sec | Image-to-video only; requires --image and follows the input image aspect ratio |
| Grok Imagine 1.5 | grok-imagine-1.5 | 720p | 1–15 sec | Image-to-video only; requires --image and follows the input image aspect ratio |
| Grok Imagine 1.5 | grok-imagine-1.5 | 720p | 1–15 sec | Image-to-video only; requires --image and follows the input image aspect ratio |
| Grok Imagine | grok-imagine | 720p | 1–15 sec | Unterstützt Video, Extend und Reference |
| Veo 3.1 Lite | veo-3.1-lite | 1080p | 4, 6 oder 8 sec | Unterstützt Video und 2-Frame-Transitions |
| Veo 3.1 Standard | veo-3.1-standard | 2160p | 4, 6 oder 8 sec | Höher auflösende Veo-Option |
| Veo 3.1 Fast | veo-3.1-fast | 2160p | 4, 6 oder 8 sec | Schnellere Veo-Option |
| Sora 2 Pro | sora-2-pro | 1080p | 4, 8 oder 12 sec | Sora-Option mit festen Dauern |
| Sora 2 | sora-2 | 720p | 4, 8 oder 12 sec | Standard-Sora-Option |
| PixVerse v5.6 | v5.6 | 1080p | 1–10 sec | Weiterhin für Motion-Control und ausgewählte Generierungs-Workflows genutzt |
Statisches Bild animieren
Um ein Foto oder generiertes Bild in ein Video zu verwandeln, nutzen Sie --image:
Sie können einen lokalen Pfad oder eine URL übergeben. Lokale Dateien werden automatisch hochgeladen. Lokale Bilder größer als 1920x1920 oder 5MB werden vor dem Upload automatisch skaliert oder komprimiert; Remote-URLs werden unverändert vom Backend geprüft.
Reference, Transition, Motion Control und Templates nutzen
Die aktuelle CLI kann mehr als reines Text-to-video und Image-to-video. Diese Modi helfen, wenn Sie Figuren, Keyframes, Bearbeitung oder Effekte genauer steuern möchten:
Nicht jedes Modell unterstützt jeden Erstellungsmodus. create reference unterstützt jetzt v6, pixverse-c1, Seedance 2.0, Kling O3, grok-imagine und v5.6; create modify ist an v5.5 gebunden; create motion-control nutzt v5.6; lip-sync speech nutzt v5.
Step 5: Generate Voice and Music
PixVerse CLI v1.2.0 replaced the older lip-sync speech command with dedicated audio creation commands. Use create voice for text-to-speech and create music for prompt-to-music generation. Voice and music outputs are saved as audio assets, so you can track them with task, list them with asset list --type audio, and download them with asset download --type audio.
Generate voice audio:
Browse voice models and preset voices:
Generate music:
Current voice model families include MiniMax Speech 2.8 and ElevenLabs models. Current music model families include MiniMax Music, ElevenLabs Music, and Google Lyria 3 Pro. Use pixverse voice models and pixverse music models for the live catalog before scripting a production workflow.
Schritt 6: Interaktiven Assistenten nutzen
Wenn Sie die verfügbaren Flags noch erkunden, starten Sie einen Erstellungsbefehl ohne Argumente:
Der Assistent führt Sie Schritt für Schritt durch Prompt, Modell, Qualität, Seitenverhältnis, Dauer und weitere Optionen.
Mehr als Generierung: Assets und Workspace verwalten
Die aktuelle PixVerse CLI enthält Verwaltungsbefehle für vollständige Terminal-Workflows:
pixverse task status <id>undpixverse task wait <id>für Task-Pollingpixverse task status --ids 123,456,789 --type video --jsonfür Batch-Statusprüfungenpixverse asset list,asset upload,asset info,asset downloadundasset deletefür den Asset-Lebenszykluspixverse saved list,saved items,saved new,saved rename,saved add,saved removeundsaved deletefür gespeicherte Ordnerpixverse template categories,template list,template searchundtemplate infozum Entdecken von Effekten und Templatespixverse workspace list,workspace status,workspace switchundworkspace managefür Multi-Workspace-Abläufepixverse account info,account usageundaccount slotsfür Credits, Nutzung und Parallelitätpixverse config set,config list,config pathundconfig defaultsfür wiederverwendbare lokale Defaults
Damit automatisieren Sie nicht nur die Erstellung, sondern auch Organisation, Template-Recherche, Downloads, Workspace-Routing und Auslieferung in einem Skript. Für einen einzelnen Befehl in einem anderen Workspace nutzen Sie --workspace-id <id>; 0 steht für den persönlichen Workspace.
Skriptfreundliche Flags
Automatisierung braucht vorhersagbare Ausgabe und Laufzeit. Diese Flags sind für Skripte und KI-Agenten besonders hilfreich:
| Flag | Zweck |
|---|---|
--json | Gibt strukturiertes JSON zurück |
-p | Kurzalias für --json |
--count <n> | Erstellt 1–4 Varianten aus einer Anfrage |
--seed <number> | Macht Generierungen leichter reproduzierbar |
--off-peak | Nutzt Off-Peak-Preise, wenn verfügbar |
--audio / --no-audio | Aktiviert oder deaktiviert Audio in unterstützten Befehlen |
--multi-shot / --no-multi-shot | Aktiviert oder deaktiviert Multi-Shot für Video |
--no-wait | Sendet den Job und kehrt sofort zurück |
--timeout <sec> | Setzt das Polling-Timeout, Standard sind 300 Sekunden |
--workspace-id <id> | Überschreibt den aktiven Workspace für einen Befehl |
--trace-id <uuid> | Attach a caller-supplied UUIDv4 to API requests for debugging and observability |
--idempotency-key <key> | Safely retry creation requests without accidentally creating duplicate charged jobs |
--trace-id <uuid> | Attach a caller-supplied UUIDv4 to API requests for debugging and observability |
--idempotency-key <key> | Safely retry creation requests without accidentally creating duplicate charged jobs |
--trace-id <uuid> | Attach a caller-supplied UUIDv4 to API requests for debugging and observability |
--idempotency-key <key> | Safely retry creation requests without accidentally creating duplicate charged jobs |
--trace-id <uuid> | Attach a caller-supplied UUIDv4 to API requests for debugging and observability |
--idempotency-key <key> | Safely retry creation requests without accidentally creating duplicate charged jobs |
Ihrem KI-Agenten Mediengenerierung beibringen
Hier wird PixVerse CLI besonders nützlich. Da Befehle strukturiertes JSON und vorhersagbare Exit-Codes liefern, kann jeder Agent, der Shell-Befehle ausführen kann, Bilder und Videos nach Bedarf generieren.
PixVerse Skills installieren
PixVerse Skills ist eine strukturierte Skill-Bibliothek, die Agenten die richtige Nutzung der CLI beibringt: Flags, Modellgrenzen, mehrstufige Pipelines und robuste Fehlerbehandlung.
Für Claude Code und andere Agenten mit Skills-Format:
Nach dem Laden können Sie natürlichsprachliche Aufgaben geben:
- “Generate a 10-second product demo video from this screenshot”
- “Create four variations of this blog cover image in 16:9 format”
- “Animate this diagram into a 5-second explainer clip with ambient sound”
- “Generate three 8-second 16:9 promo clips with different camera motions”
Der Agent übersetzt diese Anweisungen in CLI-Befehle, parst JSON, pollt Tasks und lädt Ergebnisse herunter.
Claude Code
In Claude Code kann PixVerse CLI als natives Werkzeug im selben Arbeitskontext verwendet werden:
Ein typischer Claude-Code-Workflow:
Cursor
Cursor-Nutzer können PixVerse Skills als Projektkontext laden. Legen Sie die Skill-Dateien in .cursor/ ab oder fügen Sie sie den Workspace-Regeln hinzu. Danach kann Cursor PixVerse-CLI-Befehle in Coding-Aufgaben einbeziehen.
Codex und andere Agenten
PixVerse CLI ist mit jedem Agenten kompatibel, der Shell-Befehle ausführen und JSON parsen kann. Das strukturierte Ausgabeformat mit konsistenten Feldern, vorhersehbaren Fehlercodes und getrennten stderr-Meldungen macht Integrationen zuverlässig.
| Code | Bedeutung | Agentenaktion |
|---|---|---|
| 0 | Erfolg | JSON-Ausgabe parsen |
| 1 | Allgemeiner Fehler | stderr prüfen und mit validierten Eingaben erneut versuchen |
| 2 | Timeout | Mit längerem --timeout erneut versuchen |
| 3 | Auth abgelaufen | pixverse auth login erneut ausführen |
| 4 | Keine Credits | Guthaben prüfen und Nutzer informieren |
| 5 | Generierung fehlgeschlagen | Andere Parameter versuchen |
| 6 | Validierungsfehler | Flag-Werte prüfen |
Automatisierungspipelines
Sobald Sie die einzelnen Befehle kennen, ermöglicht PixVerse CLI vollständig automatisierte mehrstufige Workflows.
Text zu Bild zu Video
Eine häufige Pipeline: erst ein hochauflösendes Bild generieren, dann animieren.
Vollständige Videoproduktionspipeline
For polished output, chain creation with post-processing steps. create sound was removed in v1.1.8 and create speech was removed in v1.2.0, so use --audio or --no-audio on supported video creation commands, create voice for text-to-speech audio, and create music for standalone music assets:
Batch-Generierung
Für mehrere Varianten können Sie Jobs parallel senden:
--no-wait sendet den Job und gibt sofort eine Task-ID zurück. In neueren Versionen liefert --no-wait --json auch die aufgelösten Erstellungsparameter, was für Logging und Reproduzierbarkeit nützlich ist. Nutzen Sie --count <n> für mehrere Varianten aus einem Prompt und task status --ids für einen gemeinsamen Status mehrerer Jobs.
Defaults konfigurieren
Wenn Sie oft dieselben Modelle, Qualitäten oder Seitenverhältnisse verwenden, legen Sie Defaults fest:
Flags in der Befehlszeile überschreiben konfigurierte Defaults. Für Workspace-spezifische Automatisierung können Sie --workspace-id <id> pro Befehl setzen.
Was Sie bauen können
Mit PixVerse CLI im Agenten-Workflow erweitert sich der automatisierbare Bereich deutlich:
- Dokumentation — Produktdemos und Screenshots im Dokumentations-Build automatisch erzeugen
- Marketing — nächtliche Batch-Jobs für Social-Media-Varianten aus einer Prompt-Bibliothek
- App-Entwicklung — Platzhaltervisuals, Mockup-Animationen oder Loading-Videos direkt im Coding-Workflow erzeugen
- Content-Pipelines — CLI-Aufrufe mit ffmpeg, ImageMagick oder Cloud-Speicher verbinden
- Prototyping — Bewegungsideen in Sekunden testen, bevor Sie in Produktion gehen
Checkliste für den Einstieg
- Node.js 20 oder höher installieren
-
npm install -g pixverseausführen -
pixverse auth loginausführen und im Browser autorisieren -
pixverse account infoausführen, um Credits zu prüfen - Vor parallelen Batch-Jobs
pixverse account slotsausführen - Erstes Bild generieren:
pixverse create image --prompt "..." --json - Erstes Video generieren:
pixverse create video --prompt "..." --json - Templates mit
pixverse template listerkunden - PixVerse Skills für Ihren Agenten installieren
- Defaults mit
pixverse config defaults seteinrichten - Erste Automatisierungspipeline bauen
CLI aktuell halten
Aktualisieren Sie die lokale CLI mit npm:
Für Release-Änderungen und neue Modelle lesen Sie den offiziellen Changelog:
As of v1.2.1, recent changes include Grok Imagine 1.5 image-to-video support, dedicated create voice and create music commands, audio asset management, capabilities.json for agents, pixverse update, stdin support for text inputs, --trace-id, and expanded Seedance 2.0 reference-image limits.
Nächste Schritte
PixVerse CLI auf npm (npm install -g pixverse) gibt Ihnen direkten Zugriff auf Generierung, Task-Polling, Asset-Management, Templates, gespeicherte Ordner, Account-Prüfungen und Workspace-Steuerung. Das PixVerse Skills Repository ergänzt agentenfähige Anleitung, damit Claude Code, Cursor, Codex und andere Tools diese Workflows zuverlässiger ausführen.
Mit einer zuverlässigen CLI und einer agentenbereiten Skill-Bibliothek kann Bild- und Videogenerierung im selben Workflow wie Ihr Code stattfinden: vom selben Agenten, im selben Terminal, ohne Toolwechsel.
Beginnen Sie mit einem einzigen Befehl. Bauen Sie darauf auf.