PixVerse CLI:ターミナルでAI動画と画像を生成

PixVerse CLIをインストールし、ターミナルでAI動画、画像、音声、音楽を生成し、JSON出力でエージェントワークフローを自動化します。

Product Update
PixVerse CLI:ターミナルでAI動画と画像を生成

はじめに

すべてのクリエイティブ ワークフローにはボトルネックがあります。それは、メディアを生成するためにコード エディターを終了し、ブラウザーを開き、Web インターフェイスを手動でクリックする必要がある瞬間です。開発者、AI エージェント、および自動化されたコンテンツ パイプラインを構築している人にとって、コンテキストの切り替えは急速に増大する摩擦です。

PixVerse CLIはそのボトルネックを解消します。これは PixVerse の公式コマンドライン インターフェイスであり、ターミナルから PixVerse 生成およびワークスペース ワークフローに直接アクセスできます。テキストからビデオへ、画像からビデオへ、テキストから画像へ、画像から画像へ、トランジション、音声生成、音楽生成、リファレンス ビデオ、モーション コントロール、テンプレート、アップスケーリング、およびアセット管理はすべてスクリプト可能でパイプ可能で、ブラウザーに触れることなく利用できます。

PixVerse CLI が特に便利なのは、その設計哲学です。つまり、AI エージェントを念頭に置いて構築されています。コマンドは、--json または -p を使用して構造化された JSON を返すことができ、終了コードは決定的で、すべてのパイプライン ステップは構成可能です。つまり、Claude Code、Cursor、Codex、またはその他のエージェントに、脆弱なハンドオフを減らして、ユーザーに代わって画像、ビデオ、音声、音楽を生成するように教えることができます。

このガイドは、2026 年 6 月 29 日にチェックされた現在の PixVerseAI/cli GitHub README とその公開 機能マニフェスト に準拠しています。モデルの可用性、デフォルト モデル、およびコマンド フラグは、エバーグリーン チュートリアルよりも早く変更される可能性があるため、実稼働スクリプトでは、大規模なバッチを実行する前に pixverse --versionpixverse create <mode> --help、および pixverse update を検証する必要があります。

前提条件

始める前に、次のものが必要です。

  • Node.js 20 以降node --version で確認してください
  • PixVerse アカウントpixverse.ai でサインアップしてください
  • アクティブな PixVerse サブスクリプション— CLI は Web サイトと同じクレジット システムを使用します。サブスクライブしたユーザーのみがコンテンツを生成できる

PixVerse CLI では、API キーを手動でコピーする必要はありません。認証は、トークンをローカルに保存するブラウザベースの OAuth フローを通じて処理されます。

ステップ 1: CLI をインストールする

npm を使用してグローバルにインストールします。

npm install -g pixverse

インストールを確認します。

pixverse --version

グローバルにインストールしたくない場合は、npx 経由でコマンドを実行することもできます。

npx pixverse create video --prompt "A cat walking on Mars"

ステップ 2: 認証する

ログイン コマンドを実行します。

pixverse auth login

CLI は、OAuth デバイス認証用のブラウザを開きます。また、URL をコピーして、任意のデバイスの任意のブラウザから認証を完了することもできます。これは、SSH およびヘッドレス環境に便利です。トークンは ~/.pixverse/ に自動的に保存され、30 日間有効です。

ログインしていることを確認し、利用可能なクレジットを確認するには:

pixverse auth status pixverse account info pixverse account slots

account info コマンドは、サブスクリプション層、ワークスペース クレジット、および使用状況を表示します。 pixverse account usage はクレジット消費量を確認するのに役立ち、pixverse account slots は画像およびビデオ ジョブの現在の同時生成スロットを表示します。 CLI セッションは PixVerse Web/アプリ セッションから独立しており、保存されている CLI トークンは pixverse auth logout を使用して削除できます。バッチ ジョブを実行する前に、必ず残高と利用可能なスロットを確認してください。

クイックスタートコマンド

インストールから生成されたアセットまでの最短パスのみが必要な場合は、次の順序から始めてください。

npm install -g pixverse
pixverse auth login
pixverse create image --prompt "A photorealistic forest path at golden hour" --json
pixverse create video --prompt "A sunset over ocean waves" --model v6 --quality 720p --duration 5 --json

エージェントおよび CI ワークフローの場合は、--json または -p を有効にしておき、進行状況とエラーは stderr に留まる一方で、stdout はマシンで読み取り可能な状態を維持します。本番環境の再試行の場合は、作成コマンドに --idempotency-key <key> を追加して、繰り返し送信しても重複した課金ジョブが誤って作成されないようにします。

ステップ 3: 最初のイメージを生成する

テキストから画像への生成は、セットアップをテストする最も速い方法です。実行:

pixverse create image --prompt "A photorealistic forest path at golden hour" --json

現在の GitHub README には、デフォルトのイメージ モデルとして GPT Image 2 がリストされています。再現可能な自動化を行うには、バッチ作業の前に --model を明示的に設定し、ライブ CLI ヘルプまたは capabilities.json を確認してください。 --json フラグは構造化された出力を返します。

{ "image_id": 789012, "status": "completed", "image_url": "https://...", "prompt": "A photorealistic forest path at golden hour", "model": "gpt-image-2.0", "width": 1440, "height": 1440 }

高解像度の出力の場合は、それをサポートするモデルを指定します。

pixverse create image \ --prompt "A photorealistic forest path at golden hour" \ --model seedream-5.0-lite \ --quality 2160p \ --aspect-ratio 16:9 \ --json

PixVerse は、それぞれ異なる解像度の上限とアスペクト比のサポートを持つ複数の画像モデルをサポートしています。

モデル--model value品質注意事項
GPT Image 2gpt-image-2.01080p、1440p、2160pデフォルトの画像モデル。ワイドとトールのアスペクト比をサポート
Nano Banana 2gemini-3.1-flash512p、1080p、1440p、2160p柔軟な auto および標準アスペクト比
Qwen Imageqwen-image720p、1080p一般的なクリエイティブなタスクの高速生成
Nano Banana Progemini-3.01080p、1440p、2160p大きなサイズでも高画質な画像作成が可能
Nano Bananagemini-2.5-flash1080p高速な処理による軽量の画像生成
Seedream 5.0 Liteseedream-5.0-lite1440p、1800p、2160p高精細なクリエイティブ画像
Seedream 4.5seedream-4.51440p、2160p高解像度画像の生成
Seedream 4.0seedream-4.01080p、1440p、2160p画像ワークフロー用の追加の Seedream オプション
Kling Image O3kling-image-o31080p、1440p、2160p柔軟なフレーミングによる様式化されたビジュアル出力
Kling Image V3kling-image-v31080p、1440pバランスの取れた品質とスピード

既存のイメージをイメージ間で変換することもできます。

pixverse create image \ --prompt "Turn this product photo into a clean watercolor illustration" \ --image ./product-photo.png \ --model gpt-image-2.0 \ --json

生成されたイメージをダウンロードするには:

pixverse asset download 789012

ステップ 4: 最初のビデオを生成する

テキストからビデオへの変換も同様に機能します。 5 秒のクリップを生成します。

pixverse create video --prompt "A sunset over ocean waves" --json

完全にカスタマイズされた世代の場合:

pixverse create video \ --prompt "A cinematic drone shot over a misty mountain valley at dawn" \ --model v6 \ --quality 1080p \ --aspect-ratio 16:9 \ --duration 8 \ --audio \ --json

--audio フラグは、ビデオ コンテンツに一致する AI 生成のアンビエント サウンドを有効にします。 --json フラグは、完了時に video_url を返します。これは、ダウンロード コマンドまたはパイプラインの次のステップに直接渡すことができます。

PixVerse は、さまざまな品質、長さ、モードをサポートする複数のビデオ モデルを提供します。

モデル--model value最高の品質期間注意事項
PixVerse V6v61080p1~15秒デフォルトのビデオモデル。幅広いアスペクト比のサポート
PixVerse C1pixverse-c11080p1~15秒ビデオ、リファレンス、トランジションのワークフローにわたる強力なサポート
Seedance 2.0 Standardseedance-2.0-standard2160p4~15秒ビデオ、リファレンス、トランジションモードをサポート
Seedance 2.0 Fastseedance-2.0-fast720p4~15秒ビデオ、リファレンス、トランジション モードの高速シーダンス オプション
Seedance 2.0 Miniseedance-2.0-mini720p4~15秒ビデオ、リファレンス、トランジション モード用の軽量 Seedance オプション
Happy Horse 1.0happyhorse-1.01080p3~15秒create video で利用可能なオーディオ対応ビデオ オプション
Kling O3 Prokling-o3-pro720p3~15秒ビデオ、リファレンス、トランジションのワークフローをサポート
Kling O3 Standardkling-o3-standard720p3~15秒標準の Kling O3 オプション
Kling 3.0 Prokling-3.0-pro720p3~15秒ビデオとトランジションのワークフローをサポート
Kling 3.0 Standardkling-3.0-standard720p3~15秒標準の Kling 3.0 オプション
Grok Imagine 1.5grok-imagine-1.5720p1~15秒画像からビデオへの変換のみ。 --image が必要で、入力画像のアスペクト比に従います
Grok Imaginegrok-imagine720p1~15秒以前の Grok オプション。ビデオ、拡張、参照ワークフローをサポート
Veo 3.1 Liteveo-3.1-lite1080p4、6、または8秒ビデオおよび 2 フレーム トランジション ワークフローをサポート
Veo 3.1 Standardveo-3.1-standard2160p4、6、または8秒高解像度Veoオプション
Veo 3.1 Fastveo-3.1-fast2160p4、6、または8秒より高速な Veo オプション
Sora 2 Prosora-2-pro1080p4秒、8秒、または12秒期間固定ソラオプション
Sora 2sora-2720p4秒、8秒、または12秒標準ソラオプション
PixVerse v5.6v5.61080p1~10秒モーション コントロールと選択された生成ワークフローに引き続き使用されます
PixVerse v5.5v5.51080p1~10秒create modify ワークフローに使用されます
PixVerse v5v51080p1~10秒3 つ以上のフレーム トランジション ワークフローに使用

静止画像をアニメーション化する

写真または生成された画像をビデオに変換するには、--image フラグを指定します。

pixverse create video \ --prompt "Gentle wind moves through the scene" \ --image ./product-photo.jpg \ --model v6 \ --quality 1080p \ --json

ローカル ファイル パスまたは URL を渡すことができます。ローカル ファイルは自動的にアップロードされます。手動でアップロードする手順は必要ありません。 1920x1920 または 5MB より大きいローカル画像入力は、アップロード前に自動的にサイズ変更または圧縮されます。リモート画像 URL はバックエンドによって現状のまま検証されます。

Grok Imagine 1.5 の場合、画像が必要であり、出力アスペクト比はその画像に従います。

pixverse create video \ --prompt "Slow camera push-in, subtle fabric motion, clean native ambience" \ --image ./campaign-poster.png \ --model grok-imagine-1.5 \ --quality 720p \ --duration 6 \ --json

リファレンス、トランジション、モーション コントロール、テンプレートを使用する

現在の CLI は、単純なテキストからビデオへの変換や画像からビデオへの変換以上のものをサポートしています。これらの作成モードは、文字、キーフレーム、編集、またはエフェクトをより詳細に制御する必要がある場合に役立ちます。

# Create a transition between keyframes pixverse create transition --images ./frame1.png ./frame2.png # テキストから音声を生成する pixverse create voice --text "Welcome to the launch" --voice-id <preset_voice_id> --output ./voiceover.mp3 # プロンプトから音楽を生成する pixverse create music --prompt "A cinematic synth-pop intro with bright percussion" --auto-lyrics pixverse create music --prompt "Uplifting piano theme for a product reveal" --instrumental --duration-seconds 60 # 生成されたビデオを拡張する pixverse create extend --video <video_id> # 既存のビデオを変更する pixverse create modify --video <video_id> --prompt "Change the background to a beach" # 高級ビデオ解像度 pixverse create upscale --video <video_id> --quality 1080p # 参照画像を含むビデオを生成する pixverse create reference --images ./char1.png ./char2.png --prompt "Two friends walking in a park" # Seedance 2.0 リファレンスは画像とビデオ入力を混合できます pixverse create reference \ --model seedance-2.0-standard \ --images ./character.png \ --videos ./motion.mp4 \ --prompt "@image1 follows the motion in @video1" # Seedance 2.0 モデルは最大 9 つの参照イメージをサポートします pixverse create reference \ --model seedance-2.0-standard \ --images ./char1.png ./char2.png ./char3.png ./char4.png \ --prompt "@image1 and @image2 walk through the scene together" # キャラクター画像とモーション参考動画によるモーションコントロール pixverse create motion-control --image ./character.png --video ./dance.mp4 # テンプレートまたはエフェクトから作成する pixverse create template --template-id 12345 --image ./photo.png

すべてのモデルがすべての作成モードをサポートしているわけではありません。現在の README マトリックスでは、create videov6pixverse-c1、Seedance 2.0 Standard/Fast/Mini、Happy Horse 1.0、Kling O3、Kling 3.0、Grok Imagine、Veo 3.1、Sora 2、および v5.6 をサポートします。 grok-imagine-1.5 は画像からビデオへの変換のみであり、--image が必要です。 create extendv6 および grok-imagine をサポートします。 create reference は、v6pixverse-c1、Seedance 2.0 Standard/Fast/Mini、Kling O3、grok-imagine、および v5.6 をサポートします。 2 フレーム トランジションは新しいビデオ ファミリをサポートします。 3 つ以上のフレーム トランジションでは v5 を使用します。 create modifyv5.5 を使用します。 create motion-controlv5.6 を使用します。

ステップ 5: 音声と音楽を生成する

現在の GitHub README は、専用の作成コマンドを通じてスタンドアロン オーディオを文書化します。テキスト読み上げには create voice を使用し、プロンプト音楽の生成には create music を使用します。音声および音楽出力はオーディオ アセットとして保存されるため、task で追跡し、asset list --type audio でリストし、asset download --type audio でダウンロードできます。ネイティブ ビデオ アンビエンスについては、サポートされているビデオ作成コマンドで --audio または --no-audio を使用します。

音声オーディオを生成します。

pixverse create voice \ --text "Welcome to the launch. Here is what changed this week." \ --model speech-2.8-hd \ --voice-id <preset_voice_id> \ --output ./voiceover.mp3 \ --json

音声モデルとプリセット音声を参照します。

pixverse voice models --json pixverse voice presets --model speech-2.8-hd --json

音楽を生成する:

pixverse create music \ --prompt "A bright cinematic synth-pop track for a 30-second product reveal" \ --auto-lyrics \ --duration-seconds 30 \ --json

インストゥルメンタル トラックの場合は、--instrumental を使用します。歌詞対応モデルの場合、歌詞をリテラル テキスト、ローカル ファイル パス、または標準入力として渡します。

pixverse create music \ --prompt "Uplifting electronic pop with a confident chorus" \ --lyrics ./lyrics.txt \ --json

現在の音声モデル ファミリには、MiniMax Speech 2.8 モデルと ElevenLabs モデルが含まれます。現在の音楽モデル ファミリには、MiniMax Music、ElevenLabs Music、および Google Lyria 3 Pro が含まれます。実稼働ワークフローのスクリプトを作成する前に、ライブ カタログに pixverse voice models および pixverse music models を使用します。

ステップ 6: 対話型ウィザードを実行する

初めて探索し、使用可能なすべてのフラグにまだ慣れていない場合は、引数なしで作成コマンドを実行して、ガイド付きウィザードを開始します。

pixverse create video pixverse create image

ウィザードでは、プロンプト、モデルの選択、品質、アスペクト比、継続時間、その他のオプションを段階的に説明します。これは、スクリプトを作成する前に使用可能なパラメーターを確認するのに役立ちます。

世代を超えて: 資産とワークスペースを管理する

現在の PixVerse CLI には、エンドツーエンドの端末ワークフローの構築に役立つ管理コマンドも含まれています。

  • タスクポーリング用のpixverse task status <id>およびpixverse task wait <id>
  • pixverse task status --ids 123,456,789 --type video --json バッチステータスチェック用
  • ビデオ、画像、オーディオ資産のライフサイクル操作用の pixverse asset listasset uploadasset infoasset download、および asset delete
  • 保存フォルダーの場合は、pixverse saved listsaved itemssaved newsaved renamesaved addsaved remove、および saved delete
  • エフェクトとテンプレートを見つけるための pixverse template categoriestemplate listtemplate search、および template info
  • ライブオーディオモデル検出用のpixverse voice modelsvoice presets、およびmusic models
  • マルチワークスペース操作用の pixverse workspace listworkspace statusworkspace switch、および workspace manage
  • pixverse account infoaccount usage、および account slots (クレジット、使用状況、同時実行性のチェック用)
  • 再現可能なローカルデフォルトの pixverse config setconfig listconfig path、および config defaults

これにより、作成だけでなく、整理、テンプレートの検出、オーディオの検出、ダウンロード、ワークスペースのルーティング、配信も 1 つのスクリプトで簡単に自動化できます。 1 つのコマンドを別のワークスペースに対して実行する必要がある場合は、グローバル --workspace-id <id> フラグを使用します。 0 は個人のワークスペースを対象としています。

スクリプトフレンドリーなフラグ

ほとんどの自動化は、予測可能な出力と予測可能な実行時の動作に依存します。これらのフラグは、スクリプトと AI エージェントのワークフローで特に役立ちます。

用途
--json構造化された JSON 出力を返します
-p--json の短いエイリアス
--count <n>1 つのリクエストから 1 ~ 4 つのバリエーションを生成
--seed <number>世代を再生産しやすくする
--off-peak利用可能な場合はオフピーク料金を使用する
--audio / --no-audioサポートされている作成コマンドでのオーディオ生成を有効または無効にします。
--multi-shot / --no-multi-shotビデオのマルチショット モードを有効または無効にする
--no-waitジョブを送信してすぐに戻ります
--timeout <sec>ポーリングのタイムアウトを設定します。デフォルトは 300 秒です。
--workspace-id <id>単一コマンドのアクティブなワークスペースをオーバーライドする
--trace-id <uuid>デバッグと可観測性のために、呼び出し元が指定した UUIDv4 を API リクエストに添付します
--idempotency-key <key>重複した課金ジョブを誤って作成することなく、作成リクエストを安全に再試行します

テキスト入力フラグの自動化が容易になりました。 --prompt--text、および --lyrics は、リテラル文字列、ローカル ファイル パス、または標準入力の - を受け入れることができます。

pixverse create video --prompt ./scene.txt --json cat scene.txt | pixverse create image --prompt - --json echo "Hello from the command line" | pixverse create voice --text - --json pixverse create music --prompt "Bright synth-pop" --lyrics ./lyrics.txt --json

AI エージェントにメディアを生成するよう教える

ここで、PixVerse CLI は真に変革的になります。コマンドは構造化された JSON を返し、決定的な終了コードを使用できるため、シェル コマンドを実行できる AI エージェントには、オンデマンドで画像やビデオを生成するように学習させることができます。

PixVerse Skillsのインストール

PixVerse Skillsは、コマンド フラグ、モデル制約、マルチステップ パイプライン、堅牢なエラー処理など、CLI の正しい使用方法をエージェントに教える構造化されたスキル ライブラリです。

Claude Code およびスキル形式をサポートするその他のエージェントの場合は、PixVerse スキルを直接追加します。

npx skills add https://github.com/pixverseai/skills --skill pixverse-ai-image-and-video-generator

Cursor、Claude Code、Codex、およびその他のエージェント フレームワークの場合、このスキルはエージェントに最初からの推論を強制するのではなく、明示的な制約を与えることで信頼性を向上させます。

PixVerse CLI には、コンパクトな機械可読コマンド マニフェストも dist/capabilities.json で同梱されており、パブリック ソースは GitHub リポジトリで capabilities.json として入手できます。このマニフェストにはコマンド、フラグ、終了コード、JSON 出力の期待値、効果カテゴリが記述されているため、エージェントはヘルプ テキストをスクレイピングすることなく CLI コントラクトを検査できます。

エージェントに PixVerse スキルが読み込まれたら、次のような自然言語の指示をエージェントに与えることができます。

  • 「このスクリーンショットから 10 秒の製品デモビデオを生成します」
  • 「このブログのカバー画像の 4 つのバリエーションを 16:9 形式で作成します」
  • 「この図をアニメーション化して、環境音を含む 5 秒の説明クリップを作成します」
  • 「異なるカメラモーションを使用して、8 秒の 16:9 プロモーション クリップを 3 つ生成します」

エージェントはこれらの命令を正しい CLI コマンドに変換し、JSON 出力を解析し、ポーリングとダウンロードを処理します。手動による介入は必要ありません。

Claude Code

Claude Code では、PixVerse CLI はエージェントが自律的に使用するネイティブ ツールになります。 PixVerse スキルをロードした後、任意のタスクにメディア生成を直接組み込むことができます。

Generate a cover image for this blog post about machine learning, use the seedream-5.0-lite model at 2160p in 16:9 format, download it to ./assets/cover.webp

Claude Code は、正しい CLI コマンドを呼び出し、JSON 応答からの画像 URL を解析し、指定されたパスにファイルをダウンロードします。これらはすべて、コードを記述している同じセッション内で行われます。

典型的な Claude Code ワークフロー:

# Claude Code runs this autonomously based on your instruction IMG=$(pixverse create image \ --prompt "Abstract visualization of neural network layers, dark background, blue and purple tones" \ --model seedream-5.0-lite \ --quality 2160p \ --aspect-ratio 16:9 \ --json | jq -r '.image_url') # 次にそれをアニメーション化します pixverse create video \ --prompt "Slow pan across glowing neural connections" \ --image "$IMG" \ --model v6 \ --quality 1080p \ --duration 6 \ --json

Cursor

Cursor ユーザーは、PixVerse Skills をプロジェクト コンテキスト ファイルとしてロードできます。関連するスキル ファイルを .cursor/ ディレクトリに配置するか、ワークスペース ルールに追加します。ロードされると、Cursor はすべての PixVerse CLI コマンドを完全に認識し、コーディング タスクの一部としてメディアを生成できます。

一般的な Cursor ワークフロー: エージェントに、構築中のデザインに基づいてモックアップ イメージを生成するよう依頼し、それをエディターから離れることなく IDE セッションで直接参照として使用します。

Codex とその他のエージェント

PixVerse CLI は、シェル コマンドを実行し、JSON を解析できる任意のエージェントと互換性があります。構造化された出力形式 (一貫したフィールド名、予測可能なエラー コード、stderr で区切られたエラー メッセージ) により、単純なスクリプト エージェントでも確実に生成を統合できます。

終了コード コントラクトにより、エラー処理が簡単になります。

コード意味エージェントのアクション
0成功JSON出力を解析する
1一般的なエラーstderr を確認し、検証された入力で再試行してください
2タイムアウト--timeout を長くして再試行してください
3認証の期限が切れましたpixverse auth loginを再実行します
4クレジットが不足しています残高を確認し、ユーザーに通知する
5生成に失敗しましたさまざまなパラメータを試してください
6検証エラーフラグ値を確認する

自動化パイプライン

個々のコマンドを理解すると、PixVerse CLI は、ユーザーの介入をまったく必要とせずに実行される強力なマルチステップ ワークフローのロックを解除します。

テキストから画像、ビデオへ

最も便利なパイプラインの 1 つ: テキスト プロンプトから高解像度の画像を生成し、それをアニメーション化してビデオにします。

# Step 1: Generate a base image IMG_RESULT=$(pixverse create image \ --prompt "A cyberpunk cityscape at night, neon lights reflecting on wet pavement" \ --model gemini-3.1-flash \ --quality 2160p \ --aspect-ratio 16:9 \ --json) IMAGE_URL=$(echo "$IMG_RESULT" | jq -r '.image_url') # ステップ 2: アニメーション化してビデオにする VID_RESULT=$(pixverse create video \ --prompt "Camera slowly pans across the neon-lit streets" \ --image "$IMAGE_URL" \ --model v6 \ --quality 1080p \ --duration 8 \ --json) VIDEO_ID=$(echo "$VID_RESULT" | jq -r '.video_id') # ステップ 3: 最終的なビデオをダウンロードする pixverse asset download "$VIDEO_ID" --json

完全なビデオ制作パイプライン

洗練された出力の場合、後処理ステップを使用してチェーンを作成します。サポートされているビデオ作成コマンドでネイティブ サウンドが必要な場合は、--audio または --no-audio を使用し、テキスト読み上げオーディオには create voice を、ダウンストリームで組み合わせるスタンドアロンの音楽アセットには create music を使用します。

# Step 1: Create the base video RESULT=$(pixverse create video \ --prompt "A product being assembled in slow motion" \ --model v6 \ --quality 720p \ --duration 5 \ --audio \ --json) VID=$(echo "$RESULT" | jq -r '.video_id') # ステップ 2: 期間を延長する EXTENDED=$(pixverse create extend \ --video "$VID" \ --json | jq -r '.video_id') pixverse task wait "$EXTENDED" --json # ステップ 3: 1080p にアップスケールする FINAL=$(pixverse create upscale \ --video "$EXTENDED" \ --quality 1080p \ --json | jq -r '.video_id') pixverse task wait "$FINAL" --json # ステップ 4: ダウンロード pixverse asset download "$FINAL" --json # オプション: 別のナレーション アセットを作成します pixverse create voice \ --text "The final reveal starts now." \ --voice-id <preset_voice_id> \ --output ./voiceover.mp3 \ --json

バッチ生成

複数のバリエーションを必要とするコンテンツ パイプラインの場合は、ジョブを並行して実行します。

# Check credits and concurrent generation slots first pixverse account info --json pixverse account slots --json # 4 つの並列世代を送信する pixverse create video --prompt "Sunrise over mountains" --no-wait --json > /tmp/v1.json & pixverse create video --prompt "Sunset over ocean" --no-wait --json > /tmp/v2.json & pixverse create video --prompt "Stars over a desert" --no-wait --json > /tmp/v3.json & pixverse create video --prompt "Aurora over a frozen lake" --no-wait --json > /tmp/v4.json & wait # 返されたすべてのタスク ID を 1 回のバッチ ステータス呼び出しで確認する IDS=$(jq -r '.video_id' /tmp/v1.json /tmp/v2.json /tmp/v3.json /tmp/v4.json | paste -sd, -) pixverse task status --ids "$IDS" --type video --json # それぞれ待ってダウンロードしてください for f in /tmp/v1.json /tmp/v2.json /tmp/v3.json /tmp/v4.json; do ID=$(jq -r '.video_id' "$f") pixverse task wait "$ID" --json pixverse asset download "$ID" --json done

--no-wait フラグはジョブを送信し、すぐにタスク ID を返します。これにより、ポーリング前に複数のジョブを送信できるようになります。 --no-wait --json を使用すると、返されたタスク ID と解決された作成パラメータをログ記録と再現性のために記録します。 1 つのプロンプトから複数のバリエーションが必要な場合は --count <n> を使用し、実行中の複数のジョブに対して 1 つのステータス応答が必要な場合はバッチ task status --ids を使用します。 pixverse task wait コマンドは、適応ポーリングを処理します。

デフォルトの構成

同じモデル、品質、またはアスペクト比を一貫して使用する場合は、毎回フラグを繰り返す必要がないように、それらをデフォルトとして設定します。

pixverse config defaults set video model v6 pixverse config defaults set video quality 1080p pixverse config defaults set image model seedream-5.0-lite pixverse config set output-dir ~/Downloads/pixverse pixverse config defaults show pixverse config list pixverse config path

コマンドライン フラグは構成されたデフォルトを常にオーバーライドするため、繰り返しを減らしながら完全な柔軟性を維持できます。ワークスペース固有の自動化の場合、その 1 回の実行でアクティブなワークスペースをオーバーライドする場合は、コマンドに --workspace-id <id> を追加します。

構築できるもの

PixVerse CLI をエージェントのワークフローに統合すると、自動化できるタスクの範囲が大幅に拡大します。

  • ドキュメント— ドキュメント作成プロセスの一部として製品デモビデオとスクリーンショットを自動生成します
  • マーケティング— 単一のプロンプト ライブラリからソーシャル メディア コンテンツのバリエーションを生成するバッチ ジョブを夜間に実行します。
  • アプリ開発— UI の構築中に、コーディング エージェントがプレースホルダー ビジュアル、モックアップ アニメーション、または読み込み画面ビデオを生成できるようにします。
  • オーディオ ワークフロー- ナレーション ドラフト、音楽プロンプト トラック、または後で編集するためのオーディオ アセットを生成します。
  • コンテンツ パイプライン— CLI 呼び出しを他のツール (ffmpeg、ImageMagick、クラウド ストレージ) と連鎖させて、完全に自動化されたメディア制作ワークフローを構築します。
  • プロトタイピング— クイック モーション コンセプトを数秒で生成し、完全な制作に着手する前にアイデアを検証します。

CLI は、シェルベースのワークフローに自然にフィットするように設計されています。既存のオートメーションが bash、Python、Node、または CI/CD パイプラインで実行されている場合、追加の統合オーバーヘッドなしで PixVerse CLI がスロットに組み込まれます。

開始チェックリスト

  • Node.js 20以降をインストールしてください
  • npm install -g pixverseを実行
  • pixverse auth loginを実行し、ブラウザで認証します
  • pixverse account info を実行してクレジットを確認します
  • 同時バッチ作業の前に pixverse account slots を実行する
  • 最初のイメージを生成します: pixverse create image --prompt "..." --json
  • 最初のビデオを生成します: pixverse create video --prompt "..." --json
  • 最初の音声アセットを生成します: pixverse create voice --text "..." --json
  • 最初の音楽アセットを生成します: pixverse create music --prompt "..." --json
  • pixverse template list でテンプレートを探索する
  • エージェント用に PixVerse Skills をインストールします (Claude Code、Cursor、または Codex)。
  • pixverse config defaults set を使用して好みのデフォルトを設定します
  • 最初の自動化パイプラインを構築する

CLI を最新の状態に保つ

組み込みのアップデータを使用して、ローカルの CLI を最新の状態に保ちます。

pixverse update

npm を直接使用することもできます。

npm install -g pixverse@latest

リリースレベルの変更と新しくサポートされたモデルについては、公式の CLI ソースを確認してください。

現在のドキュメントでは、デフォルトのビデオ モデルとしての PixVerse V6、デフォルトの画像モデルとしての GPT Image 2、Seedance 2.0 Mini のサポート、モード固有の PixVerse v5 および v5.5 ワークフロー、専用の create voice および create music コマンド、オーディオ アセット管理、保存フォルダー、ワークスペースの切り替え、config defaults、エージェント用の capabilities.jsonpixverse update、テキストの標準入力サポートに焦点を当てています。より安全な再試行のための入力、--trace-id、および --idempotency-key

次のステップ

PixVerse CLI on GitHub および npm (npm install -g pixverse) を使用すると、単一のインターフェイスから生成、タスク ポーリング、アセット管理、テンプレート、保存フォルダー、アカウント チェック、オーディオ モデルの検出、およびワークスペース コントロールに即座にアクセスできます。 PixVerse Skills リポジトリ は、エージェント対応のガイダンスを追加するため、Claude Code、Cursor、Codex、およびその他のツールがこれらのワークフローをより高い信頼性で実行できるようになります。

信頼性の高い CLI とエージェント対応スキル ライブラリの組み合わせにより、画像、ビデオ、音声、音楽の生成がコードと同じワークフロー内で実行でき、ツールを切り替えることなく、同じ端末の同じエージェントによって管理されます。

単一のコマンドから始めます。そこから構築します。