PixVerse CLI:開発者向け AI 動画・画像生成ワークフロー
PixVerse CLI の導入から初回の AI 画像・動画生成までを解説し、Claude Code・Cursor・AI エージェントでの制作自動化を実践できます。
はじめに
あらゆるクリエイティブワークフローには、ボトルネックがあります。コードエディタを離れ、ブラウザを開き、Web UI を手作業で操作してメディアを生成しなければならない瞬間です。開発者、AI エージェント、そして自動化コンテンツ基盤を構築するすべての方にとって、このコンテキストスイッチは確実にコストになります。
PixVerse CLI は、そのボトルネックを解消します。PixVerse 公式のコマンドラインインターフェースとして、PixVerse プラットフォームの全モデル・全機能へターミナルから直接アクセスできます。テキストから動画、画像から動画、テキストから画像、リップシンク音声、効果音、アップスケーリングまで、すべてをスクリプト化・パイプ化でき、ブラウザ操作は不要です。
PixVerse CLI が特に強力なのは、AI エージェント前提で設計されている点です。すべてのコマンドは構造化 JSON を返し、終了コードは決定的で、パイプライン各工程は合成可能です。つまり Claude Code、Cursor、Codex などのエージェントに、画像・動画生成を安定して任せられます。
本ガイドでは、インストールから初回生成、さらに多段の自動化パイプラインとエージェントネイティブ運用まで、一連の流れを順にご案内します。
前提条件
開始前に、以下をご用意ください:
- Node.js 20 以上 —
node --versionで確認します - PixVerse アカウント — pixverse.ai で登録します
- 有効な PixVerse サブスクリプション — CLI は Web サイトと同じクレジット制を使うため、生成は購読ユーザーのみ可能です
PixVerse CLI では API キーを手動コピーする必要はありません。認証はブラウザベース OAuth フローで実行され、トークンはローカル保存されます。
ステップ 1:CLI をインストールする
npm でグローバルインストールします:
npm install -g pixverseインストール確認:
pixverse --versionグローバルインストールを避けたい場合は、npx でも実行できます:
npx pixverse create video --prompt "A cat walking on Mars"ステップ 2:認証する
ログインコマンドを実行します:
pixverse auth loginCLI は OAuth デバイス認可のためにブラウザを開きます。URL をコピーして、別デバイスのブラウザで認可を完了することもできるため、SSH やヘッドレス環境でも便利です。トークンは自動で ~/.pixverse/ に保存され、30 日間有効です。
ログイン状態と利用可能クレジットを確認します:
pixverse auth status
pixverse account infoaccount info では、サブスクリプションプラン、残クレジット、日次リセット時刻が確認できます。バッチ実行前は残高確認を推奨します。
ステップ 3:最初の画像を生成する
テキストから画像生成は、設定確認の最短ルートです。以下を実行します:
pixverse create image --prompt "A photorealistic forest path at golden hour" --json--json フラグは構造化出力を返します:
{
"image_id": 789012,
"status": "completed",
"image_url": "https://...",
"prompt": "A photorealistic forest path at golden hour",
"model": "qwen-image",
"width": 1024,
"height": 1024
}より高解像度にしたい場合は、対応モデルを指定します:
pixverse create image \
--prompt "A photorealistic forest path at golden hour" \
--model seedream-5.0-lite \
--quality 1800p \
--aspect-ratio 16:9 \
--jsonPixVerse は複数の画像モデルを提供しており、解像度上限と得意分野が異なります:
| モデル | 最大解像度 | 最適用途 |
|---|---|---|
qwen-image | 1080p | 高速生成、汎用用途 |
gpt-image-2.0 | 2160p | 複数フォーマットでの高解像度クリエイティブ出力 |
seedream-5.0-lite | 1800p | 高精細なクリエイティブ画像 |
seedream-4.5 | 2160p | 超高解像度 |
gemini-3.1-flash (Nano Banana 2) | 2160p | 広い解像度対応、高速処理 |
gemini-3.0 (Nano Banana Pro) | 2160p | 大規模運用での高品質出力 |
gemini-2.5-flash (Nano Banana) | 1080p | 軽量で高速なターンアラウンド |
kling-image-o3 | 2160p | 柔軟なフレーミングを伴うスタイライズ表現 |
kling-image-v3 | 1440p | 品質と速度のバランス |
生成した画像をダウンロードするには:
pixverse asset download 789012ステップ 4:最初の動画を生成する
テキストから動画生成も同様です。5 秒クリップを生成します:
pixverse create video --prompt "A sunset over ocean waves" --json完全にカスタム指定する場合:
pixverse create video \
--prompt "A cinematic drone shot over a misty mountain valley at dawn" \
--model v6 \
--quality 1080p \
--aspect-ratio 16:9 \
--duration 8 \
--audio \
--json--audio は動画内容に合わせた AI 環境音を有効化します。--json は完了時に video_url を返すため、ダウンロードや次工程へそのまま渡せます。
PixVerse は機能特性の異なる複数動画モデルを提供しています:
| モデル | 最大品質 | 時間範囲 | 備考 |
|---|---|---|---|
v6 | 1080p | 1–15 sec | 幅広いアスペクト比に対応する PixVerse 標準モデル |
pixverse-c1 | 1080p | 1–15 sec | 動画生成とリファレンス系ワークフローの両方に強い対応 |
v5.6 | 1080p | 1–10 sec | motion-control 作成モードに対応 |
veo-3.1-standard | 2160p | 4, 6, 8 sec | 動画生成とトランジションの両ワークフローに対応 |
grok-imagine | 720p | 1–15 sec | create video、extend、reference をサポート |
sora-2-pro | 1080p | 4, 8, 12 sec | 固定時間オプションで高忠実度の結果 |
静止画像をアニメーション化する
写真や生成画像を動画化するには、--image フラグを指定します:
pixverse create video \
--prompt "Gentle wind moves through the scene" \
--image ./product-photo.jpg \
--model v6 \
--quality 1080p \
--jsonローカルパスでも URL でも指定できます。ローカルファイルは自動アップロードされるため、手動アップロードは不要です。
ステップ 5:インタラクティブウィザードを実行する
初回利用でフラグに不慣れな場合は、引数なしで作成コマンドを実行してガイド付きウィザードに入れます:
pixverse create video
pixverse create imageウィザードでは、プロンプト、モデル、品質、アスペクト比、時間などを段階的に設定でき、スクリプト化前の確認に有用です。
生成の先へ:アセットとワークスペースを管理する
最新の PixVerse CLI には、エンドツーエンド運用に役立つ管理系コマンドも含まれます:
pixverse task status <id>とpixverse task wait <id>によるタスク監視pixverse asset list|upload|info|download|deleteによるアセットライフサイクル管理pixverse saved list|items|new|rename|add|remove|deleteによる保存フォルダ管理pixverse workspace list|status|switch|manageによる複数ワークスペース運用
これにより、生成だけでなく整理・取得・納品までを単一スクリプトで自動化できます。
AI エージェントにメディア生成を教える
ここが PixVerse CLI の本質的な強みです。すべてのコマンドが構造化 JSON と決定的終了コードを返すため、シェル実行可能な AI エージェントなら、画像・動画生成をオンデマンドで実行できるように学習できます。
PixVerse Skills のインストール
PixVerse Skills は、CLI の正しい使い方(フラグ、モデル制約、多段パイプライン、堅牢なエラー処理)をエージェントへ教える構造化スキルライブラリです。
Claude Code など skills 形式対応エージェントには、以下で追加できます:
npx skills add https://github.com/pixverseai/skills --skill pixverse-ai-image-and-video-generatorCursor、Claude Code、Codex など各種フレームワークでも、このスキルを与えることで、推測依存ではなく明示的制約にもとづいた高い実行安定性が得られます。
スキル読み込み後は、次のような自然言語指示が可能です:
- “Generate a 10-second product demo video from this screenshot”
- “Create four variations of this blog cover image in 16:9 format”
- “Animate this diagram into a 5-second explainer clip with ambient sound”
- “Generate three 8-second 16:9 promo clips with different camera motions”
エージェントは指示を適切な CLI コマンドへ変換し、JSON を解析し、ポーリングとダウンロードまで自動処理します。
Claude Code
Claude Code では、PixVerse CLI はエージェントが自律的に使うネイティブツールになります。PixVerse Skills 読み込み後は、任意タスクにメディア生成を直接組み込めます:
Generate a cover image for this blog post about machine learning,
use the seedream-5.0-lite model at 1800p in 16:9 format,
download it to ./assets/cover.webp
Claude Code は適切な CLI コマンドを呼び出し、JSON 応答から画像 URL を取得し、指定パスへ保存します。コード編集と同一セッションで完結します。
典型的な Claude Code ワークフロー:
# Claude Code runs this autonomously based on your instruction
IMG=$(pixverse create image \
--prompt "Abstract visualization of neural network layers, dark background, blue and purple tones" \
--model seedream-5.0-lite \
--quality 1800p \
--aspect-ratio 16:9 \
--json | jq -r '.image_url')
# Then animates it
pixverse create video \
--prompt "Slow pan across glowing neural connections" \
--image "$IMG" \
--model v6 \
--quality 1080p \
--duration 6 \
--jsonCursor
Cursor では PixVerse Skills をプロジェクトコンテキストとして読み込めます。関連ファイルを .cursor/ に置くか、ワークスペースルールへ追加してください。読み込み後は PixVerse CLI の全コマンドを理解した状態で、コーディングタスク内でメディア生成できます。
一般的な使い方は、作成中のデザインに合わせたモックアップ画像を生成させ、エディタを離れずに IDE セッション内で参照する流れです。
Codex とその他のエージェント
PixVerse CLI は、シェル実行と JSON 解析ができるすべてのエージェントに対応します。統一フィールド名、予測可能なエラーコード、stderr 分離エラーという構造化出力により、シンプルなスクリプト型エージェントでも安定統合が可能です。
終了コード契約により、エラー処理は明確です:
| コード | 意味 | エージェント動作 |
|---|---|---|
| 1 | 一般エラー | stderr を確認し、入力値を検証して再試行 |
| 0 | 成功 | JSON 出力を解析 |
| 2 | タイムアウト | --timeout を長くして再試行 |
| 3 | 認証期限切れ | pixverse auth login を再実行 |
| 4 | クレジット不足 | 残高を確認してユーザーに通知 |
| 5 | 生成失敗 | 別のパラメータで再試行 |
| 6 | バリデーションエラー | フラグ値を見直す |
自動化パイプライン
個別コマンドを理解すると、PixVerse CLI はユーザー操作なしで完結する強力な多段ワークフローを実現できます。
テキストから画像、そして動画へ
代表的なパイプラインは、テキストから高解像度画像を生成し、それを動画化する流れです。
# Step 1: Generate a base image
IMG_RESULT=$(pixverse create image \
--prompt "A cyberpunk cityscape at night, neon lights reflecting on wet pavement" \
--model gemini-3.1-flash \
--quality 2160p \
--aspect-ratio 16:9 \
--json)
IMAGE_URL=$(echo "$IMG_RESULT" | jq -r '.image_url')
# Step 2: Animate it into a video
VID_RESULT=$(pixverse create video \
--prompt "Camera slowly pans across the neon-lit streets" \
--image "$IMAGE_URL" \
--model v6 \
--quality 1080p \
--duration 8 \
--json)
VIDEO_ID=$(echo "$VID_RESULT" | jq -r '.video_id')
# Step 3: Download the final video
pixverse asset download "$VIDEO_ID" --jsonフル動画制作パイプライン
仕上がりを高めるには、生成と後処理を連結します:
# Step 1: Create the base video
RESULT=$(pixverse create video \
--prompt "A product being assembled in slow motion" \
--model v6 \
--quality 720p \
--duration 5 \
--json)
VID=$(echo "$RESULT" | jq -r '.video_id')
# Step 2: Extend duration
EXTENDED=$(pixverse create extend \
--video "$VID" \
--prompt "Continue the assembly sequence" \
--duration 5 \
--json | jq -r '.video_id')
pixverse task wait "$EXTENDED" --json
# Step 3: Add ambient sound
WITH_SOUND=$(pixverse create sound \
--video "$EXTENDED" \
--prompt "Industrial workshop ambience, soft mechanical sounds" \
--json | jq -r '.video_id')
pixverse task wait "$WITH_SOUND" --json
# Step 4: Upscale to 1080p
FINAL=$(pixverse create upscale \
--video "$WITH_SOUND" \
--quality 1080p \
--json | jq -r '.video_id')
pixverse task wait "$FINAL" --json
# Step 5: Download
pixverse asset download "$FINAL" --jsonバッチ生成
複数バリエーションが必要な場合は、ジョブを並列実行します:
# Check credits first
CREDITS=$(pixverse account info --json | jq -r '.credits.total')
echo "Available credits: $CREDITS"
# Submit four parallel generations
pixverse create video --prompt "Sunrise over mountains" --no-wait --json > /tmp/v1.json &
pixverse create video --prompt "Sunset over ocean" --no-wait --json > /tmp/v2.json &
pixverse create video --prompt "Stars over a desert" --no-wait --json > /tmp/v3.json &
pixverse create video --prompt "Aurora over a frozen lake" --no-wait --json > /tmp/v4.json &
wait
# Wait for each and download
for f in /tmp/v1.json /tmp/v2.json /tmp/v3.json /tmp/v4.json; do
ID=$(jq -r '.video_id' "$f")
pixverse task wait "$ID" --json
pixverse asset download "$ID" --json
done--no-wait はジョブを送信した時点でタスク ID を返して即時終了するため、先に複数投入してから待機できます。pixverse task wait が適応ポーリングを処理するので、手動 sleep ループは不要です。
デフォルトを設定する
同じモデル・品質・アスペクト比を継続利用する場合は、デフォルト化すると毎回の指定を省略できます:
pixverse config defaults set video model v6
pixverse config defaults set video quality 1080p
pixverse config defaults set image model seedream-5.0-lite
pixverse config set output-dir ~/Downloads/pixverse
pixverse config defaults showコマンドラインフラグは常にデフォルト設定を上書きするため、柔軟性はそのままです。
構築できること
PixVerse CLI をエージェント運用へ統合すると、自動化できる範囲が大きく広がります:
- ドキュメント — ドキュメントビルド時に製品デモ動画やスクリーンショットを自動生成
- マーケティング — 単一のプロンプト資産から SNS 向けバリエーションを夜間バッチで生成
- アプリ開発 — UI 構築中に、エージェントへ仮ビジュアル・モックアップアニメーション・ロード画面動画を生成させる
- コンテンツパイプライン — CLI を ffmpeg・ImageMagick・クラウド保存と連携し、全自動メディア制作を構築
- プロトタイピング — 本制作前に、数秒でモーション案を生成して検証
CLI はシェルベースの既存ワークフローへ自然に組み込めるよう設計されています。bash、Python、Node、CI/CD のいずれでも追加負荷なく導入できます。
スタートチェックリスト
- Node.js 20 以上をインストール
-
npm install -g pixverseを実行 -
pixverse auth loginを実行しブラウザで認可 -
pixverse account infoでクレジット確認 - 最初の画像を生成:
pixverse create image --prompt "..." --json - 最初の動画を生成:
pixverse create video --prompt "..." --json - エージェント用 PixVerse Skills を導入(Claude Code、Cursor、Codex)
-
pixverse config defaults setでデフォルト設定 - 最初の自動化パイプラインを構築
CLI を最新に保つ
npm でローカル CLI を更新します:
npm update -g pixverseリリース単位の変更や新対応モデルは、公式 changelog を確認してください:
次のステップ
npm の PixVerse CLI(npm install -g pixverse)を使えば、生成・タスク監視・アセット管理・保存フォルダ・ワークスペース制御までを単一インターフェースで扱えます。PixVerse Skills リポジトリを組み合わせることで、Claude Code、Cursor、Codex などのツールがより高い再現性でこれらのワークフローを実行できます。
信頼できる CLI とエージェント向けスキルライブラリの組み合わせにより、画像・動画生成をコード作業と同じ流れに統合できます。同じエージェントが同じターミナルで処理するため、ツール切り替えは不要です。
まずは 1 コマンドから始めて、段階的に拡張してください。