PixVerse CLI:開発者向けAI動画・画像生成ツール

PixVerse CLIのインストール方法、初めてのAI画像・動画生成、そしてClaude Code、Cursor、AIエージェント内でのクリエイティブワークフロー自動化について解説します。

Product Update
PixVerse CLI:開発者向けAI動画・画像生成ツール

PixVerse CLI:開発者向けAI動画・画像生成ツール

はじめに

あらゆるクリエイティブワークフローにはボトルネックがあります。それは、コードエディタを離れてブラウザを開き、Webインターフェースを手動でクリックしてメディアを生成しなければならない瞬間です。開発者やAIエージェント、自動化されたコンテンツパイプラインを構築している方にとって、このコンテキストスイッチは積み重なると大きな摩擦になります。

PixVerse CLIはそのボトルネックを解消します。これはPixVerseの公式コマンドラインインターフェースであり、PixVerseプラットフォームのすべてのモデル、すべての機能、すべての能力に、ターミナルから直接アクセスできます。テキストから動画、画像から動画、テキストから画像、リップシンク音声、効果音、アップスケール——すべてをスクリプト化でき、パイプで繋げられ、ブラウザを触ることなく利用できます。

PixVerse CLIが特に強力な理由は、その設計思想にあります。AIエージェントを念頭に置いて構築されており、すべてのコマンドが構造化されたJSONを出力し、すべての終了コードが確定的で、すべてのパイプラインステップが組み合わせ可能です。つまり、Claude Code、Cursor、Codex、またはその他のエージェントに画像や動画を代わりに生成させるよう教えることができ、常に正確に実行してくれます。

このガイドでは、インストールから初めての生成、そして多段階の自動化パイプラインとエージェントネイティブなワークフローまで、完全な手順を説明します。

前提条件

開始前に以下が必要です:

  • Node.js 20以上node --versionで確認してください
  • PixVerseアカウントpixverse.aiでサインアップ
  • 有効なPixVerseサブスクリプション — CLIはWebサイトと同じクレジットシステムを使用します。コンテンツを生成できるのはサブスクライブ済みのユーザーのみです

PixVerse CLIはAPIキーを手動でコピーする必要はありません。認証はブラウザベースのOAuthフローを通じて処理され、トークンはローカルに保存されます。

ステップ1:CLIのインストール

npmでグローバルにインストールします:

npm install -g pixverse

インストールを確認します:

pixverse --version

グローバルインストールを避けたい場合は、npxを使ってコマンドを実行することもできます:

npx pixverse create video --prompt "火星を歩く猫"

ステップ2:認証

ログインコマンドを実行します:

pixverse auth login

CLIが短いURLとコードを表示します。ブラウザでURLを開き、コードを入力して、PixVerseアカウントで認証します。トークンは自動的に~/.pixverse/に保存され、30日間有効です。

ログイン済みであることを確認し、利用可能なクレジットを確認するには:

pixverse auth status
pixverse account info

account infoコマンドでは、サブスクリプションのティア、残りのクレジット、日次クレジットリセットのスケジュールが表示されます。バッチジョブを実行する前に必ず残高を確認してください。

ステップ3:最初の画像を生成する

テキストから画像への生成は、セットアップをテストする最速の方法です。次を実行します:

pixverse create image --prompt "ゴールデンアワーの光差し込む森の小道、フォトリアリスティック" --json

--jsonフラグは構造化された出力を返します:

{
  "image_id": 789012,
  "status": "completed",
  "image_url": "https://...",
  "prompt": "ゴールデンアワーの光差し込む森の小道、フォトリアリスティック",
  "model": "qwen-image",
  "width": 1024,
  "height": 1024
}

より高解像度の出力には、対応するモデルを指定します:

pixverse create image \
  --prompt "ゴールデンアワーの光差し込む森の小道、フォトリアリスティック" \
  --model seedream-5.0-lite \
  --quality 1800p \
  --aspect-ratio 16:9 \
  --json

PixVerseは複数の画像モデルをサポートしており、それぞれ解像度の上限と得意な用途が異なります:

モデル最大解像度最適な用途
qwen-image1080p高速生成、汎用
seedream-5.0-lite1800p高精細なクリエイティブ画像
seedream-4.52160p超高解像度
gemini-3.1-flash (Nano Banana 2)2160p広い解像度範囲、高速
gemini-3.0 (Nano Banana Pro)2160p大規模での高品質
gemini-2.5-flash (Nano Banana)1080p軽量、高速ターンアラウンド

生成された画像をダウンロードするには:

pixverse asset download 789012

ステップ4:最初の動画を生成する

テキストから動画への生成も同様の方法で行います。5秒のクリップを生成します:

pixverse create video --prompt "波打つ海の夕焼け" --json

完全にカスタマイズされた生成を行うには:

pixverse create video \
  --prompt "夜明けの霧がかかる山の谷上空を飛ぶシネマティックなドローンショット" \
  --model v5.6 \
  --quality 1080p \
  --aspect-ratio 16:9 \
  --duration 8 \
  --audio \
  --json

--audioフラグは、動画コンテンツに合わせたAI生成の環境音を有効にします。--jsonフラグは完了時にvideo_urlを返し、ダウンロードコマンドやパイプラインの次のステップに直接渡すことができます。

PixVerseは複数の動画モデルを提供しており、それぞれ異なる機能を持っています:

モデル最大品質動画時間の範囲備考
v5.61080p1〜10秒最も柔軟、最広の時間範囲
sora-2-pro1080p4、8、12秒高品質なシネマティック出力
veo-3.1-standard1080p4、6、8秒トランジションモード対応
grok-imagine720p1〜15秒最長の最大時間

静止画像をアニメーション化する

写真や生成した画像を動画に変換するには、--imageフラグを使用します:

pixverse create video \
  --prompt "穏やかな風がシーンを流れる" \
  --image ./product-photo.jpg \
  --model v5.6 \
  --quality 1080p \
  --json

ローカルファイルパスまたはURLを渡すことができます。ローカルファイルは自動的にアップロードされます——手動のアップロード手順は不要です。

ステップ5:インタラクティブウィザードを実行する

初めて利用していて、利用可能なすべてのフラグにまだ慣れていない場合は、引数なしで任意の作成コマンドを実行してガイド付きウィザードを起動できます:

pixverse create video
pixverse create image

ウィザードはプロンプト、モデル選択、品質、アスペクト比、時間、その他のオプションをステップごとに案内します——スクリプト化する前に利用可能なパラメータを確認するのに役立ちます。

AIエージェントにメディア生成を教える

ここからPixVerse CLIが真に変革的になります。すべてのコマンドが構造化されたJSONを返し、確定的な終了コードを使用するため、シェルコマンドを実行できるどんなAIエージェントでも、オンデマンドで画像や動画を生成するよう教えることができます。

PixVerse Skillsのインストール

PixVerse Skillsは、エージェントにCLIの使い方を正確に教える構造化スキルファイルのライブラリです。各コマンドが受け付けるフラグ、各モデルがどのパラメータをサポートするか、コマンドをパイプラインに繋げる方法、エラーの処理方法が含まれています。

Claude Codeおよびスキルフォーマットをサポートするその他のエージェントには、PixVerse Skillsを直接追加します:

npx skills add https://github.com/pixverseai/skills --skill pixverse-ai-image-and-video-generator

Cursorの場合、スキルはPixVerse Skills GitHubリポジトリのskills/に置かれており、エディタにコンテキストとして直接読み込むことができます。CodexやLangChainベースのエージェントの場合、各スキルファイルは独立したマークダウンであり、エージェントのシステムプロンプトに注入できます。

エージェントにPixVerse Skillsが読み込まれると、以下のような自然言語の指示を与えることができます:

  • 「このスクリーンショットから10秒の製品デモ動画を生成して」
  • 「このブログカバー画像の16:9フォーマットで4つのバリエーションを作成して」
  • 「この図を環境音付きの5秒の説明クリップにアニメーション化して」

エージェントはそれらの指示を正確なCLIコマンドに変換し、JSONの出力を解析して、ポーリングとダウンロードを処理します——手動の介入は不要です。

Claude Code

Claude CodeではPixVerse CLIがエージェントが自律的に使用するネイティブツールになります。PixVerse Skillsを読み込んだ後、任意のタスクにメディア生成を直接含めることができます:

このブログ記事(機械学習に関する内容)のカバー画像を生成して、
seedream-5.0-liteモデルを使って1800pの16:9フォーマットで、
./assets/cover.webpにダウンロードして

Claude Codeは正確なCLIコマンドを呼び出し、JSONレスポンスから画像URLを解析して、指定したパスにファイルをダウンロードします——コードを書いている同じセッション内で、すべて完結します。

典型的なClaude Codeのワークフロー:

# Claude Codeがあなたの指示に基づいて自律的にこれを実行します
IMG=$(pixverse create image \
  --prompt "ニューラルネットワーク層の抽象的な可視化、暗い背景、青と紫のトーン" \
  --model seedream-5.0-lite \
  --quality 1800p \
  --aspect-ratio 16:9 \
  --json | jq -r '.image_url')
 
# 次にアニメーション化します
pixverse create video \
  --prompt "発光するニューラル接続をゆっくりパン" \
  --image "$IMG" \
  --model v5.6 \
  --quality 1080p \
  --duration 6 \
  --json

Cursor

CursorユーザーはプロジェクトのコンテキストファイルとしてPixVerse Skillsを読み込むことができます。関連するスキルファイルを.cursor/ディレクトリに配置するか、ワークスペースのルールに追加します。読み込まれると、CursorはすべてのPixVerse CLIコマンドを完全に把握し、任意のコーディングタスクの一部としてメディアを生成できます。

よくあるCursorのワークフロー:構築中のデザインに基づいてモックアップ画像を生成するよう依頼し、エディタを離れることなくIDEセッションで直接参照として使用します。

Codexおよびその他のエージェント

PixVerse CLIはシェルコマンドを実行してJSONを解析できるあらゆるエージェントと互換性があります。構造化された出力フォーマット——一貫したフィールド名、予測可能なエラーコード、stderrで分離されたエラーメッセージ——により、シンプルなスクリプティングエージェントでも生成を確実に統合できます。

終了コードの契約によりエラー処理が簡単になります:

コード意味エージェントのアクション
0成功JSON出力を解析
2タイムアウトより長い--timeoutで再試行
3認証期限切れpixverse auth loginを再実行
4クレジット不足残高を確認し、ユーザーに通知
5生成失敗異なるパラメータを試す
6バリデーションエラーフラグの値を確認

自動化パイプライン

個々のコマンドを理解したら、PixVerse CLIはユーザーの介入なしに完全に実行する強力な多段階ワークフローを実現します。

テキストから画像、そして動画へ

最も有用なパイプラインの一つ:テキストプロンプトから高解像度画像を生成し、それを動画にアニメーション化します。

# ステップ1:ベース画像を生成する
IMG_RESULT=$(pixverse create image \
  --prompt "夜のサイバーパンクな都市景観、濡れた路面に反射するネオンライト" \
  --model gemini-3.1-flash \
  --quality 2160p \
  --aspect-ratio 16:9 \
  --json)
 
IMAGE_URL=$(echo "$IMG_RESULT" | jq -r '.image_url')
 
# ステップ2:動画にアニメーション化する
VID_RESULT=$(pixverse create video \
  --prompt "カメラがネオンに照らされた街をゆっくりパン" \
  --image "$IMAGE_URL" \
  --model v5.6 \
  --quality 1080p \
  --duration 8 \
  --json)
 
VIDEO_ID=$(echo "$VID_RESULT" | jq -r '.video_id')
 
# ステップ3:最終動画をダウンロードする
pixverse asset download "$VIDEO_ID" --json

完全な動画制作パイプライン

洗練された出力には、作成とポスト処理ステップを連鎖させます:

# ステップ1:ベース動画を作成する
RESULT=$(pixverse create video \
  --prompt "製品がスローモーションで組み立てられる様子" \
  --model v5.6 \
  --quality 720p \
  --duration 5 \
  --json)
 
VID=$(echo "$RESULT" | jq -r '.video_id')
 
# ステップ2:時間を延長する
EXTENDED=$(pixverse create extend \
  --video "$VID" \
  --prompt "組み立てシーケンスを続ける" \
  --duration 5 \
  --json | jq -r '.video_id')
 
pixverse task wait "$EXTENDED" --json
 
# ステップ3:環境音を追加する
WITH_SOUND=$(pixverse create sound \
  --video "$EXTENDED" \
  --prompt "工場の作業場の雰囲気、柔らかな機械音" \
  --json | jq -r '.video_id')
 
pixverse task wait "$WITH_SOUND" --json
 
# ステップ4:1080pにアップスケールする
FINAL=$(pixverse create upscale \
  --video "$WITH_SOUND" \
  --quality 1080p \
  --json | jq -r '.video_id')
 
pixverse task wait "$FINAL" --json
 
# ステップ5:ダウンロードする
pixverse asset download "$FINAL" --json

バッチ生成

複数のバリエーションが必要なコンテンツパイプラインには、並列でジョブを実行します:

# まずクレジットを確認する
CREDITS=$(pixverse account info --json | jq -r '.credits.total')
echo "利用可能なクレジット: $CREDITS"
 
# 4つの並列生成を送信する
pixverse create video --prompt "山の日の出" --no-wait --json > /tmp/v1.json &
pixverse create video --prompt "海の夕焼け" --no-wait --json > /tmp/v2.json &
pixverse create video --prompt "砂漠の星空" --no-wait --json > /tmp/v3.json &
pixverse create video --prompt "凍った湖のオーロラ" --no-wait --json > /tmp/v4.json &
wait
 
# それぞれを待機してダウンロードする
for f in /tmp/v1.json /tmp/v2.json /tmp/v3.json /tmp/v4.json; do
  ID=$(jq -r '.video_id' "$f")
  pixverse task wait "$ID" --json
  pixverse asset download "$ID" --json
done

--no-waitフラグはジョブを送信してタスクIDを返すと即座に終了し、ポーリングの前に複数のジョブを送信できます。pixverse task waitコマンドは適応的なポーリングを処理します——手動のsleepループは不要です。

デフォルト設定

同じモデル、品質、またはアスペクト比を常に使用する場合は、デフォルトとして設定することで、毎回フラグを繰り返す必要がなくなります:

pixverse config defaults set --mode video --model v5.6 --quality 1080p --aspect-ratio 16:9
pixverse config defaults set --mode image --model seedream-5.0-lite --quality 1800p
pixverse config set output-dir ~/Downloads/pixverse

コマンドラインフラグは設定されたデフォルトを常に上書きするため、繰り返しを減らしながら完全な柔軟性を維持できます。

構築できるもの

PixVerse CLIをエージェントワークフローに統合することで、自動化可能なタスクの範囲が大幅に広がります:

  • ドキュメント — ドキュメントのビルドプロセスの一部として製品デモ動画やスクリーンショットを自動生成
  • マーケティング — 単一のプロンプトライブラリからソーシャルメディアコンテンツのバリエーションを生成する夜間バッチジョブを実行
  • アプリ開発 — UIを構築しながら、コーディングエージェントにプレースホルダーのビジュアル、モックアップアニメーション、ローディング画面の動画を生成させる
  • コンテンツパイプライン — CLIコールを他のツール(ffmpeg、ImageMagick、クラウドストレージ)と連鎖させて、完全に自動化されたメディア制作ワークフローを構築
  • プロトタイピング — 本格的な制作にコミットする前にアイデアを検証するために、数秒でクイックなモーションコンセプトを生成

CLIはシェルベースのあらゆるワークフローに自然に収まるよう設計されています。既存の自動化がbash、Python、Node、またはCI/CDパイプラインで実行されている場合、PixVerse CLIは追加の統合オーバーヘッドなしにそこに組み込まれます。

はじめるためのチェックリスト

  • Node.js 20以上をインストールする
  • npm install -g pixverseを実行する
  • pixverse auth loginを実行してブラウザで認証する
  • pixverse account infoを実行してクレジットを確認する
  • 最初の画像を生成する:pixverse create image --prompt "..." --json
  • 最初の動画を生成する:pixverse create video --prompt "..." --json
  • エージェント(Claude Code、Cursor、またはCodex)にPixVerse Skillsをインストールする
  • pixverse config defaults setで好みのデフォルトを設定する
  • 最初の自動化パイプラインを構築する

次のステップ

npmのPixVerse CLI(npm install -g pixverse)を使えば、すべての生成機能にすぐにアクセスできます。PixVerse Skillsリポジトリは、AIエージェントがどんなコンテキストでもその機能を正確に使えるよう教える構造化スキルファイルを提供しています。

信頼性の高いCLIとエージェント対応のスキルライブラリを組み合わせることで、画像と動画の生成がコードと同じワークフロー内に存在できるようになります——同じエージェントが管理し、同じターミナルで、ツールを切り替えることなく。

一つのコマンドから始めましょう。そこから積み上げていきましょう。