PixVerse CLI:開発者向けAI動画・画像生成ツール
PixVerse CLIのインストール方法、初めてのAI画像・動画生成、そしてClaude Code、Cursor、AIエージェント内でのクリエイティブワークフロー自動化について解説します。
PixVerse CLI:開発者向けAI動画・画像生成ツール
はじめに
あらゆるクリエイティブワークフローにはボトルネックがあります。それは、コードエディタを離れてブラウザを開き、Webインターフェースを手動でクリックしてメディアを生成しなければならない瞬間です。開発者やAIエージェント、自動化されたコンテンツパイプラインを構築している方にとって、このコンテキストスイッチは積み重なると大きな摩擦になります。
PixVerse CLIはそのボトルネックを解消します。これはPixVerseの公式コマンドラインインターフェースであり、PixVerseプラットフォームのすべてのモデル、すべての機能、すべての能力に、ターミナルから直接アクセスできます。テキストから動画、画像から動画、テキストから画像、リップシンク音声、効果音、アップスケール——すべてをスクリプト化でき、パイプで繋げられ、ブラウザを触ることなく利用できます。
PixVerse CLIが特に強力な理由は、その設計思想にあります。AIエージェントを念頭に置いて構築されており、すべてのコマンドが構造化されたJSONを出力し、すべての終了コードが確定的で、すべてのパイプラインステップが組み合わせ可能です。つまり、Claude Code、Cursor、Codex、またはその他のエージェントに画像や動画を代わりに生成させるよう教えることができ、常に正確に実行してくれます。
このガイドでは、インストールから初めての生成、そして多段階の自動化パイプラインとエージェントネイティブなワークフローまで、完全な手順を説明します。
前提条件
開始前に以下が必要です:
- Node.js 20以上 —
node --versionで確認してください - PixVerseアカウント — pixverse.aiでサインアップ
- 有効なPixVerseサブスクリプション — CLIはWebサイトと同じクレジットシステムを使用します。コンテンツを生成できるのはサブスクライブ済みのユーザーのみです
PixVerse CLIはAPIキーを手動でコピーする必要はありません。認証はブラウザベースのOAuthフローを通じて処理され、トークンはローカルに保存されます。
ステップ1:CLIのインストール
npmでグローバルにインストールします:
npm install -g pixverseインストールを確認します:
pixverse --versionグローバルインストールを避けたい場合は、npxを使ってコマンドを実行することもできます:
npx pixverse create video --prompt "火星を歩く猫"ステップ2:認証
ログインコマンドを実行します:
pixverse auth loginCLIが短いURLとコードを表示します。ブラウザでURLを開き、コードを入力して、PixVerseアカウントで認証します。トークンは自動的に~/.pixverse/に保存され、30日間有効です。
ログイン済みであることを確認し、利用可能なクレジットを確認するには:
pixverse auth status
pixverse account infoaccount infoコマンドでは、サブスクリプションのティア、残りのクレジット、日次クレジットリセットのスケジュールが表示されます。バッチジョブを実行する前に必ず残高を確認してください。
ステップ3:最初の画像を生成する
テキストから画像への生成は、セットアップをテストする最速の方法です。次を実行します:
pixverse create image --prompt "ゴールデンアワーの光差し込む森の小道、フォトリアリスティック" --json--jsonフラグは構造化された出力を返します:
{
"image_id": 789012,
"status": "completed",
"image_url": "https://...",
"prompt": "ゴールデンアワーの光差し込む森の小道、フォトリアリスティック",
"model": "qwen-image",
"width": 1024,
"height": 1024
}より高解像度の出力には、対応するモデルを指定します:
pixverse create image \
--prompt "ゴールデンアワーの光差し込む森の小道、フォトリアリスティック" \
--model seedream-5.0-lite \
--quality 1800p \
--aspect-ratio 16:9 \
--jsonPixVerseは複数の画像モデルをサポートしており、それぞれ解像度の上限と得意な用途が異なります:
| モデル | 最大解像度 | 最適な用途 |
|---|---|---|
qwen-image | 1080p | 高速生成、汎用 |
seedream-5.0-lite | 1800p | 高精細なクリエイティブ画像 |
seedream-4.5 | 2160p | 超高解像度 |
gemini-3.1-flash (Nano Banana 2) | 2160p | 広い解像度範囲、高速 |
gemini-3.0 (Nano Banana Pro) | 2160p | 大規模での高品質 |
gemini-2.5-flash (Nano Banana) | 1080p | 軽量、高速ターンアラウンド |
生成された画像をダウンロードするには:
pixverse asset download 789012ステップ4:最初の動画を生成する
テキストから動画への生成も同様の方法で行います。5秒のクリップを生成します:
pixverse create video --prompt "波打つ海の夕焼け" --json完全にカスタマイズされた生成を行うには:
pixverse create video \
--prompt "夜明けの霧がかかる山の谷上空を飛ぶシネマティックなドローンショット" \
--model v5.6 \
--quality 1080p \
--aspect-ratio 16:9 \
--duration 8 \
--audio \
--json--audioフラグは、動画コンテンツに合わせたAI生成の環境音を有効にします。--jsonフラグは完了時にvideo_urlを返し、ダウンロードコマンドやパイプラインの次のステップに直接渡すことができます。
PixVerseは複数の動画モデルを提供しており、それぞれ異なる機能を持っています:
| モデル | 最大品質 | 動画時間の範囲 | 備考 |
|---|---|---|---|
v5.6 | 1080p | 1〜10秒 | 最も柔軟、最広の時間範囲 |
sora-2-pro | 1080p | 4、8、12秒 | 高品質なシネマティック出力 |
veo-3.1-standard | 1080p | 4、6、8秒 | トランジションモード対応 |
grok-imagine | 720p | 1〜15秒 | 最長の最大時間 |
静止画像をアニメーション化する
写真や生成した画像を動画に変換するには、--imageフラグを使用します:
pixverse create video \
--prompt "穏やかな風がシーンを流れる" \
--image ./product-photo.jpg \
--model v5.6 \
--quality 1080p \
--jsonローカルファイルパスまたはURLを渡すことができます。ローカルファイルは自動的にアップロードされます——手動のアップロード手順は不要です。
ステップ5:インタラクティブウィザードを実行する
初めて利用していて、利用可能なすべてのフラグにまだ慣れていない場合は、引数なしで任意の作成コマンドを実行してガイド付きウィザードを起動できます:
pixverse create video
pixverse create imageウィザードはプロンプト、モデル選択、品質、アスペクト比、時間、その他のオプションをステップごとに案内します——スクリプト化する前に利用可能なパラメータを確認するのに役立ちます。
AIエージェントにメディア生成を教える
ここからPixVerse CLIが真に変革的になります。すべてのコマンドが構造化されたJSONを返し、確定的な終了コードを使用するため、シェルコマンドを実行できるどんなAIエージェントでも、オンデマンドで画像や動画を生成するよう教えることができます。
PixVerse Skillsのインストール
PixVerse Skillsは、エージェントにCLIの使い方を正確に教える構造化スキルファイルのライブラリです。各コマンドが受け付けるフラグ、各モデルがどのパラメータをサポートするか、コマンドをパイプラインに繋げる方法、エラーの処理方法が含まれています。
Claude Codeおよびスキルフォーマットをサポートするその他のエージェントには、PixVerse Skillsを直接追加します:
npx skills add https://github.com/pixverseai/skills --skill pixverse-ai-image-and-video-generatorCursorの場合、スキルはPixVerse Skills GitHubリポジトリのskills/に置かれており、エディタにコンテキストとして直接読み込むことができます。CodexやLangChainベースのエージェントの場合、各スキルファイルは独立したマークダウンであり、エージェントのシステムプロンプトに注入できます。
エージェントにPixVerse Skillsが読み込まれると、以下のような自然言語の指示を与えることができます:
- 「このスクリーンショットから10秒の製品デモ動画を生成して」
- 「このブログカバー画像の16:9フォーマットで4つのバリエーションを作成して」
- 「この図を環境音付きの5秒の説明クリップにアニメーション化して」
エージェントはそれらの指示を正確なCLIコマンドに変換し、JSONの出力を解析して、ポーリングとダウンロードを処理します——手動の介入は不要です。
Claude Code
Claude CodeではPixVerse CLIがエージェントが自律的に使用するネイティブツールになります。PixVerse Skillsを読み込んだ後、任意のタスクにメディア生成を直接含めることができます:
このブログ記事(機械学習に関する内容)のカバー画像を生成して、
seedream-5.0-liteモデルを使って1800pの16:9フォーマットで、
./assets/cover.webpにダウンロードして
Claude Codeは正確なCLIコマンドを呼び出し、JSONレスポンスから画像URLを解析して、指定したパスにファイルをダウンロードします——コードを書いている同じセッション内で、すべて完結します。
典型的なClaude Codeのワークフロー:
# Claude Codeがあなたの指示に基づいて自律的にこれを実行します
IMG=$(pixverse create image \
--prompt "ニューラルネットワーク層の抽象的な可視化、暗い背景、青と紫のトーン" \
--model seedream-5.0-lite \
--quality 1800p \
--aspect-ratio 16:9 \
--json | jq -r '.image_url')
# 次にアニメーション化します
pixverse create video \
--prompt "発光するニューラル接続をゆっくりパン" \
--image "$IMG" \
--model v5.6 \
--quality 1080p \
--duration 6 \
--jsonCursor
CursorユーザーはプロジェクトのコンテキストファイルとしてPixVerse Skillsを読み込むことができます。関連するスキルファイルを.cursor/ディレクトリに配置するか、ワークスペースのルールに追加します。読み込まれると、CursorはすべてのPixVerse CLIコマンドを完全に把握し、任意のコーディングタスクの一部としてメディアを生成できます。
よくあるCursorのワークフロー:構築中のデザインに基づいてモックアップ画像を生成するよう依頼し、エディタを離れることなくIDEセッションで直接参照として使用します。
Codexおよびその他のエージェント
PixVerse CLIはシェルコマンドを実行してJSONを解析できるあらゆるエージェントと互換性があります。構造化された出力フォーマット——一貫したフィールド名、予測可能なエラーコード、stderrで分離されたエラーメッセージ——により、シンプルなスクリプティングエージェントでも生成を確実に統合できます。
終了コードの契約によりエラー処理が簡単になります:
| コード | 意味 | エージェントのアクション |
|---|---|---|
| 0 | 成功 | JSON出力を解析 |
| 2 | タイムアウト | より長い--timeoutで再試行 |
| 3 | 認証期限切れ | pixverse auth loginを再実行 |
| 4 | クレジット不足 | 残高を確認し、ユーザーに通知 |
| 5 | 生成失敗 | 異なるパラメータを試す |
| 6 | バリデーションエラー | フラグの値を確認 |
自動化パイプライン
個々のコマンドを理解したら、PixVerse CLIはユーザーの介入なしに完全に実行する強力な多段階ワークフローを実現します。
テキストから画像、そして動画へ
最も有用なパイプラインの一つ:テキストプロンプトから高解像度画像を生成し、それを動画にアニメーション化します。
# ステップ1:ベース画像を生成する
IMG_RESULT=$(pixverse create image \
--prompt "夜のサイバーパンクな都市景観、濡れた路面に反射するネオンライト" \
--model gemini-3.1-flash \
--quality 2160p \
--aspect-ratio 16:9 \
--json)
IMAGE_URL=$(echo "$IMG_RESULT" | jq -r '.image_url')
# ステップ2:動画にアニメーション化する
VID_RESULT=$(pixverse create video \
--prompt "カメラがネオンに照らされた街をゆっくりパン" \
--image "$IMAGE_URL" \
--model v5.6 \
--quality 1080p \
--duration 8 \
--json)
VIDEO_ID=$(echo "$VID_RESULT" | jq -r '.video_id')
# ステップ3:最終動画をダウンロードする
pixverse asset download "$VIDEO_ID" --json完全な動画制作パイプライン
洗練された出力には、作成とポスト処理ステップを連鎖させます:
# ステップ1:ベース動画を作成する
RESULT=$(pixverse create video \
--prompt "製品がスローモーションで組み立てられる様子" \
--model v5.6 \
--quality 720p \
--duration 5 \
--json)
VID=$(echo "$RESULT" | jq -r '.video_id')
# ステップ2:時間を延長する
EXTENDED=$(pixverse create extend \
--video "$VID" \
--prompt "組み立てシーケンスを続ける" \
--duration 5 \
--json | jq -r '.video_id')
pixverse task wait "$EXTENDED" --json
# ステップ3:環境音を追加する
WITH_SOUND=$(pixverse create sound \
--video "$EXTENDED" \
--prompt "工場の作業場の雰囲気、柔らかな機械音" \
--json | jq -r '.video_id')
pixverse task wait "$WITH_SOUND" --json
# ステップ4:1080pにアップスケールする
FINAL=$(pixverse create upscale \
--video "$WITH_SOUND" \
--quality 1080p \
--json | jq -r '.video_id')
pixverse task wait "$FINAL" --json
# ステップ5:ダウンロードする
pixverse asset download "$FINAL" --jsonバッチ生成
複数のバリエーションが必要なコンテンツパイプラインには、並列でジョブを実行します:
# まずクレジットを確認する
CREDITS=$(pixverse account info --json | jq -r '.credits.total')
echo "利用可能なクレジット: $CREDITS"
# 4つの並列生成を送信する
pixverse create video --prompt "山の日の出" --no-wait --json > /tmp/v1.json &
pixverse create video --prompt "海の夕焼け" --no-wait --json > /tmp/v2.json &
pixverse create video --prompt "砂漠の星空" --no-wait --json > /tmp/v3.json &
pixverse create video --prompt "凍った湖のオーロラ" --no-wait --json > /tmp/v4.json &
wait
# それぞれを待機してダウンロードする
for f in /tmp/v1.json /tmp/v2.json /tmp/v3.json /tmp/v4.json; do
ID=$(jq -r '.video_id' "$f")
pixverse task wait "$ID" --json
pixverse asset download "$ID" --json
done--no-waitフラグはジョブを送信してタスクIDを返すと即座に終了し、ポーリングの前に複数のジョブを送信できます。pixverse task waitコマンドは適応的なポーリングを処理します——手動のsleepループは不要です。
デフォルト設定
同じモデル、品質、またはアスペクト比を常に使用する場合は、デフォルトとして設定することで、毎回フラグを繰り返す必要がなくなります:
pixverse config defaults set --mode video --model v5.6 --quality 1080p --aspect-ratio 16:9
pixverse config defaults set --mode image --model seedream-5.0-lite --quality 1800p
pixverse config set output-dir ~/Downloads/pixverseコマンドラインフラグは設定されたデフォルトを常に上書きするため、繰り返しを減らしながら完全な柔軟性を維持できます。
構築できるもの
PixVerse CLIをエージェントワークフローに統合することで、自動化可能なタスクの範囲が大幅に広がります:
- ドキュメント — ドキュメントのビルドプロセスの一部として製品デモ動画やスクリーンショットを自動生成
- マーケティング — 単一のプロンプトライブラリからソーシャルメディアコンテンツのバリエーションを生成する夜間バッチジョブを実行
- アプリ開発 — UIを構築しながら、コーディングエージェントにプレースホルダーのビジュアル、モックアップアニメーション、ローディング画面の動画を生成させる
- コンテンツパイプライン — CLIコールを他のツール(ffmpeg、ImageMagick、クラウドストレージ)と連鎖させて、完全に自動化されたメディア制作ワークフローを構築
- プロトタイピング — 本格的な制作にコミットする前にアイデアを検証するために、数秒でクイックなモーションコンセプトを生成
CLIはシェルベースのあらゆるワークフローに自然に収まるよう設計されています。既存の自動化がbash、Python、Node、またはCI/CDパイプラインで実行されている場合、PixVerse CLIは追加の統合オーバーヘッドなしにそこに組み込まれます。
はじめるためのチェックリスト
- Node.js 20以上をインストールする
-
npm install -g pixverseを実行する -
pixverse auth loginを実行してブラウザで認証する -
pixverse account infoを実行してクレジットを確認する - 最初の画像を生成する:
pixverse create image --prompt "..." --json - 最初の動画を生成する:
pixverse create video --prompt "..." --json - エージェント(Claude Code、Cursor、またはCodex)にPixVerse Skillsをインストールする
-
pixverse config defaults setで好みのデフォルトを設定する - 最初の自動化パイプラインを構築する
次のステップ
npmのPixVerse CLI(npm install -g pixverse)を使えば、すべての生成機能にすぐにアクセスできます。PixVerse Skillsリポジトリは、AIエージェントがどんなコンテキストでもその機能を正確に使えるよう教える構造化スキルファイルを提供しています。
信頼性の高いCLIとエージェント対応のスキルライブラリを組み合わせることで、画像と動画の生成がコードと同じワークフロー内に存在できるようになります——同じエージェントが管理し、同じターミナルで、ツールを切り替えることなく。
一つのコマンドから始めましょう。そこから積み上げていきましょう。