PixVerse CLI：面向开发者的AI视频与图像生成工具

学习如何安装 PixVerse CLI、生成首个AI图像和视频，并在 Claude Code、Cursor 及AI智能体中实现创意工作流自动化。

Product Update • 2026年3月13日

简介

每个创意工作流都有一个瓶颈——那个让你不得不离开代码编辑器、打开浏览器、手动点击网页界面来生成媒体内容的时刻。对于开发者、AI智能体以及任何构建自动化内容管道的人来说，这种上下文切换带来的摩擦会迅速积累。

PixVerse CLI 消除了这一瓶颈。它是 PixVerse 的官方命令行界面，让你可以直接从终端访问 PixVerse 平台上的每个模型、每个功能和每项能力。文字生成视频、图像生成视频、文字生成图像、口型同步语音、音效、超分辨率放大——全部可脚本化、可管道化，无需触碰浏览器即可使用。

PixVerse CLI 之所以特别强大，在于其设计理念：它从一开始就以AI智能体为核心进行构建。每条命令输出结构化 JSON，每个退出码都是确定性的，每个管道步骤都可组合。这意味着你可以让 Claude Code、Cursor、Codex 或任何其他智能体代你生成图像和视频——而且它们每次都能正确执行。

本指南将带你走完完整的旅程：从安装到首次生成，再到多步骤自动化管道和原生智能体工作流。

前置条件

开始之前，你需要：

Node.js 20 或更高版本 — 使用 node --version 检查
PixVerse 账户 — 在 pixverse.ai 注册
有效的 PixVerse 订阅 — CLI 使用与网站相同的积分系统；只有已订阅用户才能生成内容

PixVerse CLI 不需要手动复制任何 API 密钥。身份验证通过基于浏览器的 OAuth 流程处理，令牌会自动存储在本地。

第一步：安装 CLI

使用 npm 全局安装：

npm install -g pixverse

验证安装：

pixverse --version

如果你不想全局安装，也可以通过 npx 运行命令：

npx pixverse create video --prompt "一只猫在火星上行走"

第二步：身份验证

运行登录命令：

pixverse auth login

CLI 将打印一个短链接和一个验证码。在浏览器中打开该链接，输入验证码，然后用你的 PixVerse 账户授权。你的令牌会自动存储在 ~/.pixverse/ 中，有效期为 30 天。

要验证你已登录并查看可用积分：

pixverse auth status
pixverse account info

account info 命令会显示你的订阅层级、剩余积分和每日积分重置计划。在运行批量任务之前，务必检查你的余额。

第三步：生成首个图像

文字生成图像是测试你配置的最快方式。运行：

pixverse create image --prompt "黄金时段的真实感森林小径" --json

--json 标志返回结构化输出：

{
  "image_id": 789012,
  "status": "completed",
  "image_url": "https://...",
  "prompt": "黄金时段的真实感森林小径",
  "model": "qwen-image",
  "width": 1024,
  "height": 1024
}

要获得更高分辨率的输出，请指定支持它的模型：

pixverse create image \
  --prompt "黄金时段的真实感森林小径" \
  --model seedream-5.0-lite \
  --quality 1800p \
  --aspect-ratio 16:9 \
  --json

PixVerse 支持多种图像模型，各自具有不同的分辨率上限和优势：

模型	最大分辨率	适合场景
`qwen-image`	1080p	快速生成，通用用途
`seedream-5.0-lite`	1800p	高细节创意图像
`seedream-4.5`	2160p	超高分辨率
`gemini-3.1-flash` (Nano Banana 2)	2160p	宽分辨率范围，速度快
`gemini-3.0` (Nano Banana Pro)	2160p	大规模高质量输出
`gemini-2.5-flash` (Nano Banana)	1080p	轻量级，快速交付

下载生成的图像：

pixverse asset download 789012

第四步：生成首个视频

文字生成视频的方式相同。生成一段 5 秒的片段：

pixverse create video --prompt "海浪上的日落" --json

要进行完全自定义的生成：

pixverse create video \
  --prompt "清晨薄雾山谷上空的电影感无人机俯拍镜头" \
  --model v6 \
  --quality 1080p \
  --aspect-ratio 16:9 \
  --duration 8 \
  --audio \
  --json

--audio 标志可启用与视频内容相匹配的AI生成环境音效。--json 标志在完成时返回 video_url，你可以直接将其传递给下载命令或管道中的下一步。

PixVerse 提供多种具有不同能力的视频模型：

模型	最高画质	时长范围	说明
`v6`	1080p	1–15 秒	原生音频、内置多镜头引擎、20+ 电影级镜头控制
`v5.6`	1080p	1–8 秒	上一代；仍可使用
`veo-3.1-standard`	1080p	4、6、8 秒	支持转场模式
`grok-imagine`	720p	1–15 秒	最长生成时长
`sora-2-pro`	1080p	4、8、12 秒	高保真度，精准提示词遵循

将静态图像制作成动画

要将照片或生成的图像转换为视频，请提供 --image 标志：

pixverse create video \
  --prompt "微风轻拂画面" \
  --image ./product-photo.jpg \
  --model v6 \
  --quality 1080p \
  --json

你可以传入本地文件路径或 URL。本地文件会自动上传——无需手动上传步骤。

第五步：运行交互式向导

如果你是第一次探索，还不熟悉所有可用标志，可以不带任何参数运行创建命令，进入引导式向导：

pixverse create video
pixverse create image

向导会逐步引导你完成提示词、模型选择、画质、宽高比、时长和其他选项——在将它们编写为脚本之前，这对于了解可用参数非常有用。

教你的AI智能体生成媒体内容

这正是 PixVerse CLI 真正变得具有变革性的地方。由于每条命令都返回结构化 JSON 并使用确定性退出码，任何能够运行 shell 命令的 AI 智能体都可以被教导按需生成图像和视频。

安装 PixVerse Skills

PixVerse Skills 是一个结构化技能文件库，它能精确地教导智能体如何使用 CLI：每条命令接受哪些标志、哪些模型支持哪些参数、如何将命令串联成管道，以及如何处理错误。

对于 Claude Code 和其他支持 skills 格式的智能体，直接添加 PixVerse skills：

npx skills add https://github.com/pixverseai/skills --skill pixverse-ai-image-and-video-generator

技能库现已包含 Mondo Poster Design（v1.1.0），用于生成 Mondo 风格电影海报、图书封面与专辑封面。内置 37 种艺术家风格，分属 7 大类别——包括 Saul Bass、Olly Moss、Kilian Eng 等——以及 8 种构图技法（负空间、剪影、几何取景等）和 9 种电影类型的类型模板。提供两条端到端工作流：静态海报生成，以及通过 PixVerse 图生视频管线将海报做成动画视频。安装命令：

npx skills add https://github.com/pixverseai/skills --skill mondo-poster-design

仓库还提供社区贡献技能，例如 character-pipeline 与 shotpack，由独立开发者构建，可在 README 的 Community Skills 部分查看。贡献者可以通过 Pull Request 提交新技能或工作流。

对于 Cursor，skills 文件位于 PixVerse Skills GitHub 仓库的 skills/ 目录中，可以直接作为上下文加载到你的编辑器中。对于 Codex 和基于 LangChain 的智能体，每个技能文件都是独立的 markdown 文件，可以注入到智能体的系统提示中。

一旦你的智能体加载了 PixVerse skills，你就可以给它自然语言指令，例如：

“从这张截图生成一个 10 秒的产品演示视频”
“以 16:9 格式创建这张博客封面图像的四个变体”
“将这张图表动画化成一个带环境音效的 5 秒说明视频”
“设计一张 Mondo 风格的恐怖电影海报，采用 Olly Moss 的美学风格，再将其制作成 5 秒的揭示动画视频”

智能体将把这些指令转换为正确的 CLI 命令，解析 JSON 输出，并处理轮询和下载——无需人工干预。

Claude Code

在 Claude Code 中，PixVerse CLI 成为智能体自主使用的原生工具。加载 PixVerse skills 后，你可以在任何任务中直接包含媒体生成：

为这篇关于机器学习的博客文章生成封面图像，
使用 seedream-5.0-lite 模型，以 16:9 格式输出 1800p 分辨率，
下载到 ./assets/cover.webp

Claude Code 将调用正确的 CLI 命令，从 JSON 响应中解析图像 URL，并将文件下载到你指定的路径——所有这些都在同一个会话中完成，同时它也在编写你的代码。

典型的 Claude Code 工作流：

# Claude Code 根据你的指令自主运行此命令
IMG=$(pixverse create image \
  --prompt "神经网络层的抽象可视化，深色背景，蓝紫色调" \
  --model seedream-5.0-lite \
  --quality 1800p \
  --aspect-ratio 16:9 \
  --json | jq -r '.image_url')
 
# 然后将其制作成动画
pixverse create video \
  --prompt "缓慢平移穿过发光的神经网络连接" \
  --image "$IMG" \
  --model v6 \
  --quality 1080p \
  --duration 6 \
  --json

Cursor

Cursor 用户可以将 PixVerse Skills 作为项目上下文文件加载。将相关技能文件放置在你的 .cursor/ 目录中，或将其添加到工作区规则中。加载后，Cursor 可以完全感知每条 PixVerse CLI 命令，并能在任何编码任务中生成媒体内容。

常见的 Cursor 工作流：让智能体根据你正在构建的设计生成模型图像，然后直接在 IDE 会话中将其用作参考——无需离开编辑器。

Codex 及其他智能体

PixVerse CLI 与任何能够执行 shell 命令和解析 JSON 的智能体兼容。结构化输出格式——一致的字段名称、可预测的错误码以及通过 stderr 分离的错误消息——确保即使是简单的脚本智能体也能可靠地集成生成功能。

退出码约定使错误处理变得简单明了：

退出码	含义	智能体操作
0	成功	解析 JSON 输出
2	超时	使用更长的 `--timeout` 重试
3	身份验证过期	重新运行 `pixverse auth login`
4	积分不足	检查余额，通知用户
5	生成失败	尝试不同的参数
6	验证错误	检查标志值

自动化管道

一旦你了解了各个命令，PixVerse CLI 就能解锁完全无需用户交互的强大多步骤工作流。

文字到图像再到视频

最实用的管道之一：从文本提示生成高分辨率图像，然后将其动画化为视频。

# 第一步：生成基础图像
IMG_RESULT=$(pixverse create image \
  --prompt "夜晚的赛博朋克城市景观，霓虹灯倒映在湿润的路面上" \
  --model gemini-3.1-flash \
  --quality 2160p \
  --aspect-ratio 16:9 \
  --json)
 
IMAGE_URL=$(echo "$IMG_RESULT" | jq -r '.image_url')
 
# 第二步：将其动画化为视频
VID_RESULT=$(pixverse create video \
  --prompt "镜头缓慢平移过霓虹灯街道" \
  --image "$IMAGE_URL" \
  --model v6 \
  --quality 1080p \
  --duration 8 \
  --json)
 
VIDEO_ID=$(echo "$VID_RESULT" | jq -r '.video_id')
 
# 第三步：下载最终视频
pixverse asset download "$VIDEO_ID" --json

完整视频制作管道

为了获得精良的输出，将创建与后期处理步骤串联起来：

# 第一步：创建基础视频
RESULT=$(pixverse create video \
  --prompt "产品以慢动作组装" \
  --model v6 \
  --quality 720p \
  --duration 5 \
  --json)
 
VID=$(echo "$RESULT" | jq -r '.video_id')
 
# 第二步：延长时长
EXTENDED=$(pixverse create extend \
  --video "$VID" \
  --prompt "继续组装序列" \
  --duration 5 \
  --json | jq -r '.video_id')
 
pixverse task wait "$EXTENDED" --json
 
# 第三步：添加环境音效
WITH_SOUND=$(pixverse create sound \
  --video "$EXTENDED" \
  --prompt "工业车间氛围，轻柔的机械声" \
  --json | jq -r '.video_id')
 
pixverse task wait "$WITH_SOUND" --json
 
# 第四步：超分辨率放大至 1080p
FINAL=$(pixverse create upscale \
  --video "$WITH_SOUND" \
  --quality 1080p \
  --json | jq -r '.video_id')
 
pixverse task wait "$FINAL" --json
 
# 第五步：下载
pixverse asset download "$FINAL" --json

批量生成

对于需要多个变体的内容管道，并行运行任务：

# 首先检查积分
CREDITS=$(pixverse account info --json | jq -r '.credits.total')
echo "可用积分：$CREDITS"
 
# 提交四个并行生成任务
pixverse create video --prompt "山脉上的日出" --no-wait --json > /tmp/v1.json &
pixverse create video --prompt "海洋上的日落" --no-wait --json > /tmp/v2.json &
pixverse create video --prompt "沙漠上空的繁星" --no-wait --json > /tmp/v3.json &
pixverse create video --prompt "冰冻湖面上空的极光" --no-wait --json > /tmp/v4.json &
wait
 
# 等待每个任务完成并下载
for f in /tmp/v1.json /tmp/v2.json /tmp/v3.json /tmp/v4.json; do
  ID=$(jq -r '.video_id' "$f")
  pixverse task wait "$ID" --json
  pixverse asset download "$ID" --json
done

--no-wait 标志会提交任务并立即返回任务 ID，让你在轮询之前提交多个任务。pixverse task wait 命令会为你处理自适应轮询——无需手动编写 sleep 循环。

配置默认值

如果你经常使用相同的模型、画质或宽高比，可以将它们设置为默认值，这样每次就不需要重复输入标志：

pixverse config defaults set --mode video --model v6 --quality 1080p --aspect-ratio 16:9
pixverse config defaults set --mode image --model seedream-5.0-lite --quality 1800p
pixverse config set output-dir ~/Downloads/pixverse

命令行标志始终会覆盖你配置的默认值，因此你在减少重复的同时保留了完全的灵活性。

你可以构建什么

将 PixVerse CLI 集成到你的智能体工作流中后，可自动化的任务范围将大幅扩展：

文档 — 在文档构建过程中自动生成产品演示视频和截图
营销 — 运行夜间批量任务，从单个提示词库生成社交媒体内容变体
应用开发 — 让你的编码智能体在你构建 UI 的同时生成占位符视觉效果、模型动画或加载屏幕视频
内容管道 — 将 CLI 调用与其他工具（ffmpeg、ImageMagick、云存储）串联，构建全自动媒体制作工作流
原型设计 — 在几秒内生成快速动态概念，在投入完整制作之前验证创意
海报与封面艺术 — 使用 Mondo Poster Design 技能生成具有特定艺术家美学的风格化电影海报、图书封面或专辑封面，再通过单一工作流将其制作成揭示动画视频

CLI 被设计为能自然融入任何基于 shell 的工作流。如果你现有的自动化运行在 bash、Python、Node 或 CI/CD 管道中，PixVerse CLI 可以无缝接入，无需任何额外的集成开销。

快速上手清单

安装 Node.js 20 或更高版本
运行 npm install -g pixverse
运行 pixverse auth login 并在浏览器中授权
运行 pixverse account info 验证积分
生成你的第一张图像：pixverse create image --prompt "..." --json
生成你的第一个视频：pixverse create video --prompt "..." --json
为你的智能体安装 PixVerse Skills（Claude Code、Cursor 或 Codex）
使用 pixverse config defaults set 设置你偏好的默认值
构建你的第一个自动化管道

保持 CLI 为最新版本

技能仓库现已内置版本管理。VERSION 文件与 CHANGELOG.md 记录每次发布，附带的 check-update.sh 脚本可让你在终端中检查是否有新版本可用，无需离开命令行。要更新 CLI 本身：

npm update -g pixverse

下一步

npm 上的 PixVerse CLI（npm install -g pixverse）让你立即访问所有生成功能。PixVerse Skills 仓库提供结构化技能文件，帮助你的 AI 智能体在任何场景下正确使用这些能力——其中包括全新的 Mondo Poster Design 技能、由社区贡献的工作流（如 character-pipeline 与 shotpack），以及持续扩充的 references/ 高级用法知识库目录。

可靠的 CLI 与面向智能体的技能库相结合，意味着图像与视频生成可以与代码处于同一工作流——由同一智能体在同一终端管理，无需切换工具。仓库欢迎贡献：若你构建了实用的技能或工作流，可直接通过 Pull Request 提交。

从一条命令开始，逐步构建。