PixVerse CLI:面向开发者的AI视频与图像生成工具

学习如何安装 PixVerse CLI、生成首个AI图像和视频,并在 Claude Code、Cursor 及AI智能体中实现创意工作流自动化。

Product Update
PixVerse CLI:面向开发者的AI视频与图像生成工具

PixVerse CLI:面向开发者的AI视频与图像生成工具

简介

每个创意工作流都有一个瓶颈——那个让你不得不离开代码编辑器、打开浏览器、手动点击网页界面来生成媒体内容的时刻。对于开发者、AI智能体以及任何构建自动化内容管道的人来说,这种上下文切换带来的摩擦会迅速积累。

PixVerse CLI 消除了这一瓶颈。它是 PixVerse 的官方命令行界面,让你可以直接从终端访问 PixVerse 平台上的每个模型、每个功能和每项能力。文字生成视频、图像生成视频、文字生成图像、口型同步语音、音效、超分辨率放大——全部可脚本化、可管道化,无需触碰浏览器即可使用。

PixVerse CLI 之所以特别强大,在于其设计理念:它从一开始就以AI智能体为核心进行构建。每条命令输出结构化 JSON,每个退出码都是确定性的,每个管道步骤都可组合。这意味着你可以让 Claude Code、Cursor、Codex 或任何其他智能体代你生成图像和视频——而且它们每次都能正确执行。

本指南将带你走完完整的旅程:从安装到首次生成,再到多步骤自动化管道和原生智能体工作流。

前置条件

开始之前,你需要:

  • Node.js 20 或更高版本 — 使用 node --version 检查
  • PixVerse 账户 — 在 pixverse.ai 注册
  • 有效的 PixVerse 订阅 — CLI 使用与网站相同的积分系统;只有已订阅用户才能生成内容

PixVerse CLI 不需要手动复制任何 API 密钥。身份验证通过基于浏览器的 OAuth 流程处理,令牌会自动存储在本地。

第一步:安装 CLI

使用 npm 全局安装:

npm install -g pixverse

验证安装:

pixverse --version

如果你不想全局安装,也可以通过 npx 运行命令:

npx pixverse create video --prompt "一只猫在火星上行走"

第二步:身份验证

运行登录命令:

pixverse auth login

CLI 将打印一个短链接和一个验证码。在浏览器中打开该链接,输入验证码,然后用你的 PixVerse 账户授权。你的令牌会自动存储在 ~/.pixverse/ 中,有效期为 30 天。

要验证你已登录并查看可用积分:

pixverse auth status
pixverse account info

account info 命令会显示你的订阅层级、剩余积分和每日积分重置计划。在运行批量任务之前,务必检查你的余额。

第三步:生成首个图像

文字生成图像是测试你配置的最快方式。运行:

pixverse create image --prompt "黄金时段的真实感森林小径" --json

--json 标志返回结构化输出:

{
  "image_id": 789012,
  "status": "completed",
  "image_url": "https://...",
  "prompt": "黄金时段的真实感森林小径",
  "model": "qwen-image",
  "width": 1024,
  "height": 1024
}

要获得更高分辨率的输出,请指定支持它的模型:

pixverse create image \
  --prompt "黄金时段的真实感森林小径" \
  --model seedream-5.0-lite \
  --quality 1800p \
  --aspect-ratio 16:9 \
  --json

PixVerse 支持多种图像模型,各自具有不同的分辨率上限和优势:

模型最大分辨率适合场景
qwen-image1080p快速生成,通用用途
seedream-5.0-lite1800p高细节创意图像
seedream-4.52160p超高分辨率
gemini-3.1-flash (Nano Banana 2)2160p宽分辨率范围,速度快
gemini-3.0 (Nano Banana Pro)2160p大规模高质量输出
gemini-2.5-flash (Nano Banana)1080p轻量级,快速交付

下载生成的图像:

pixverse asset download 789012

第四步:生成首个视频

文字生成视频的方式相同。生成一段 5 秒的片段:

pixverse create video --prompt "海浪上的日落" --json

要进行完全自定义的生成:

pixverse create video \
  --prompt "清晨薄雾山谷上空的电影感无人机俯拍镜头" \
  --model v5.6 \
  --quality 1080p \
  --aspect-ratio 16:9 \
  --duration 8 \
  --audio \
  --json

--audio 标志可启用与视频内容相匹配的AI生成环境音效。--json 标志在完成时返回 video_url,你可以直接将其传递给下载命令或管道中的下一步。

PixVerse 提供多种具有不同能力的视频模型:

模型最高画质时长范围说明
v5.61080p1–10 秒最灵活;最宽的时长范围
sora-2-pro1080p4、8、12 秒高质量电影级输出
veo-3.1-standard1080p4、6、8 秒支持转场模式
grok-imagine720p1–15 秒最长最大时长

将静态图像制作成动画

要将照片或生成的图像转换为视频,请提供 --image 标志:

pixverse create video \
  --prompt "微风轻拂画面" \
  --image ./product-photo.jpg \
  --model v5.6 \
  --quality 1080p \
  --json

你可以传入本地文件路径或 URL。本地文件会自动上传——无需手动上传步骤。

第五步:运行交互式向导

如果你是第一次探索,还不熟悉所有可用标志,可以不带任何参数运行创建命令,进入引导式向导:

pixverse create video
pixverse create image

向导会逐步引导你完成提示词、模型选择、画质、宽高比、时长和其他选项——在将它们编写为脚本之前,这对于了解可用参数非常有用。

教你的AI智能体生成媒体内容

这正是 PixVerse CLI 真正变得具有变革性的地方。由于每条命令都返回结构化 JSON 并使用确定性退出码,任何能够运行 shell 命令的 AI 智能体都可以被教导按需生成图像和视频。

安装 PixVerse Skills

PixVerse Skills 是一个结构化技能文件库,它能精确地教导智能体如何使用 CLI:每条命令接受哪些标志、哪些模型支持哪些参数、如何将命令串联成管道,以及如何处理错误。

对于 Claude Code 和其他支持 skills 格式的智能体,直接添加 PixVerse skills:

npx skills add https://github.com/pixverseai/skills --skill pixverse-ai-image-and-video-generator

对于 Cursor,skills 文件位于 PixVerse Skills GitHub 仓库的 skills/ 目录中,可以直接作为上下文加载到你的编辑器中。对于 Codex 和基于 LangChain 的智能体,每个技能文件都是独立的 markdown 文件,可以注入到智能体的系统提示中。

一旦你的智能体加载了 PixVerse skills,你就可以给它自然语言指令,例如:

  • “从这张截图生成一个 10 秒的产品演示视频”
  • “以 16:9 格式创建这张博客封面图像的四个变体”
  • “将这张图表动画化成一个带环境音效的 5 秒说明视频”

智能体将把这些指令转换为正确的 CLI 命令,解析 JSON 输出,并处理轮询和下载——无需人工干预。

Claude Code

在 Claude Code 中,PixVerse CLI 成为智能体自主使用的原生工具。加载 PixVerse skills 后,你可以在任何任务中直接包含媒体生成:

为这篇关于机器学习的博客文章生成封面图像,
使用 seedream-5.0-lite 模型,以 16:9 格式输出 1800p 分辨率,
下载到 ./assets/cover.webp

Claude Code 将调用正确的 CLI 命令,从 JSON 响应中解析图像 URL,并将文件下载到你指定的路径——所有这些都在同一个会话中完成,同时它也在编写你的代码。

典型的 Claude Code 工作流:

# Claude Code 根据你的指令自主运行此命令
IMG=$(pixverse create image \
  --prompt "神经网络层的抽象可视化,深色背景,蓝紫色调" \
  --model seedream-5.0-lite \
  --quality 1800p \
  --aspect-ratio 16:9 \
  --json | jq -r '.image_url')
 
# 然后将其制作成动画
pixverse create video \
  --prompt "缓慢平移穿过发光的神经网络连接" \
  --image "$IMG" \
  --model v5.6 \
  --quality 1080p \
  --duration 6 \
  --json

Cursor

Cursor 用户可以将 PixVerse Skills 作为项目上下文文件加载。将相关技能文件放置在你的 .cursor/ 目录中,或将其添加到工作区规则中。加载后,Cursor 可以完全感知每条 PixVerse CLI 命令,并能在任何编码任务中生成媒体内容。

常见的 Cursor 工作流:让智能体根据你正在构建的设计生成模型图像,然后直接在 IDE 会话中将其用作参考——无需离开编辑器。

Codex 及其他智能体

PixVerse CLI 与任何能够执行 shell 命令和解析 JSON 的智能体兼容。结构化输出格式——一致的字段名称、可预测的错误码以及通过 stderr 分离的错误消息——确保即使是简单的脚本智能体也能可靠地集成生成功能。

退出码约定使错误处理变得简单明了:

退出码含义智能体操作
0成功解析 JSON 输出
2超时使用更长的 --timeout 重试
3身份验证过期重新运行 pixverse auth login
4积分不足检查余额,通知用户
5生成失败尝试不同的参数
6验证错误检查标志值

自动化管道

一旦你了解了各个命令,PixVerse CLI 就能解锁完全无需用户交互的强大多步骤工作流。

文字到图像再到视频

最实用的管道之一:从文本提示生成高分辨率图像,然后将其动画化为视频。

# 第一步:生成基础图像
IMG_RESULT=$(pixverse create image \
  --prompt "夜晚的赛博朋克城市景观,霓虹灯倒映在湿润的路面上" \
  --model gemini-3.1-flash \
  --quality 2160p \
  --aspect-ratio 16:9 \
  --json)
 
IMAGE_URL=$(echo "$IMG_RESULT" | jq -r '.image_url')
 
# 第二步:将其动画化为视频
VID_RESULT=$(pixverse create video \
  --prompt "镜头缓慢平移过霓虹灯街道" \
  --image "$IMAGE_URL" \
  --model v5.6 \
  --quality 1080p \
  --duration 8 \
  --json)
 
VIDEO_ID=$(echo "$VID_RESULT" | jq -r '.video_id')
 
# 第三步:下载最终视频
pixverse asset download "$VIDEO_ID" --json

完整视频制作管道

为了获得精良的输出,将创建与后期处理步骤串联起来:

# 第一步:创建基础视频
RESULT=$(pixverse create video \
  --prompt "产品以慢动作组装" \
  --model v5.6 \
  --quality 720p \
  --duration 5 \
  --json)
 
VID=$(echo "$RESULT" | jq -r '.video_id')
 
# 第二步:延长时长
EXTENDED=$(pixverse create extend \
  --video "$VID" \
  --prompt "继续组装序列" \
  --duration 5 \
  --json | jq -r '.video_id')
 
pixverse task wait "$EXTENDED" --json
 
# 第三步:添加环境音效
WITH_SOUND=$(pixverse create sound \
  --video "$EXTENDED" \
  --prompt "工业车间氛围,轻柔的机械声" \
  --json | jq -r '.video_id')
 
pixverse task wait "$WITH_SOUND" --json
 
# 第四步:超分辨率放大至 1080p
FINAL=$(pixverse create upscale \
  --video "$WITH_SOUND" \
  --quality 1080p \
  --json | jq -r '.video_id')
 
pixverse task wait "$FINAL" --json
 
# 第五步:下载
pixverse asset download "$FINAL" --json

批量生成

对于需要多个变体的内容管道,并行运行任务:

# 首先检查积分
CREDITS=$(pixverse account info --json | jq -r '.credits.total')
echo "可用积分:$CREDITS"
 
# 提交四个并行生成任务
pixverse create video --prompt "山脉上的日出" --no-wait --json > /tmp/v1.json &
pixverse create video --prompt "海洋上的日落" --no-wait --json > /tmp/v2.json &
pixverse create video --prompt "沙漠上空的繁星" --no-wait --json > /tmp/v3.json &
pixverse create video --prompt "冰冻湖面上空的极光" --no-wait --json > /tmp/v4.json &
wait
 
# 等待每个任务完成并下载
for f in /tmp/v1.json /tmp/v2.json /tmp/v3.json /tmp/v4.json; do
  ID=$(jq -r '.video_id' "$f")
  pixverse task wait "$ID" --json
  pixverse asset download "$ID" --json
done

--no-wait 标志会提交任务并立即返回任务 ID,让你在轮询之前提交多个任务。pixverse task wait 命令会为你处理自适应轮询——无需手动编写 sleep 循环。

配置默认值

如果你经常使用相同的模型、画质或宽高比,可以将它们设置为默认值,这样每次就不需要重复输入标志:

pixverse config defaults set --mode video --model v5.6 --quality 1080p --aspect-ratio 16:9
pixverse config defaults set --mode image --model seedream-5.0-lite --quality 1800p
pixverse config set output-dir ~/Downloads/pixverse

命令行标志始终会覆盖你配置的默认值,因此你在减少重复的同时保留了完全的灵活性。

你可以构建什么

将 PixVerse CLI 集成到你的智能体工作流中后,可自动化的任务范围将大幅扩展:

  • 文档 — 在文档构建过程中自动生成产品演示视频和截图
  • 营销 — 运行夜间批量任务,从单个提示词库生成社交媒体内容变体
  • 应用开发 — 让你的编码智能体在你构建 UI 的同时生成占位符视觉效果、模型动画或加载屏幕视频
  • 内容管道 — 将 CLI 调用与其他工具(ffmpeg、ImageMagick、云存储)串联,构建全自动媒体制作工作流
  • 原型设计 — 在几秒内生成快速动态概念,在投入完整制作之前验证创意

CLI 被设计为能自然融入任何基于 shell 的工作流。如果你现有的自动化运行在 bash、Python、Node 或 CI/CD 管道中,PixVerse CLI 可以无缝接入,无需任何额外的集成开销。

快速上手清单

  • 安装 Node.js 20 或更高版本
  • 运行 npm install -g pixverse
  • 运行 pixverse auth login 并在浏览器中授权
  • 运行 pixverse account info 验证积分
  • 生成你的第一张图像:pixverse create image --prompt "..." --json
  • 生成你的第一个视频:pixverse create video --prompt "..." --json
  • 为你的智能体安装 PixVerse Skills(Claude Code、Cursor 或 Codex)
  • 使用 pixverse config defaults set 设置你偏好的默认值
  • 构建你的第一个自动化管道

下一步

npm 上的 PixVerse CLI(npm install -g pixverse)让你立即访问所有生成功能。PixVerse Skills 仓库 提供了结构化技能文件,教导你的AI智能体如何在任何上下文中正确使用这些功能。

可靠的 CLI 与智能体就绪的技能库的结合,意味着图像和视频生成现在可以与你的代码一起存在于同一个工作流中——由同一个智能体管理,在同一个终端中运行,无需切换工具。

从一条命令开始,逐步构建。