PixVerse CLI: Tạo Video và Hình Ảnh AI cho Developer
Tìm hiểu cách cài PixVerse CLI, tạo hình ảnh và video AI đầu tiên, đồng thời tự động hóa quy trình sáng tạo trong Claude Code, Cursor và các tác nhân AI.
Giới thiệu
Trong mọi quy trình sáng tạo, luôn có một điểm nghẽn — thời điểm bạn phải rời trình soạn thảo code, mở trình duyệt và thao tác thủ công qua giao diện web để tạo một tài nguyên media. Với developer, tác nhân AI và các đội xây dựng pipeline nội dung tự động, việc chuyển ngữ cảnh đó tạo ra ma sát tăng dần rất nhanh.
PixVerse CLI loại bỏ trực tiếp điểm nghẽn này. Đây là giao diện dòng lệnh chính thức của PixVerse, cho phép bạn truy cập toàn bộ model, tính năng và năng lực của nền tảng PixVerse ngay trong terminal. Text-to-video, image-to-video, text-to-image, lip-sync speech, sound effects, upscaling — tất cả đều script được, pipe được, và vận hành mà không cần rời terminal.
PixVerse CLI đặc biệt mạnh ở triết lý thiết kế hướng tác nhân AI: mỗi lệnh trả về JSON có cấu trúc, mã thoát có tính deterministic, và từng bước trong pipeline đều có thể ghép nối linh hoạt. Nhờ đó, bạn có thể huấn luyện Claude Code, Cursor, Codex hoặc bất kỳ tác nhân nào khác tạo ảnh và video thay bạn một cách ổn định.
Bài hướng dẫn này đi từ cài đặt, lần tạo đầu tiên, đến pipeline tự động hóa nhiều bước và workflow agent-native.
Điều kiện trước khi bắt đầu
Trước khi bắt đầu, bạn cần:
- Node.js 20 trở lên — kiểm tra bằng
node --version - Tài khoản PixVerse — đăng ký tại pixverse.ai
- Gói đăng ký PixVerse còn hiệu lực — CLI dùng cùng hệ thống credit với website; chỉ tài khoản đã đăng ký mới tạo được nội dung
PixVerse CLI không yêu cầu sao chép API key thủ công. Xác thực được xử lý qua OAuth trên trình duyệt và token được lưu cục bộ.
Bước 1: Cài đặt CLI
Cài đặt global bằng npm:
npm install -g pixverseXác minh cài đặt:
pixverse --versionNếu không muốn cài global, bạn cũng có thể chạy qua npx:
npx pixverse create video --prompt "A cat walking on Mars"Bước 2: Xác thực
Chạy lệnh đăng nhập:
pixverse auth loginCLI sẽ mở trình duyệt để thực hiện OAuth device authorization. Bạn cũng có thể sao chép URL và hoàn tất xác thực trên bất kỳ trình duyệt nào, phù hợp cho môi trường SSH hoặc headless. Token được lưu tự động trong ~/.pixverse/ và có hiệu lực 30 ngày.
Để kiểm tra trạng thái đăng nhập và số credit khả dụng:
pixverse auth status
pixverse account infoLệnh account info hiển thị cấp gói, credit còn lại và lịch reset credit hàng ngày. Nên kiểm tra số dư trước khi chạy batch job.
Bước 3: Tạo hình ảnh đầu tiên
Text-to-image là cách nhanh nhất để kiểm tra hệ thống. Chạy:
pixverse create image --prompt "A photorealistic forest path at golden hour" --jsonFlag --json trả về output có cấu trúc:
{
"image_id": 789012,
"status": "completed",
"image_url": "https://...",
"prompt": "A photorealistic forest path at golden hour",
"model": "qwen-image",
"width": 1024,
"height": 1024
}Nếu cần độ phân giải cao hơn, chỉ định model hỗ trợ:
pixverse create image \
--prompt "A photorealistic forest path at golden hour" \
--model seedream-5.0-lite \
--quality 1800p \
--aspect-ratio 16:9 \
--jsonPixVerse hỗ trợ nhiều image model, mỗi model có trần độ phân giải và thế mạnh riêng:
| Model | Độ phân giải tối đa | Phù hợp cho |
|---|---|---|
qwen-image | 1080p | Tạo nhanh, nhu cầu phổ thông |
gpt-image-2.0 | 2160p | Output sáng tạo độ phân giải cao đa định dạng |
seedream-5.0-lite | 1800p | Ảnh sáng tạo chi tiết cao |
seedream-4.5 | 2160p | Độ phân giải siêu cao |
gemini-3.1-flash (Nano Banana 2) | 2160p | Dải độ phân giải rộng, tốc độ nhanh |
gemini-3.0 (Nano Banana Pro) | 2160p | Chất lượng cao ở quy mô lớn |
gemini-2.5-flash (Nano Banana) | 1080p | Nhẹ, thời gian phản hồi nhanh |
kling-image-o3 | 2160p | Phong cách hình ảnh đặc trưng, khung hình linh hoạt |
kling-image-v3 | 1440p | Cân bằng chất lượng và tốc độ |
Tải ảnh đã tạo:
pixverse asset download 789012Bước 4: Tạo video đầu tiên
Text-to-video hoạt động tương tự. Tạo clip 5 giây:
pixverse create video --prompt "A sunset over ocean waves" --jsonĐể tạo video tùy chỉnh đầy đủ:
pixverse create video \
--prompt "A cinematic drone shot over a misty mountain valley at dawn" \
--model v6 \
--quality 1080p \
--aspect-ratio 16:9 \
--duration 8 \
--audio \
--jsonFlag --audio bật âm thanh ambient do AI tạo phù hợp với nội dung video. Flag --json trả về video_url khi hoàn tất để bạn chuyển tiếp sang bước tải xuống hoặc bước tiếp theo trong pipeline.
PixVerse cung cấp nhiều video model với năng lực khác nhau:
| Model | Chất lượng tối đa | Khoảng thời lượng | Ghi chú |
|---|---|---|---|
v6 | 1080p | 1–15 sec | Model mặc định của PixVerse, hỗ trợ tỷ lệ khung hình đa dạng |
pixverse-c1 | 1080p | 1–15 sec | Hỗ trợ tốt cho workflow video và reference |
v5.6 | 1080p | 1–10 sec | Hỗ trợ chế độ tạo motion-control |
veo-3.1-standard | 2160p | 4, 6, 8 sec | Hỗ trợ cả workflow video và transition |
grok-imagine | 720p | 1–15 sec | Hỗ trợ create video, extend và reference |
sora-2-pro | 1080p | 4, 8, 12 sec | Chất lượng cao với tùy chọn thời lượng cố định |
Tạo chuyển động cho ảnh tĩnh
Để chuyển ảnh chụp hoặc ảnh đã tạo thành video, dùng flag --image:
pixverse create video \
--prompt "Gentle wind moves through the scene" \
--image ./product-photo.jpg \
--model v6 \
--quality 1080p \
--jsonBạn có thể truyền đường dẫn file local hoặc URL. File local sẽ được upload tự động, không cần bước upload thủ công.
Bước 5: Chạy Interactive Wizard
Nếu bạn mới làm quen và chưa thuộc các flag có sẵn, hãy chạy lệnh tạo không kèm tham số để vào wizard hướng dẫn:
pixverse create video
pixverse create imageWizard sẽ hướng dẫn từng bước từ prompt, chọn model, chất lượng, tỷ lệ khung hình, thời lượng và các tùy chọn khác — phù hợp để khám phá tham số trước khi script hóa.
Vượt ra ngoài tạo nội dung: Quản lý tài nguyên và workspace
PixVerse CLI bản mới còn có các lệnh quản trị để bạn xây dựng workflow end-to-end ngay trên terminal:
pixverse task status <id>vàpixverse task wait <id>để polling trạng thái jobpixverse asset list|upload|info|download|deleteđể quản lý vòng đời assetpixverse saved list|items|new|rename|add|remove|deleteđể quản lý thư mục lưupixverse workspace list|status|switch|manageđể vận hành nhiều workspace
Điều này giúp bạn tự động hóa không chỉ khâu tạo mà cả tổ chức, tải xuống và bàn giao trong cùng một script.
Hướng dẫn tác nhân AI tạo media
Đây là điểm PixVerse CLI tạo khác biệt thực tế. Vì mỗi lệnh trả về JSON có cấu trúc và dùng mã thoát deterministic, bất kỳ tác nhân AI nào chạy được lệnh shell đều có thể học để tạo ảnh và video theo yêu cầu.
Cài PixVerse Skills
PixVerse Skills là thư viện skill có cấu trúc, hướng dẫn tác nhân dùng CLI chính xác: flag lệnh, ràng buộc model, pipeline nhiều bước và xử lý lỗi đáng tin cậy.
Với Claude Code và các tác nhân hỗ trợ format skills, thêm PixVerse skills trực tiếp:
npx skills add https://github.com/pixverseai/skills --skill pixverse-ai-image-and-video-generatorVới Cursor, Claude Code, Codex và các framework tác nhân khác, skill này tăng độ ổn định vì tác nhân có ràng buộc rõ ràng thay vì phải tự suy luận từ đầu.
Sau khi tác nhân đã nạp PixVerse skills, bạn có thể giao các chỉ dẫn ngôn ngữ tự nhiên như:
- “Generate a 10-second product demo video from this screenshot”
- “Create four variations of this blog cover image in 16:9 format”
- “Animate this diagram into a 5-second explainer clip with ambient sound”
- “Generate three 8-second 16:9 promo clips with different camera motions”
Tác nhân sẽ chuyển các chỉ dẫn này thành lệnh CLI chính xác, phân tích JSON output và tự xử lý polling cùng tải xuống.
Claude Code
Trong Claude Code, PixVerse CLI trở thành công cụ native mà tác nhân có thể dùng tự động. Sau khi nạp PixVerse skills, bạn có thể tích hợp tạo media vào mọi tác vụ:
Generate a cover image for this blog post about machine learning,
use the seedream-5.0-lite model at 1800p in 16:9 format,
download it to ./assets/cover.webp
Claude Code sẽ gọi đúng lệnh CLI, trích xuất image URL từ JSON response và tải file về đúng đường dẫn chỉ định — ngay trong cùng phiên đang viết code.
Một workflow Claude Code điển hình:
# Claude Code runs this autonomously based on your instruction
IMG=$(pixverse create image \
--prompt "Abstract visualization of neural network layers, dark background, blue and purple tones" \
--model seedream-5.0-lite \
--quality 1800p \
--aspect-ratio 16:9 \
--json | jq -r '.image_url')
# Then animates it
pixverse create video \
--prompt "Slow pan across glowing neural connections" \
--image "$IMG" \
--model v6 \
--quality 1080p \
--duration 6 \
--jsonCursor
Người dùng Cursor có thể nạp PixVerse Skills như file ngữ cảnh dự án. Đặt các file skill liên quan vào .cursor/ hoặc thêm vào workspace rules. Khi đã nạp, Cursor có nhận thức đầy đủ về lệnh PixVerse CLI và có thể tạo media như một phần của mọi tác vụ coding.
Một workflow phổ biến trên Cursor là yêu cầu tác nhân tạo ảnh mockup theo thiết kế đang phát triển, rồi dùng trực tiếp làm tham chiếu trong IDE mà không cần rời editor.
Codex và các tác nhân khác
PixVerse CLI tương thích với mọi tác nhân có thể thực thi lệnh shell và parse JSON. Định dạng output có cấu trúc — tên trường nhất quán, mã lỗi dễ dự đoán, thông báo lỗi tách riêng qua stderr — giúp ngay cả tác nhân script đơn giản cũng tích hợp ổn định.
Hợp đồng exit code giúp xử lý lỗi rõ ràng:
| Code | Meaning | Agent Action |
|---|---|---|
| 1 | General error | Check stderr and retry with validated inputs |
| 0 | Success | Parse JSON output |
| 2 | Timeout | Retry with longer --timeout |
| 3 | Auth expired | Re-run pixverse auth login |
| 4 | Out of credits | Check balance, notify user |
| 5 | Generation failed | Try different parameters |
| 6 | Validation error | Review flag values |
Automation Pipelines
Khi đã nắm các lệnh riêng lẻ, PixVerse CLI mở ra các workflow nhiều bước mạnh mẽ, chạy hoàn toàn không cần tương tác thủ công.
Text to Image to Video
Một pipeline hữu ích nhất: tạo ảnh độ phân giải cao từ text prompt rồi animate thành video.
# Step 1: Generate a base image
IMG_RESULT=$(pixverse create image \
--prompt "A cyberpunk cityscape at night, neon lights reflecting on wet pavement" \
--model gemini-3.1-flash \
--quality 2160p \
--aspect-ratio 16:9 \
--json)
IMAGE_URL=$(echo "$IMG_RESULT" | jq -r '.image_url')
# Step 2: Animate it into a video
VID_RESULT=$(pixverse create video \
--prompt "Camera slowly pans across the neon-lit streets" \
--image "$IMAGE_URL" \
--model v6 \
--quality 1080p \
--duration 8 \
--json)
VIDEO_ID=$(echo "$VID_RESULT" | jq -r '.video_id')
# Step 3: Download the final video
pixverse asset download "$VIDEO_ID" --jsonFull Video Production Pipeline
Để có output hoàn thiện hơn, hãy nối bước tạo với các bước hậu kỳ:
# Step 1: Create the base video
RESULT=$(pixverse create video \
--prompt "A product being assembled in slow motion" \
--model v6 \
--quality 720p \
--duration 5 \
--json)
VID=$(echo "$RESULT" | jq -r '.video_id')
# Step 2: Extend duration
EXTENDED=$(pixverse create extend \
--video "$VID" \
--prompt "Continue the assembly sequence" \
--duration 5 \
--json | jq -r '.video_id')
pixverse task wait "$EXTENDED" --json
# Step 3: Add ambient sound
WITH_SOUND=$(pixverse create sound \
--video "$EXTENDED" \
--prompt "Industrial workshop ambience, soft mechanical sounds" \
--json | jq -r '.video_id')
pixverse task wait "$WITH_SOUND" --json
# Step 4: Upscale to 1080p
FINAL=$(pixverse create upscale \
--video "$WITH_SOUND" \
--quality 1080p \
--json | jq -r '.video_id')
pixverse task wait "$FINAL" --json
# Step 5: Download
pixverse asset download "$FINAL" --jsonBatch Generation
Với pipeline nội dung cần nhiều biến thể, hãy chạy job song song:
# Check credits first
CREDITS=$(pixverse account info --json | jq -r '.credits.total')
echo "Available credits: $CREDITS"
# Submit four parallel generations
pixverse create video --prompt "Sunrise over mountains" --no-wait --json > /tmp/v1.json &
pixverse create video --prompt "Sunset over ocean" --no-wait --json > /tmp/v2.json &
pixverse create video --prompt "Stars over a desert" --no-wait --json > /tmp/v3.json &
pixverse create video --prompt "Aurora over a frozen lake" --no-wait --json > /tmp/v4.json &
wait
# Wait for each and download
for f in /tmp/v1.json /tmp/v2.json /tmp/v3.json /tmp/v4.json; do
ID=$(jq -r '.video_id' "$f")
pixverse task wait "$ID" --json
pixverse asset download "$ID" --json
doneFlag --no-wait gửi job và trả về ngay task ID, cho phép gửi nhiều job trước khi polling. Lệnh pixverse task wait tự xử lý adaptive polling, không cần sleep loop thủ công.
Cấu hình mặc định
Nếu thường xuyên dùng cùng model, quality hoặc aspect ratio, bạn có thể đặt default để không phải lặp flag:
pixverse config defaults set video model v6
pixverse config defaults set video quality 1080p
pixverse config defaults set image model seedream-5.0-lite
pixverse config set output-dir ~/Downloads/pixverse
pixverse config defaults showFlag trên command line luôn ghi đè default đã cấu hình, nên bạn vẫn giữ được toàn bộ tính linh hoạt.
Những gì bạn có thể xây dựng
Khi tích hợp PixVerse CLI vào workflow tác nhân, phạm vi tác vụ tự động hóa mở rộng đáng kể:
- Documentation — tự động tạo video demo sản phẩm và ảnh chụp màn hình trong quy trình build tài liệu
- Marketing — chạy batch job hàng đêm để tạo nhiều biến thể nội dung mạng xã hội từ một thư viện prompt
- App development — để coding agent tạo placeholder visuals, mockup animations hoặc loading screen videos trong lúc bạn phát triển UI
- Content pipelines — kết hợp lệnh CLI với ffmpeg, ImageMagick, cloud storage để xây workflow sản xuất media tự động hoàn chỉnh
- Prototyping — tạo nhanh ý tưởng chuyển động trong vài giây để kiểm chứng trước khi đầu tư sản xuất đầy đủ
CLI được thiết kế để hòa nhập tự nhiên vào mọi workflow dựa trên shell. Nếu hệ thống tự động hiện có của bạn chạy bằng bash, Python, Node hoặc CI/CD pipeline, PixVerse CLI tích hợp ngay mà không cần overhead đáng kể.
Checklist bắt đầu
- Cài Node.js 20 trở lên
- Chạy
npm install -g pixverse - Chạy
pixverse auth loginvà xác thực trong trình duyệt - Chạy
pixverse account infođể kiểm tra credit - Tạo hình ảnh đầu tiên:
pixverse create image --prompt "..." --json - Tạo video đầu tiên:
pixverse create video --prompt "..." --json - Cài PixVerse Skills cho tác nhân (Claude Code, Cursor hoặc Codex)
- Thiết lập default ưa dùng với
pixverse config defaults set - Xây pipeline tự động hóa đầu tiên
Cập nhật CLI thường xuyên
Dùng npm để cập nhật CLI cục bộ:
npm update -g pixverseĐể theo dõi thay đổi theo từng bản phát hành và model mới được hỗ trợ, xem changelog chính thức:
Bước tiếp theo
PixVerse CLI trên npm (npm install -g pixverse) cho phép bạn truy cập ngay vào tạo nội dung, polling task, quản lý asset, thư mục lưu và workspace controls từ một giao diện thống nhất. PixVerse Skills repository bổ sung hướng dẫn sẵn sàng cho tác nhân để Claude Code, Cursor, Codex và các công cụ khác vận hành workflow này ổn định hơn.
Sự kết hợp giữa CLI đáng tin cậy và thư viện skill tối ưu cho tác nhân giúp việc tạo hình ảnh, video nằm trong cùng workflow với code — cùng tác nhân, cùng terminal, không cần chuyển công cụ.
Bắt đầu bằng một lệnh, rồi mở rộng dần từ đó.