PixVerse CLI: Tạo Video và Hình Ảnh AI cho Nhà Phát Triển

Hướng dẫn cài đặt PixVerse CLI, tạo hình ảnh và video AI đầu tiên, và tự động hóa quy trình sáng tạo trong Claude Code, Cursor và các tác nhân AI.

Product Update
PixVerse CLI: Tạo Video và Hình Ảnh AI cho Nhà Phát Triển

PixVerse CLI: Tạo Video và Hình Ảnh AI cho Nhà Phát Triển

Giới Thiệu

Mọi quy trình sáng tạo đều có điểm nghẽn cổ chai — khoảnh khắc bạn phải rời khỏi trình soạn thảo code, mở trình duyệt, và thao tác thủ công qua giao diện web để tạo ra một tệp media. Đối với các nhà phát triển, tác nhân AI, và bất kỳ ai xây dựng pipeline nội dung tự động, việc chuyển đổi ngữ cảnh như vậy tích lũy thành lực cản đáng kể theo thời gian.

PixVerse CLI loại bỏ điểm nghẽn đó. Đây là giao diện dòng lệnh chính thức của PixVerse, mang đến cho bạn quyền truy cập vào mọi mô hình, mọi tính năng và mọi khả năng từ nền tảng PixVerse — trực tiếp từ terminal. Chuyển văn bản thành video, hình ảnh thành video, văn bản thành hình ảnh, đồng bộ môi lip sync, hiệu ứng âm thanh, nâng cấp độ phân giải — tất cả đều có thể viết script, kết nối pipeline, và sử dụng mà không cần mở trình duyệt.

Điều làm cho PixVerse CLI đặc biệt mạnh mẽ là triết lý thiết kế của nó: được xây dựng với các tác nhân AI trong tâm trí. Mỗi lệnh xuất ra JSON có cấu trúc, mỗi mã thoát đều xác định, và mỗi bước trong pipeline đều có thể kết hợp. Điều này có nghĩa là bạn có thể hướng dẫn Claude Code, Cursor, Codex, hoặc bất kỳ tác nhân nào khác tạo hình ảnh và video thay mặt bạn — và chúng sẽ thực hiện đúng, mọi lần.

Hướng dẫn này đưa bạn qua hành trình hoàn chỉnh: từ cài đặt đến lần tạo đầu tiên, sau đó vào các pipeline tự động hóa nhiều bước và quy trình làm việc thân thiện với tác nhân.

Yêu Cầu Trước Khi Bắt Đầu

Trước khi bắt đầu, bạn cần:

  • Node.js 20 hoặc cao hơn — kiểm tra bằng node --version
  • Tài khoản PixVerse — đăng ký tại pixverse.ai
  • Gói đăng ký PixVerse đang hoạt động — CLI sử dụng cùng hệ thống credit như trang web; chỉ người dùng đã đăng ký mới có thể tạo nội dung

PixVerse CLI không yêu cầu sao chép thủ công bất kỳ API key nào. Xác thực được xử lý thông qua luồng OAuth dựa trên trình duyệt, lưu trữ token của bạn cục bộ.

Bước 1: Cài Đặt CLI

Cài đặt toàn cục với npm:

npm install -g pixverse

Xác minh cài đặt:

pixverse --version

Nếu bạn không muốn cài đặt toàn cục, bạn cũng có thể chạy lệnh qua npx:

npx pixverse create video --prompt "Một con mèo đi bộ trên sao Hỏa"

Bước 2: Xác Thực

Chạy lệnh đăng nhập:

pixverse auth login

CLI sẽ in một URL ngắn và một mã. Mở URL trong trình duyệt của bạn, nhập mã, và cấp quyền với tài khoản PixVerse của bạn. Token của bạn được lưu trữ tự động trong ~/.pixverse/ và có hiệu lực trong 30 ngày.

Để xác minh bạn đã đăng nhập và kiểm tra credit khả dụng:

pixverse auth status
pixverse account info

Lệnh account info hiển thị bậc đăng ký của bạn, credit còn lại, và lịch đặt lại credit hàng ngày. Luôn kiểm tra số dư của bạn trước khi chạy các công việc theo lô.

Bước 3: Tạo Hình Ảnh Đầu Tiên

Tạo hình ảnh từ văn bản là cách nhanh nhất để kiểm tra thiết lập của bạn. Chạy:

pixverse create image --prompt "Một con đường rừng siêu thực tế vào giờ vàng" --json

Cờ --json trả về kết quả có cấu trúc:

{
  "image_id": 789012,
  "status": "completed",
  "image_url": "https://...",
  "prompt": "A photorealistic forest path at golden hour",
  "model": "qwen-image",
  "width": 1024,
  "height": 1024
}

Để có đầu ra độ phân giải cao hơn, hãy chỉ định một mô hình hỗ trợ nó:

pixverse create image \
  --prompt "Một con đường rừng siêu thực tế vào giờ vàng" \
  --model seedream-5.0-lite \
  --quality 1800p \
  --aspect-ratio 16:9 \
  --json

PixVerse hỗ trợ nhiều mô hình hình ảnh, mỗi mô hình có giới hạn độ phân giải và thế mạnh khác nhau:

Mô hìnhĐộ phân giải tối đaPhù hợp nhất cho
qwen-image1080pTạo nhanh, sử dụng chung
seedream-5.0-lite1800pHình ảnh sáng tạo chi tiết cao
seedream-4.52160pĐộ phân giải cực cao
gemini-3.1-flash (Nano Banana 2)2160pDải độ phân giải rộng, nhanh
gemini-3.0 (Nano Banana Pro)2160pChất lượng cao ở quy mô lớn
gemini-2.5-flash (Nano Banana)1080pNhẹ, xử lý nhanh

Để tải xuống hình ảnh đã tạo:

pixverse asset download 789012

Bước 4: Tạo Video Đầu Tiên

Tạo video từ văn bản hoạt động tương tự. Tạo một clip 5 giây:

pixverse create video --prompt "Hoàng hôn trên những con sóng đại dương" --json

Để tạo tùy chỉnh hoàn toàn:

pixverse create video \
  --prompt "Cảnh quay máy bay không người lái điện ảnh trên một thung lũng núi sương mù vào lúc bình minh" \
  --model v5.6 \
  --quality 1080p \
  --aspect-ratio 16:9 \
  --duration 8 \
  --audio \
  --json

Cờ --audio kích hoạt âm thanh xung quanh được tạo bởi AI phù hợp với nội dung video của bạn. Cờ --json trả về video_url khi hoàn thành, bạn có thể chuyển trực tiếp đến lệnh tải xuống hoặc bước tiếp theo trong pipeline.

PixVerse cung cấp nhiều mô hình video với các khả năng khác nhau:

Mô hìnhChất lượng tối đaKhoảng thời lượngGhi chú
v5.61080p1–10 giâyLinh hoạt nhất; khoảng thời lượng rộng nhất
sora-2-pro1080p4, 8, 12 giâyĐầu ra điện ảnh chất lượng cao
veo-3.1-standard1080p4, 6, 8 giâyHỗ trợ chế độ Transition
grok-imagine720p1–15 giâyThời lượng tối đa dài nhất

Tạo Hoạt Ảnh Từ Hình Ảnh Tĩnh

Để chuyển đổi ảnh hoặc hình ảnh đã tạo thành video, hãy cung cấp cờ --image:

pixverse create video \
  --prompt "Gió nhẹ thổi qua khung cảnh" \
  --image ./product-photo.jpg \
  --model v5.6 \
  --quality 1080p \
  --json

Bạn có thể truyền đường dẫn tệp cục bộ hoặc URL. Các tệp cục bộ được tải lên tự động — không cần bước tải lên thủ công.

Bước 5: Chạy Trình Hướng Dẫn Tương Tác

Nếu bạn đang khám phá lần đầu và chưa quen với tất cả các cờ có sẵn, hãy chạy bất kỳ lệnh tạo nào mà không có đối số để vào trình hướng dẫn có hướng dẫn:

pixverse create video
pixverse create image

Trình hướng dẫn dẫn bạn qua prompt, chọn mô hình, chất lượng, tỷ lệ khung hình, thời lượng, và các tùy chọn khác từng bước — hữu ích để khám phá các tham số có sẵn trước khi viết script.

Hướng Dẫn Tác Nhân AI Tạo Media

Đây là nơi PixVerse CLI trở nên thực sự mang tính biến đổi. Vì mỗi lệnh trả về JSON có cấu trúc và sử dụng mã thoát xác định, bất kỳ tác nhân AI nào có thể chạy lệnh shell đều có thể được hướng dẫn tạo hình ảnh và video theo yêu cầu.

Cài Đặt PixVerse Skills

PixVerse Skills là một thư viện các tệp skill có cấu trúc hướng dẫn các tác nhân chính xác cách sử dụng CLI: các cờ mà mỗi lệnh chấp nhận, các mô hình hỗ trợ tham số nào, cách kết nối các lệnh thành pipeline, và cách xử lý lỗi.

Đối với Claude Code và các tác nhân khác hỗ trợ định dạng skills, hãy thêm trực tiếp PixVerse skills:

npx skills add https://github.com/pixverseai/skills --skill pixverse-ai-image-and-video-generator

Đối với Cursor, các skill nằm trong thư mục skills/ trong kho GitHub PixVerse Skills và có thể được tải trực tiếp như ngữ cảnh vào trình soạn thảo của bạn. Đối với Codex và các tác nhân dựa trên LangChain, mỗi tệp skill là markdown tự chứa có thể được đưa vào system prompt của tác nhân.

Sau khi tác nhân của bạn đã tải PixVerse skills, bạn có thể đưa ra hướng dẫn bằng ngôn ngữ tự nhiên như:

  • “Tạo video demo sản phẩm 10 giây từ ảnh chụp màn hình này”
  • “Tạo bốn biến thể của hình ảnh bìa blog này ở định dạng 16:9”
  • “Tạo hoạt ảnh từ sơ đồ này thành clip giải thích 5 giây với âm thanh xung quanh”

Tác nhân sẽ dịch các hướng dẫn đó thành các lệnh CLI đúng, phân tích đầu ra JSON, và xử lý việc polling và tải xuống — không cần can thiệp thủ công.

Claude Code

Trong Claude Code, PixVerse CLI trở thành công cụ gốc mà tác nhân sử dụng tự chủ. Sau khi tải PixVerse skills, bạn có thể đưa việc tạo media trực tiếp vào bất kỳ tác vụ nào:

Tạo hình ảnh bìa cho bài đăng blog về machine learning này,
sử dụng mô hình seedream-5.0-lite ở 1800p theo định dạng 16:9,
tải xuống vào ./assets/cover.webp

Claude Code sẽ gọi các lệnh CLI đúng, phân tích URL hình ảnh từ phản hồi JSON, và tải tệp xuống đường dẫn bạn đã chỉ định — tất cả trong cùng phiên làm việc nơi nó cũng đang viết code của bạn.

Một quy trình làm việc điển hình của Claude Code:

# Claude Code chạy lệnh này tự chủ dựa trên hướng dẫn của bạn
IMG=$(pixverse create image \
  --prompt "Hình ảnh trừu tượng của các lớp mạng nơ-ron, nền tối, tông màu xanh dương và tím" \
  --model seedream-5.0-lite \
  --quality 1800p \
  --aspect-ratio 16:9 \
  --json | jq -r '.image_url')
 
# Sau đó tạo hoạt ảnh từ hình ảnh đó
pixverse create video \
  --prompt "Quay chậm qua các kết nối nơ-ron phát sáng" \
  --image "$IMG" \
  --model v5.6 \
  --quality 1080p \
  --duration 6 \
  --json

Cursor

Người dùng Cursor có thể tải PixVerse Skills như một tệp ngữ cảnh dự án. Đặt các tệp skill liên quan vào thư mục .cursor/ của bạn hoặc thêm chúng vào quy tắc workspace. Sau khi tải, Cursor có đầy đủ nhận thức về mọi lệnh PixVerse CLI và có thể tạo media như một phần của bất kỳ tác vụ coding nào.

Một quy trình làm việc Cursor phổ biến: yêu cầu tác nhân tạo hình ảnh mockup dựa trên thiết kế bạn đang xây dựng, sau đó sử dụng nó làm tài liệu tham khảo trực tiếp trong phiên IDE của bạn — mà không cần rời khỏi trình soạn thảo.

Codex và Các Tác Nhân Khác

PixVerse CLI tương thích với bất kỳ tác nhân nào có thể thực thi lệnh shell và phân tích JSON. Định dạng đầu ra có cấu trúc — tên trường nhất quán, mã lỗi có thể dự đoán, và thông báo lỗi được tách riêng qua stderr — đảm bảo rằng ngay cả các tác nhân scripting đơn giản cũng có thể tích hợp việc tạo một cách đáng tin cậy.

Hợp đồng mã thoát giúp việc xử lý lỗi trở nên đơn giản:

Ý nghĩaHành động của tác nhân
0Thành côngPhân tích đầu ra JSON
2Hết thời gianThử lại với --timeout dài hơn
3Xác thực hết hạnChạy lại pixverse auth login
4Hết creditKiểm tra số dư, thông báo người dùng
5Tạo thất bạiThử các tham số khác
6Lỗi xác thựcXem lại giá trị cờ

Pipeline Tự Động Hóa

Khi bạn hiểu các lệnh riêng lẻ, PixVerse CLI mở ra các quy trình làm việc nhiều bước mạnh mẽ chạy hoàn toàn mà không cần tương tác của người dùng.

Văn Bản thành Hình Ảnh thành Video

Một trong những pipeline hữu ích nhất: tạo hình ảnh độ phân giải cao từ prompt văn bản, sau đó tạo hoạt ảnh thành video.

# Bước 1: Tạo hình ảnh gốc
IMG_RESULT=$(pixverse create image \
  --prompt "Cảnh quan thành phố cyberpunk vào ban đêm, đèn neon phản chiếu trên mặt đường ướt" \
  --model gemini-3.1-flash \
  --quality 2160p \
  --aspect-ratio 16:9 \
  --json)
 
IMAGE_URL=$(echo "$IMG_RESULT" | jq -r '.image_url')
 
# Bước 2: Tạo hoạt ảnh thành video
VID_RESULT=$(pixverse create video \
  --prompt "Máy quay từ từ lia qua những con phố được thắp sáng bằng đèn neon" \
  --image "$IMAGE_URL" \
  --model v5.6 \
  --quality 1080p \
  --duration 8 \
  --json)
 
VIDEO_ID=$(echo "$VID_RESULT" | jq -r '.video_id')
 
# Bước 3: Tải xuống video cuối cùng
pixverse asset download "$VIDEO_ID" --json

Pipeline Sản Xuất Video Hoàn Chỉnh

Để có đầu ra hoàn chỉnh, hãy kết nối việc tạo với các bước hậu xử lý:

# Bước 1: Tạo video gốc
RESULT=$(pixverse create video \
  --prompt "Một sản phẩm được lắp ráp ở chuyển động chậm" \
  --model v5.6 \
  --quality 720p \
  --duration 5 \
  --json)
 
VID=$(echo "$RESULT" | jq -r '.video_id')
 
# Bước 2: Kéo dài thời lượng
EXTENDED=$(pixverse create extend \
  --video "$VID" \
  --prompt "Tiếp tục trình tự lắp ráp" \
  --duration 5 \
  --json | jq -r '.video_id')
 
pixverse task wait "$EXTENDED" --json
 
# Bước 3: Thêm âm thanh xung quanh
WITH_SOUND=$(pixverse create sound \
  --video "$EXTENDED" \
  --prompt "Không khí xưởng công nghiệp, âm thanh cơ học nhẹ nhàng" \
  --json | jq -r '.video_id')
 
pixverse task wait "$WITH_SOUND" --json
 
# Bước 4: Nâng cấp lên 1080p
FINAL=$(pixverse create upscale \
  --video "$WITH_SOUND" \
  --quality 1080p \
  --json | jq -r '.video_id')
 
pixverse task wait "$FINAL" --json
 
# Bước 5: Tải xuống
pixverse asset download "$FINAL" --json

Tạo Hàng Loạt

Đối với các pipeline nội dung yêu cầu nhiều biến thể, hãy chạy các công việc song song:

# Kiểm tra credit trước
CREDITS=$(pixverse account info --json | jq -r '.credits.total')
echo "Credit khả dụng: $CREDITS"
 
# Gửi bốn lần tạo song song
pixverse create video --prompt "Bình minh trên núi" --no-wait --json > /tmp/v1.json &
pixverse create video --prompt "Hoàng hôn trên đại dương" --no-wait --json > /tmp/v2.json &
pixverse create video --prompt "Bầu sao trên sa mạc" --no-wait --json > /tmp/v3.json &
pixverse create video --prompt "Cực quang trên hồ băng" --no-wait --json > /tmp/v4.json &
wait
 
# Chờ từng cái và tải xuống
for f in /tmp/v1.json /tmp/v2.json /tmp/v3.json /tmp/v4.json; do
  ID=$(jq -r '.video_id' "$f")
  pixverse task wait "$ID" --json
  pixverse asset download "$ID" --json
done

Cờ --no-wait gửi công việc và trả về ngay lập tức với task ID, cho phép bạn gửi nhiều công việc trước khi polling. Lệnh pixverse task wait xử lý việc polling thích ứng cho bạn — không cần vòng lặp sleep thủ công.

Cấu Hình Mặc Định

Nếu bạn luôn sử dụng cùng mô hình, chất lượng, hoặc tỷ lệ khung hình, hãy đặt chúng làm mặc định để không phải lặp lại cờ mỗi lần:

pixverse config defaults set --mode video --model v5.6 --quality 1080p --aspect-ratio 16:9
pixverse config defaults set --mode image --model seedream-5.0-lite --quality 1800p
pixverse config set output-dir ~/Downloads/pixverse

Các cờ dòng lệnh luôn ghi đè các mặc định được cấu hình của bạn, vì vậy bạn vẫn giữ được tính linh hoạt đầy đủ trong khi giảm sự lặp lại.

Những Gì Bạn Có Thể Xây Dựng

Với PixVerse CLI được tích hợp vào quy trình làm việc tác nhân của bạn, phạm vi các tác vụ có thể tự động hóa mở rộng đáng kể:

  • Tài liệu — tự động tạo video demo sản phẩm và ảnh chụp màn hình như một phần của quy trình xây dựng tài liệu
  • Marketing — chạy các công việc theo lô hàng đêm tạo ra các biến thể nội dung mạng xã hội từ một thư viện prompt duy nhất
  • Phát triển ứng dụng — để tác nhân coding của bạn tạo hình ảnh placeholder, hoạt ảnh mockup, hoặc video màn hình loading trong khi bạn xây dựng UI
  • Pipeline nội dung — kết nối các lệnh CLI với các công cụ khác (ffmpeg, ImageMagick, cloud storage) để xây dựng quy trình sản xuất media hoàn toàn tự động
  • Tạo nguyên mẫu — tạo nhanh các khái niệm chuyển động trong vài giây để xác thực ý tưởng trước khi cam kết vào sản xuất đầy đủ

CLI được thiết kế để phù hợp tự nhiên với bất kỳ quy trình làm việc dựa trên shell nào. Nếu tự động hóa hiện tại của bạn chạy trong bash, Python, Node, hoặc pipeline CI/CD, PixVerse CLI tích hợp vào mà không cần thêm chi phí tích hợp.

Danh Sách Kiểm Tra Bắt Đầu

  • Cài đặt Node.js 20 hoặc cao hơn
  • Chạy npm install -g pixverse
  • Chạy pixverse auth login và cấp quyền trong trình duyệt
  • Chạy pixverse account info để xác minh credit
  • Tạo hình ảnh đầu tiên: pixverse create image --prompt "..." --json
  • Tạo video đầu tiên: pixverse create video --prompt "..." --json
  • Cài đặt PixVerse Skills cho tác nhân của bạn (Claude Code, Cursor, hoặc Codex)
  • Thiết lập các mặc định ưa thích với pixverse config defaults set
  • Xây dựng pipeline tự động hóa đầu tiên của bạn

Các Bước Tiếp Theo

PixVerse CLI trên npm (npm install -g pixverse) cho phép bạn truy cập ngay lập tức vào tất cả các khả năng tạo. Kho PixVerse Skills cung cấp các tệp skill có cấu trúc hướng dẫn tác nhân AI của bạn cách sử dụng các khả năng đó đúng cách trong bất kỳ ngữ cảnh nào.

Sự kết hợp của một CLI đáng tin cậy và thư viện skill sẵn sàng cho tác nhân có nghĩa là việc tạo hình ảnh và video giờ đây có thể nằm trong cùng quy trình làm việc như code của bạn — được quản lý bởi cùng một tác nhân, trong cùng một terminal, mà không cần chuyển đổi công cụ.

Bắt đầu với một lệnh duy nhất. Xây dựng từ đó.