PixVerse CLI: tạo video và hình ảnh AI trong terminal

Cài PixVerse CLI để tạo video, hình ảnh, giọng nói và nhạc AI trong terminal, đồng thời tự động hóa workflow agent bằng JSON.

Product Update
PixVerse CLI: tạo video và hình ảnh AI trong terminal

Giới thiệu

Mọi quy trình làm việc sáng tạo đều có một nút thắt cổ chai - thời điểm bạn phải rời khỏi trình soạn thảo mã của mình, mở trình duyệt và nhấp qua giao diện web theo cách thủ công để tạo một phần phương tiện. Đối với các nhà phát triển, AI agent và bất kỳ ai xây dựng quy trình nội dung tự động, việc chuyển đổi ngữ cảnh đó là trở ngại tăng lên nhanh chóng.

PixVerse CLIloại bỏ nút thắt cổ chai đó. Đây là giao diện dòng lệnh chính thức cho PixVerse, cho phép bạn truy cập vào quy trình làm việc và tạo PixVerse trực tiếp từ thiết bị đầu cuối của bạn. Chuyển văn bản thành video, hình ảnh thành video, văn bản thành hình ảnh, hình ảnh thành hình ảnh, chuyển tiếp, tạo giọng nói, tạo nhạc, video tham chiếu, điều khiển chuyển động, mẫu, nâng cấp và quản lý tài sản đều có thể viết được, có thể điều chỉnh được và có sẵn mà không cần chạm vào trình duyệt.

Điều khiến PixVerse CLI đặc biệt hữu ích là triết lý thiết kế của nó: nó được xây dựng với các tác nhân AI. Các lệnh có thể trả về JSON có cấu trúc với --json hoặc -p, mã thoát có tính xác định và mọi bước quy trình đều có thể kết hợp được. Điều này có nghĩa là bạn có thể hướng dẫn Claude Code, Cursor, Codex hoặc bất kỳ tác nhân nào khác thay mặt bạn tạo hình ảnh, video, giọng nói và âm nhạc với ít chuyển giao dễ hỏng hơn.

Hướng dẫn này phù hợp với PixVerseAI/cli GitHub README hiện tại và tệp kê khai khả năng công khai của nó, được kiểm tra vào ngày 29 tháng 6 năm 2026. Tính khả dụng của mô hình, mô hình mặc định và cờ lệnh có thể thay đổi nhanh hơn so với hướng dẫn thường xanh, vì vậy, tập lệnh sản xuất vẫn phải xác minh pixverse --version, pixverse create <mode> --helppixverse update trước khi chạy một đợt lớn.

Điều kiện tiên quyết

Trước khi bắt đầu, bạn cần:

  • Node.js 20 trở lên— kiểm tra với node --version
  • Tài khoản PixVerse— đăng ký tại pixverse.ai
  • Đăng ký PixVerse đang hoạt động— CLI sử dụng hệ thống tín dụng giống như trang web; chỉ người dùng đã đăng ký mới có thể tạo nội dung

PixVerse CLI không yêu cầu sao chép thủ công bất kỳ khóa API nào. Xác thực được xử lý thông qua luồng OAuth dựa trên trình duyệt lưu trữ mã thông báo của bạn cục bộ.

Bước 1: Cài đặt CLI

Cài đặt toàn cầu với npm:

npm install -g pixverse

Xác minh cài đặt:

pixverse --version

Nếu bạn không muốn cài đặt trên toàn cầu, bạn cũng có thể chạy lệnh qua npx:

npx pixverse create video --prompt "A cat walking on Mars"

Bước 2: Xác thực

Chạy lệnh đăng nhập:

pixverse auth login

CLI mở trình duyệt để ủy quyền thiết bị OAuth. Bạn cũng có thể sao chép URL và hoàn tất ủy quyền từ bất kỳ trình duyệt nào trên bất kỳ thiết bị nào, điều này rất hữu ích cho môi trường SSH và không có giao diện người dùng. Mã thông báo của bạn được lưu trữ tự động trong ~/.pixverse/ và có giá trị trong 30 ngày.

Để xác minh bạn đã đăng nhập và kiểm tra số điểm hiện có của mình:

pixverse auth status pixverse account info pixverse account slots

Lệnh account info hiển thị cấp đăng ký, tín dụng không gian làm việc và bối cảnh sử dụng của bạn. pixverse account usage giúp bạn xem xét mức tiêu thụ tín dụng, trong khi pixverse account slots hiển thị các khe thế hệ đồng thời hiện tại cho các tác vụ hình ảnh và video. Phiên CLI độc lập với phiên web/ứng dụng PixVerse và bạn có thể xóa mã thông báo CLI được lưu trữ bằng pixverse auth logout. Luôn kiểm tra số dư của bạn và các khe có sẵn trước khi chạy các công việc hàng loạt.

Lệnh khởi động nhanh

Nếu bạn chỉ cần đường đi ngắn nhất từ quá trình cài đặt đến nội dung được tạo, hãy bắt đầu với trình tự sau:

npm install -g pixverse
pixverse auth login
pixverse create image --prompt "A photorealistic forest path at golden hour" --json
pixverse create video --prompt "A sunset over ocean waves" --model v6 --quality 720p --duration 5 --json

Đối với quy trình làm việc của tác nhân và CI, hãy luôn bật --json hoặc -p để stdout vẫn có thể đọc được bằng máy trong khi tiến trình và lỗi vẫn ở trên stderr. Đối với các lần thử sản xuất lại, hãy thêm --idempotency-key <key> vào các lệnh tạo để việc gửi đi lặp lại không vô tình tạo ra các công việc bị tính phí trùng lặp.

Bước 3: Tạo hình ảnh đầu tiên của bạn

Tạo văn bản thành hình ảnh là cách nhanh nhất để kiểm tra thiết lập của bạn. Chạy:

pixverse create image --prompt "A photorealistic forest path at golden hour" --json

GitHub README hiện tại liệt kê GPT Image 2 làm mẫu hình ảnh mặc định. Để tự động hóa có thể tái tạo, vẫn đặt --model một cách rõ ràng và kiểm tra trợ giúp CLI trực tiếp hoặc capabilities.json trước khi làm việc hàng loạt. Cờ --json trả về kết quả có cấu trúc:

{ "image_id": 789012, "status": "completed", "image_url": "https://...", "prompt": "A photorealistic forest path at golden hour", "model": "gpt-image-2.0", "width": 1440, "height": 1440 }

Để có đầu ra có độ phân giải cao hơn, hãy chỉ định kiểu máy hỗ trợ nó:

pixverse create image \ --prompt "A photorealistic forest path at golden hour" \ --model seedream-5.0-lite \ --quality 2160p \ --aspect-ratio 16:9 \ --json

PixVerse hỗ trợ một số mẫu hình ảnh, mỗi mẫu có trần độ phân giải và hỗ trợ tỷ lệ khung hình khác nhau:

người mẫu--model valuechất lượngGhi chú
GPT Image 2gpt-image-2.01080p, 1440p, 2160pMô hình hình ảnh mặc định; hỗ trợ tỷ lệ khung hình rộng và cao
Nano Banana 2gemini-3.1-flash512p, 1080p, 1440p, 2160pauto linh hoạt và tỷ lệ khung hình tiêu chuẩn
Qwen Imageqwen-image720p, 1080pTạo nhanh cho các tác vụ sáng tạo thông thường
Nano Banana Progemini-3.01080p, 1440p, 2160pTạo hình ảnh chất lượng cao ở kích thước lớn hơn
Nano Bananagemini-2.5-flash1080pTạo hình ảnh nhẹ với tốc độ quay vòng nhanh
Seedream 5.0 Liteseedream-5.0-lite1440p, 1800p, 2160pHình ảnh sáng tạo có độ chi tiết cao
Seedream 4.5seedream-4.51440p, 2160pTạo hình ảnh có độ phân giải cao
Seedream 4.0seedream-4.01080p, 1440p, 2160pTùy chọn Seedream bổ sung cho quy trình làm việc hình ảnh
Kling Image O3kling-image-o31080p, 1440p, 2160pĐầu ra trực quan được cách điệu hóa với khung hình linh hoạt
Kling Image V3kling-image-v31080p, 1440pCân bằng chất lượng và tốc độ

Bạn cũng có thể chuyển đổi hình ảnh hiện có bằng hình ảnh thành hình ảnh:

pixverse create image \ --prompt "Turn this product photo into a clean watercolor illustration" \ --image ./product-photo.png \ --model gpt-image-2.0 \ --json

Để tải xuống hình ảnh được tạo:

pixverse asset download 789012

Bước 4: Tạo video đầu tiên của bạn

Chuyển văn bản thành video hoạt động theo cách tương tự. Tạo clip dài 5 giây:

pixverse create video --prompt "A sunset over ocean waves" --json

Đối với một thế hệ được tùy chỉnh hoàn toàn:

pixverse create video \ --prompt "A cinematic drone shot over a misty mountain valley at dawn" \ --model v6 \ --quality 1080p \ --aspect-ratio 16:9 \ --duration 8 \ --audio \ --json

Cờ --audio cho phép âm thanh xung quanh do AI tạo ra phù hợp với nội dung video của bạn. Cờ --json trả về video_url khi hoàn thành mà bạn có thể chuyển trực tiếp tới lệnh tải xuống hoặc bước tiếp theo trong quy trình.

PixVerse cung cấp nhiều mẫu video với chất lượng, thời lượng và hỗ trợ chế độ khác nhau:

người mẫu--model valueChất lượng tối đaThời lượngGhi chú
PixVerse V6v61080p1–15 giâyMô hình video mặc định; hỗ trợ tỷ lệ khung hình rộng
PixVerse C1pixverse-c11080p1–15 giâyHỗ trợ mạnh mẽ trên các quy trình làm việc bằng video, tài liệu tham khảo và chuyển tiếp
Seedance 2.0 Standardseedance-2.0-standard2160p4–15 giâyHỗ trợ các chế độ video, tham chiếu và chuyển tiếp
Seedance 2.0 Fastseedance-2.0-fast720p4–15 giâyTùy chọn Seedance nhanh hơn cho các chế độ video, tham chiếu và chuyển tiếp
Seedance 2.0 Miniseedance-2.0-mini720p4–15 giâyTùy chọn Seedance nhẹ cho các chế độ video, tham chiếu và chuyển tiếp
Happy Horse 1.0happyhorse-1.01080p3–15 giâyTùy chọn video nhận biết âm thanh có sẵn cho create video
Kling O3 Prokling-o3-pro720p3–15 giâyHỗ trợ quy trình làm việc video, tham chiếu và chuyển tiếp
Kling O3 Standardkling-o3-standard720p3–15 giâyTùy chọn Kling O3 tiêu chuẩn
Kling 3.0 Prokling-3.0-pro720p3–15 giâyHỗ trợ quy trình làm việc video và chuyển tiếp
Kling 3.0 Standardkling-3.0-standard720p3–15 giâyTùy chọn Kling 3.0 tiêu chuẩn
Grok Imagine 1.5grok-imagine-1.5720p1–15 giâyChỉ chuyển hình ảnh thành video; yêu cầu --image và tuân theo tỷ lệ khung hình của hình ảnh đầu vào
Grok Imaginegrok-imagine720p1–15 giâyTùy chọn Grok trước đó; hỗ trợ quy trình làm việc video, mở rộng và tham chiếu
Veo 3.1 Liteveo-3.1-lite1080p4, 6 hoặc 8 giâyHỗ trợ quy trình chuyển đổi video và 2 khung hình
Veo 3.1 Standardveo-3.1-standard2160p4, 6 hoặc 8 giâyTùy chọn Veo có độ phân giải cao hơn
Veo 3.1 Fastveo-3.1-fast2160p4, 6 hoặc 8 giâyTùy chọn Veo nhanh hơn
Sora 2 Prosora-2-pro1080p4, 8 hoặc 12 giâyTùy chọn Sora có thời lượng cố định
Sora 2sora-2720p4, 8 hoặc 12 giâyTùy chọn Sora tiêu chuẩn
PixVerse v5.6v5.61080p1–10 giâyVẫn được sử dụng cho quy trình điều khiển chuyển động và thế hệ được chọn
PixVerse v5.5v5.51080p1–10 giâyĐược sử dụng cho quy trình công việc create modify
PixVerse v5v51080p1–10 giâyĐược sử dụng cho hơn 3 quy trình chuyển đổi khung

Tạo hoạt ảnh cho hình ảnh tĩnh

Để biến ảnh hoặc hình ảnh được tạo thành video, hãy cung cấp cờ --image:

pixverse create video \ --prompt "Gentle wind moves through the scene" \ --image ./product-photo.jpg \ --model v6 \ --quality 1080p \ --json

Bạn có thể chuyển đường dẫn tệp cục bộ hoặc URL. Các tệp cục bộ được tải lên tự động - không cần bước tải lên thủ công. Đầu vào hình ảnh cục bộ lớn hơn 1920x1920 hoặc 5MB sẽ tự động được thay đổi kích thước hoặc nén trước khi tải lên; URL hình ảnh từ xa được xác thực bởi phần phụ trợ.

Đối với Grok Imagine 1.5, cần có hình ảnh và tỷ lệ khung hình đầu ra tuân theo hình ảnh đó:

pixverse create video \ --prompt "Slow camera push-in, subtle fabric motion, clean native ambience" \ --image ./campaign-poster.png \ --model grok-imagine-1.5 \ --quality 720p \ --duration 6 \ --json

Sử dụng Tham chiếu, Chuyển tiếp, Điều khiển chuyển động và Mẫu

CLI hiện tại hỗ trợ nhiều tính năng hơn là chuyển văn bản thành video và hình ảnh thành video đơn giản. Các chế độ tạo này rất hữu ích khi bạn cần kiểm soát nhiều hơn các ký tự, khung hình chính, chỉnh sửa hoặc hiệu ứng:

# Create a transition between keyframes pixverse create transition --images ./frame1.png ./frame2.png # Tạo âm thanh lời nói từ văn bản pixverse create voice --text "Welcome to the launch" --voice-id <preset_voice_id> --output ./voiceover.mp3 # Tạo nhạc từ lời nhắc pixverse create music --prompt "A cinematic synth-pop intro with bright percussion" --auto-lyrics pixverse create music --prompt "Uplifting piano theme for a product reveal" --instrumental --duration-seconds 60 # Mở rộng video đã tạo pixverse create extend --video <video_id> # Sửa đổi video hiện có pixverse create modify --video <video_id> --prompt "Change the background to a beach" # Độ phân giải video cao cấp pixverse create upscale --video <video_id> --quality 1080p # Tạo video có hình ảnh tham khảo pixverse create reference --images ./char1.png ./char2.png --prompt "Two friends walking in a park" # Tham chiếu Seedance 2.0 có thể kết hợp đầu vào hình ảnh và video pixverse create reference \ --model seedance-2.0-standard \ --images ./character.png \ --videos ./motion.mp4 \ --prompt "@image1 follows the motion in @video1" # Mô hình Seedance 2.0 hỗ trợ tối đa 9 hình ảnh tham chiếu pixverse create reference \ --model seedance-2.0-standard \ --images ./char1.png ./char2.png ./char3.png ./char4.png \ --prompt "@image1 and @image2 walk through the scene together" # Điều khiển chuyển động bằng hình ảnh nhân vật và video tham chiếu chuyển động pixverse create motion-control --image ./character.png --video ./dance.mp4 # Tạo từ mẫu hoặc hiệu ứng pixverse create template --template-id 12345 --image ./photo.png

Không phải mọi mô hình đều hỗ trợ mọi chế độ sáng tạo. Trong ma trận README hiện tại, create video hỗ trợ v6, pixverse-c1, Seedance 2.0 Standard/Fast/Mini, Happy Horse 1.0, Kling O3, Kling 3.0, Grok Imagine, Veo 3.1, Sora 2 và v5.6. grok-imagine-1.5 chỉ chuyển từ hình ảnh sang video và yêu cầu --image; create extend hỗ trợ v6grok-imagine; create reference hỗ trợ v6, pixverse-c1, Seedance 2.0 Standard/Fast/Mini, Kling O3, grok-imaginev5.6; Chuyển tiếp 2 khung hình hỗ trợ các dòng video mới hơn; Hơn 3 lần chuyển đổi khung sử dụng v5; create modify sử dụng v5.5; và create motion-control sử dụng v5.6.

Bước 5: Tạo giọng nói và âm nhạc

GitHub README hiện tại ghi lại âm thanh độc lập thông qua các lệnh tạo chuyên dụng. Sử dụng create voice để chuyển văn bản thành giọng nói và create music để tạo lời nhắc thành nhạc. Đầu ra giọng nói và âm nhạc được lưu dưới dạng nội dung âm thanh, vì vậy bạn có thể theo dõi chúng bằng task, liệt kê chúng bằng asset list --type audio và tải chúng xuống bằng asset download --type audio. Để có môi trường video gốc, hãy sử dụng --audio hoặc --no-audio trên các lệnh tạo video được hỗ trợ.

Tạo âm thanh giọng nói:

pixverse create voice \ --text "Welcome to the launch. Here is what changed this week." \ --model speech-2.8-hd \ --voice-id <preset_voice_id> \ --output ./voiceover.mp3 \ --json

Duyệt các mẫu giọng nói và giọng nói cài sẵn:

pixverse voice models --json pixverse voice presets --model speech-2.8-hd --json

Tạo nhạc:

pixverse create music \ --prompt "A bright cinematic synth-pop track for a 30-second product reveal" \ --auto-lyrics \ --duration-seconds 30 \ --json

Đối với các bản nhạc cụ, hãy sử dụng --instrumental. Đối với các mẫu có khả năng viết lời bài hát, hãy chuyển lời bài hát dưới dạng văn bản chữ, đường dẫn tệp cục bộ hoặc stdin:

pixverse create music \ --prompt "Uplifting electronic pop with a confident chorus" \ --lyrics ./lyrics.txt \ --json

Các dòng mẫu giọng nói hiện tại bao gồm các mẫu MiniMax Speech 2.8 và ElevenLabs. Các dòng mẫu âm nhạc hiện tại bao gồm MiniMax Music, ElevenLabs Music và Google Lyria 3 Pro. Sử dụng pixverse voice modelspixverse music models cho danh mục trực tiếp trước khi viết kịch bản cho quy trình sản xuất.

Bước 6: Chạy Trình hướng dẫn tương tác

Nếu bạn đang khám phá lần đầu tiên và chưa quen với tất cả các cờ có sẵn, hãy chạy bất kỳ lệnh tạo nào mà không có đối số để vào trình hướng dẫn được hướng dẫn:

pixverse create video pixverse create image

Trình hướng dẫn sẽ hướng dẫn bạn từng bước về lời nhắc, lựa chọn mô hình, chất lượng, tỷ lệ khung hình, thời lượng và các tùy chọn khác — hữu ích để khám phá những tham số nào có sẵn trước khi tạo tập lệnh cho chúng.

Beyond Generation: Quản lý tài sản và không gian làm việc của bạn

PixVerse CLI hiện tại cũng bao gồm các lệnh quản lý giúp bạn xây dựng quy trình làm việc của thiết bị đầu cuối từ đầu đến cuối:

  • pixverse task status <id>pixverse task wait <id> để kiểm tra nhiệm vụ
  • pixverse task status --ids 123,456,789 --type video --json để kiểm tra trạng thái hàng loạt
  • pixverse asset list, asset upload, asset info, asset downloadasset delete dành cho các hoạt động trong vòng đời nội dung video, hình ảnh và âm thanh
  • pixverse saved list, saved items, saved new, saved rename, saved add, saved removesaved delete cho các thư mục đã lưu
  • pixverse template categories, template list, template searchtemplate info để khám phá các hiệu ứng và mẫu
  • pixverse voice models, voice presetsmusic models để khám phá mô hình âm thanh trực tiếp
  • pixverse workspace list, workspace status, workspace switchworkspace manage cho hoạt động đa không gian làm việc
  • pixverse account info, account usageaccount slots để kiểm tra tín dụng, mức sử dụng và đồng thời
  • pixverse config set, config list, config pathconfig defaults cho các giá trị mặc định cục bộ có thể lặp lại

Điều này giúp việc tự động hóa không chỉ quá trình tạo mà còn cả việc tổ chức, khám phá mẫu, khám phá âm thanh, tải xuống, định tuyến không gian làm việc và phân phối trong một tập lệnh trở nên đơn giản. Nếu bạn cần chạy một lệnh trên một không gian làm việc khác, hãy sử dụng cờ --workspace-id <id> chung; 0 hướng tới không gian làm việc cá nhân của bạn.

Cờ thân thiện với tập lệnh

Hầu hết tự động hóa đều phụ thuộc vào kết quả đầu ra có thể dự đoán được và hành vi thời gian chạy có thể dự đoán được. Những cờ này đặc biệt hữu ích trong tập lệnh và quy trình làm việc của tác nhân AI:

CờSử dụng nó cho
--jsonTrả về đầu ra JSON có cấu trúc
-pBí danh ngắn cho --json
--count <n>Tạo 1–4 biến thể từ một yêu cầu
--seed <number>Làm cho một thế hệ dễ dàng sinh sản hơn
--off-peakSử dụng giá thấp điểm khi có sẵn
--audio / --no-audioBật hoặc tắt tính năng tạo âm thanh trên các lệnh tạo được hỗ trợ
--multi-shot / --no-multi-shotBật hoặc tắt chế độ chụp nhiều ảnh cho video
--no-waitNộp hồ sơ và về ngay
--timeout <sec>Đặt thời gian chờ bỏ phiếu, mặc định là 300 giây
--workspace-id <id>Ghi đè không gian làm việc đang hoạt động cho một lệnh
--trace-id <uuid>Đính kèm UUIDv4 do người gọi cung cấp vào các yêu cầu API để gỡ lỗi và khả năng quan sát
--idempotency-key <key>Thử lại các yêu cầu tạo một cách an toàn mà không vô tình tạo ra các công việc bị tính phí trùng lặp

Cờ nhập văn bản giờ đây dễ dàng tự động hóa hơn. --prompt, --text--lyrics có thể chấp nhận chuỗi ký tự, đường dẫn tệp cục bộ hoặc - cho stdin:

pixverse create video --prompt ./scene.txt --json cat scene.txt | pixverse create image --prompt - --json echo "Hello from the command line" | pixverse create voice --text - --json pixverse create music --prompt "Bright synth-pop" --lyrics ./lyrics.txt --json

Hướng dẫn tác nhân AI của bạn cách tạo phương tiện

Đây là lúc PixVerse CLI trở nên biến đổi thực sự. Vì các lệnh có thể trả về JSON có cấu trúc và sử dụng mã thoát xác định nên bất kỳ tác nhân AI nào có thể chạy lệnh shell đều có thể được dạy để tạo hình ảnh và video theo yêu cầu.

Đang cài đặt PixVerse Skills

PixVerse Skillslà thư viện kỹ năng có cấu trúc hướng dẫn các tác nhân cách sử dụng CLI một cách chính xác: cờ lệnh, ràng buộc mô hình, quy trình nhiều bước và xử lý lỗi mạnh mẽ.

Đối với Claude Code và các tác nhân khác hỗ trợ định dạng kỹ năng, hãy thêm trực tiếp các kỹ năng PixVerse:

npx skills add https://github.com/pixverseai/skills --skill pixverse-ai-image-and-video-generator

Đối với Cursor, Claude Code, Codex và các khung tác nhân khác, kỹ năng này cải thiện độ tin cậy bằng cách đưa ra các ràng buộc rõ ràng cho tác nhân thay vì buộc nó phải suy ra chúng từ đầu.

PixVerse CLI cũng cung cấp một bản kê khai lệnh nhỏ gọn có thể đọc được bằng máy tại dist/capabilities.json, với nguồn công khai có sẵn dưới dạng capabilities.json trong kho lưu trữ GitHub. Tệp kê khai này mô tả các lệnh, cờ, mã thoát, kỳ vọng đầu ra của JSON và các danh mục hiệu ứng để nhân viên hỗ trợ có thể kiểm tra hợp đồng CLI mà không cần xóa văn bản trợ giúp.

Sau khi nhân viên hỗ trợ của bạn đã tải các kỹ năng PixVerse, bạn có thể đưa ra các hướng dẫn bằng ngôn ngữ tự nhiên như:

  • “Tạo video demo sản phẩm dài 10 giây từ ảnh chụp màn hình này”
  • “Tạo bốn biến thể của ảnh bìa blog này ở định dạng 16:9”
  • “Hoạt hình hóa sơ đồ này thành clip giải thích dài 5 giây với âm thanh xung quanh”
  • “Tạo ba clip quảng cáo 16:9 dài 8 giây với các chuyển động camera khác nhau”

Tác nhân sẽ dịch các hướng dẫn đó thành các lệnh CLI chính xác, phân tích đầu ra JSON, đồng thời xử lý việc thăm dò và tải xuống — không cần can thiệp thủ công.

Claude Code

Trong Claude Code, PixVerse CLI trở thành công cụ gốc mà tác nhân sử dụng một cách tự động. Sau khi tải các kỹ năng PixVerse, bạn có thể đưa trực tiếp việc tạo phương tiện vào bất kỳ tác vụ nào:

Generate a cover image for this blog post about machine learning, use the seedream-5.0-lite model at 2160p in 16:9 format, download it to ./assets/cover.webp

Claude Code sẽ gọi các lệnh CLI chính xác, phân tích URL hình ảnh từ phản hồi JSON và tải tệp xuống đường dẫn đã chỉ định của bạn - tất cả trong cùng một phiên nơi nó cũng đang viết mã của bạn.

Quy trình làm việc Claude Code điển hình:

# Claude Code runs this autonomously based on your instruction IMG=$(pixverse create image \ --prompt "Abstract visualization of neural network layers, dark background, blue and purple tones" \ --model seedream-5.0-lite \ --quality 2160p \ --aspect-ratio 16:9 \ --json | jq -r '.image_url') # Sau đó làm động nó pixverse create video \ --prompt "Slow pan across glowing neural connections" \ --image "$IMG" \ --model v6 \ --quality 1080p \ --duration 6 \ --json

Cursor

Người dùng Cursor có thể tải PixVerse Skills dưới dạng tệp ngữ cảnh dự án. Đặt các tệp kỹ năng có liên quan vào thư mục .cursor/ của bạn hoặc thêm chúng vào quy tắc không gian làm việc của bạn. Sau khi được tải, Cursor có nhận thức đầy đủ về mọi lệnh PixVerse CLI và có thể tạo phương tiện như một phần của bất kỳ tác vụ mã hóa nào.

Quy trình làm việc chung của Cursor: yêu cầu nhân viên tạo hình ảnh mô phỏng dựa trên thiết kế mà bạn đang xây dựng, sau đó sử dụng nó làm tài liệu tham khảo trực tiếp trong phiên IDE của bạn — mà không cần rời khỏi trình chỉnh sửa.

Codex và các agent khác

PixVerse CLI tương thích với bất kỳ tác nhân nào có thể thực thi các lệnh shell và phân tích JSON. Định dạng đầu ra có cấu trúc — tên trường nhất quán, mã lỗi có thể dự đoán và thông báo lỗi được phân tách bằng stderr — đảm bảo rằng ngay cả các tác nhân tạo tập lệnh đơn giản cũng có thể tích hợp việc tạo một cách đáng tin cậy.

Hợp đồng mã thoát giúp việc xử lý lỗi trở nên đơn giản:

Ý nghĩaHành động của tác nhân
0thành côngPhân tích đầu ra JSON
1Lỗi chungKiểm tra stderr và thử lại với thông tin đầu vào đã được xác thực
2Hết giờThử lại với --timeout dài hơn
3Xác thực đã hết hạnChạy lại pixverse auth login
4Hết tín dụngKiểm tra số dư, thông báo cho người dùng
5Thế hệ không thành côngHãy thử các thông số khác nhau
6Lỗi xác thựcXem lại giá trị cờ

Đường ống tự động hóa

Khi bạn hiểu các lệnh riêng lẻ, PixVerse CLI sẽ mở ra các quy trình công việc gồm nhiều bước mạnh mẽ chạy hoàn toàn mà không cần sự tương tác của người dùng.

Chuyển văn bản thành hình ảnh thành video

Một trong những quy trình hữu ích nhất: tạo hình ảnh có độ phân giải cao từ lời nhắc văn bản, sau đó tạo hoạt ảnh cho hình ảnh đó thành video.

# Step 1: Generate a base image IMG_RESULT=$(pixverse create image \ --prompt "A cyberpunk cityscape at night, neon lights reflecting on wet pavement" \ --model gemini-3.1-flash \ --quality 2160p \ --aspect-ratio 16:9 \ --json) IMAGE_URL=$(echo "$IMG_RESULT" | jq -r '.image_url') # Bước 2: Hoạt hình thành video VID_RESULT=$(pixverse create video \ --prompt "Camera slowly pans across the neon-lit streets" \ --image "$IMAGE_URL" \ --model v6 \ --quality 1080p \ --duration 8 \ --json) VIDEO_ID=$(echo "$VID_RESULT" | jq -r '.video_id') # Bước 3: Tải xuống video cuối cùng pixverse asset download "$VIDEO_ID" --json

Quy trình sản xuất video đầy đủ

Để có đầu ra được đánh bóng, tạo chuỗi với các bước xử lý hậu kỳ. Sử dụng --audio hoặc --no-audio khi bạn muốn âm thanh gốc trên các lệnh tạo video được hỗ trợ, sau đó sử dụng create voice cho âm thanh chuyển văn bản sang giọng nói và create music cho nội dung nhạc độc lập mà bạn sẽ kết hợp xuôi dòng:

# Step 1: Create the base video RESULT=$(pixverse create video \ --prompt "A product being assembled in slow motion" \ --model v6 \ --quality 720p \ --duration 5 \ --audio \ --json) VID=$(echo "$RESULT" | jq -r '.video_id') # Bước 2: Gia hạn thời hạn EXTENDED=$(pixverse create extend \ --video "$VID" \ --json | jq -r '.video_id') pixverse task wait "$EXTENDED" --json # Bước 3: Nâng cấp lên 1080p FINAL=$(pixverse create upscale \ --video "$EXTENDED" \ --quality 1080p \ --json | jq -r '.video_id') pixverse task wait "$FINAL" --json # Bước 4: Tải xuống pixverse asset download "$FINAL" --json # Tùy chọn: tạo nội dung lồng tiếng riêng pixverse create voice \ --text "The final reveal starts now." \ --voice-id <preset_voice_id> \ --output ./voiceover.mp3 \ --json

Tạo hàng loạt

Đối với các quy trình nội dung yêu cầu nhiều biến thể, hãy chạy song song các công việc:

# Check credits and concurrent generation slots first pixverse account info --json pixverse account slots --json # Đệ trình bốn thế hệ song song pixverse create video --prompt "Sunrise over mountains" --no-wait --json > /tmp/v1.json & pixverse create video --prompt "Sunset over ocean" --no-wait --json > /tmp/v2.json & pixverse create video --prompt "Stars over a desert" --no-wait --json > /tmp/v3.json & pixverse create video --prompt "Aurora over a frozen lake" --no-wait --json > /tmp/v4.json & wait # Kiểm tra tất cả các ID tác vụ được trả về trong một cuộc gọi trạng thái hàng loạt IDS=$(jq -r '.video_id' /tmp/v1.json /tmp/v2.json /tmp/v3.json /tmp/v4.json | paste -sd, -) pixverse task status --ids "$IDS" --type video --json # Đợi từng cái và tải xuống for f in /tmp/v1.json /tmp/v2.json /tmp/v3.json /tmp/v4.json; do ID=$(jq -r '.video_id' "$f") pixverse task wait "$ID" --json pixverse asset download "$ID" --json done

Cờ --no-wait gửi công việc và trả về ngay lập tức kèm theo ID nhiệm vụ, cho phép bạn gửi nhiều công việc trước khi bỏ phiếu. Với --no-wait --json, ghi lại ID tác vụ được trả về và giải quyết các tham số tạo để ghi nhật ký và tái tạo. Sử dụng --count <n> khi bạn muốn có nhiều biến thể từ một lời nhắc và sử dụng task status --ids theo lô khi bạn muốn có một phản hồi trạng thái cho một số công việc đang chạy. Lệnh pixverse task wait xử lý việc bỏ phiếu thích ứng cho bạn.

Định cấu hình mặc định

Nếu bạn thường xuyên sử dụng cùng một kiểu máy, chất lượng hoặc tỷ lệ khung hình, hãy đặt chúng làm mặc định để bạn không phải lặp lại cờ mỗi lần:

pixverse config defaults set video model v6 pixverse config defaults set video quality 1080p pixverse config defaults set image model seedream-5.0-lite pixverse config set output-dir ~/Downloads/pixverse pixverse config defaults show pixverse config list pixverse config path

Cờ dòng lệnh luôn ghi đè các giá trị mặc định đã định cấu hình của bạn, do đó bạn vẫn giữ được sự linh hoạt hoàn toàn trong khi giảm sự lặp lại. Để tự động hóa dành riêng cho không gian làm việc, hãy thêm --workspace-id <id> vào lệnh khi bạn muốn ghi đè không gian làm việc đang hoạt động cho lần chạy đó.

Những gì bạn có thể xây dựng

Với PixVerse CLI được tích hợp vào workflow agent của bạn, phạm vi tác vụ có thể tự động hóa sẽ mở rộng đáng kể:

  • Tài liệu— tự động tạo video giới thiệu sản phẩm và ảnh chụp màn hình như một phần của quá trình xây dựng tài liệu của bạn
  • Tiếp thị— chạy các công việc hàng loạt hàng đêm để tạo ra các biến thể nội dung trên mạng xã hội từ một thư viện lời nhắc duy nhất
  • Phát triển ứng dụng— cho phép tác nhân mã hóa của bạn tạo hình ảnh giữ chỗ, hoạt ảnh mô phỏng hoặc tải video màn hình trong khi bạn xây dựng giao diện người dùng
  • Quy trình làm việc về âm thanh— tạo bản nháp lồng tiếng, bản nhạc gợi ý hoặc nội dung âm thanh để chỉnh sửa sau này
  • Quy trình nội dung— gọi CLI theo chuỗi bằng các công cụ khác (ffmpeg, ImageMagick, lưu trữ đám mây) để xây dựng quy trình sản xuất phương tiện hoàn toàn tự động
  • Tạo nguyên mẫu— tạo ra các ý tưởng chuyển động nhanh trong vài giây để xác thực các ý tưởng trước khi đưa vào sản xuất hoàn chỉnh

CLI được thiết kế để phù hợp một cách tự nhiên với mọi quy trình làm việc dựa trên shell. Nếu quá trình tự động hóa hiện tại của bạn chạy trong bash, Python, Node hoặc đường dẫn CI/CD, thì PixVerse CLI sẽ đưa vào mà không cần bất kỳ chi phí tích hợp bổ sung nào.

Danh sách kiểm tra bắt đầu

  • Cài đặt Node.js 20 trở lên
  • Chạy npm install -g pixverse
  • Chạy pixverse auth login và ủy quyền trong trình duyệt
  • Chạy pixverse account info để xác minh tín dụng
  • Chạy pixverse account slots trước khi thực hiện thao tác hàng loạt đồng thời
  • Tạo hình ảnh đầu tiên của bạn: pixverse create image --prompt "..." --json
  • Tạo video đầu tiên của bạn: pixverse create video --prompt "..." --json
  • Tạo nội dung giọng nói đầu tiên của bạn: pixverse create voice --text "..." --json
  • Tạo nội dung âm nhạc đầu tiên của bạn: pixverse create music --prompt "..." --json
  • Khám phá các mẫu với pixverse template list
  • Cài đặt PixVerse Skills cho agent của bạn (Claude Code, Cursor hoặc Codex)
  • Thiết lập các giá trị mặc định ưa thích của bạn với pixverse config defaults set
  • Xây dựng quy trình tự động hóa đầu tiên của bạn

Luôn cập nhật CLI

Sử dụng trình cập nhật tích hợp để cập nhật CLI cục bộ của bạn:

pixverse update

Bạn cũng có thể sử dụng npm trực tiếp:

npm install -g pixverse@latest

Để biết các thay đổi ở cấp độ phát hành và các mẫu mới được hỗ trợ, hãy kiểm tra các nguồn CLI chính thức:

Các tài liệu hiện tại nêu bật PixVerse V6 là mô hình video mặc định, GPT Image 2 là mô hình hình ảnh mặc định, hỗ trợ Seedance 2.0 Mini, quy trình làm việc PixVerse v5 và v5.5 theo chế độ cụ thể, các lệnh create voicecreate music chuyên dụng, quản lý nội dung âm thanh, thư mục đã lưu, chuyển đổi không gian làm việc, config defaults, capabilities.json dành cho agent, pixverse update, hỗ trợ stdin cho đầu vào văn bản, --trace-id--idempotency-key để thử lại an toàn hơn.

Các bước tiếp theo

PixVerse CLI trên GitHub và npm (npm install -g pixverse) cho phép bạn truy cập ngay vào quá trình tạo, kiểm tra nhiệm vụ, quản lý nội dung, mẫu, thư mục đã lưu, kiểm tra tài khoản, khám phá mô hình âm thanh và điều khiển không gian làm việc từ một giao diện duy nhất. Kho lưu trữ PixVerse Skills bổ sung thêm hướng dẫn dành cho tác nhân để Claude Code, Cursor, Codex và các công cụ khác có thể chạy các quy trình công việc này với độ tin cậy cao hơn.

Sự kết hợp giữa CLI đáng tin cậy và thư viện kỹ năng sẵn sàng cho tác nhân có nghĩa là việc tạo hình ảnh, video, giọng nói và âm nhạc có thể hoạt động trong cùng một quy trình làm việc với mã của bạn — được quản lý bởi cùng một tác nhân, trong cùng một thiết bị đầu cuối mà không cần chuyển đổi công cụ.

Bắt đầu với một lệnh duy nhất. Xây dựng từ đó.