PixVerse CLI: tạo video và hình ảnh AI trong terminal
Cài PixVerse CLI để tạo video, hình ảnh, giọng nói và nhạc AI trong terminal, đồng thời tự động hóa workflow agent bằng JSON.
Giới thiệu
Mọi quy trình làm việc sáng tạo đều có một nút thắt cổ chai - thời điểm bạn phải rời khỏi trình soạn thảo mã của mình, mở trình duyệt và nhấp qua giao diện web theo cách thủ công để tạo một phần phương tiện. Đối với các nhà phát triển, AI agent và bất kỳ ai xây dựng quy trình nội dung tự động, việc chuyển đổi ngữ cảnh đó là trở ngại tăng lên nhanh chóng.
PixVerse CLIloại bỏ nút thắt cổ chai đó. Đây là giao diện dòng lệnh chính thức cho PixVerse, cho phép bạn truy cập vào quy trình làm việc và tạo PixVerse trực tiếp từ thiết bị đầu cuối của bạn. Chuyển văn bản thành video, hình ảnh thành video, văn bản thành hình ảnh, hình ảnh thành hình ảnh, chuyển tiếp, tạo giọng nói, tạo nhạc, video tham chiếu, điều khiển chuyển động, mẫu, nâng cấp và quản lý tài sản đều có thể viết được, có thể điều chỉnh được và có sẵn mà không cần chạm vào trình duyệt.
Điều khiến PixVerse CLI đặc biệt hữu ích là triết lý thiết kế của nó: nó được xây dựng với các tác nhân AI. Các lệnh có thể trả về JSON có cấu trúc với --json hoặc -p, mã thoát có tính xác định và mọi bước quy trình đều có thể kết hợp được. Điều này có nghĩa là bạn có thể hướng dẫn Claude Code, Cursor, Codex hoặc bất kỳ tác nhân nào khác thay mặt bạn tạo hình ảnh, video, giọng nói và âm nhạc với ít chuyển giao dễ hỏng hơn.
Hướng dẫn này phù hợp với PixVerseAI/cli GitHub README hiện tại và tệp kê khai khả năng công khai của nó, được kiểm tra vào ngày 29 tháng 6 năm 2026. Tính khả dụng của mô hình, mô hình mặc định và cờ lệnh có thể thay đổi nhanh hơn so với hướng dẫn thường xanh, vì vậy, tập lệnh sản xuất vẫn phải xác minh pixverse --version, pixverse create <mode> --help và pixverse update trước khi chạy một đợt lớn.
Điều kiện tiên quyết
Trước khi bắt đầu, bạn cần:
- Node.js 20 trở lên— kiểm tra với
node --version - Tài khoản PixVerse— đăng ký tại pixverse.ai
- Đăng ký PixVerse đang hoạt động— CLI sử dụng hệ thống tín dụng giống như trang web; chỉ người dùng đã đăng ký mới có thể tạo nội dung
PixVerse CLI không yêu cầu sao chép thủ công bất kỳ khóa API nào. Xác thực được xử lý thông qua luồng OAuth dựa trên trình duyệt lưu trữ mã thông báo của bạn cục bộ.
Bước 1: Cài đặt CLI
Cài đặt toàn cầu với npm:
Xác minh cài đặt:
Nếu bạn không muốn cài đặt trên toàn cầu, bạn cũng có thể chạy lệnh qua npx:
Bước 2: Xác thực
Chạy lệnh đăng nhập:
CLI mở trình duyệt để ủy quyền thiết bị OAuth. Bạn cũng có thể sao chép URL và hoàn tất ủy quyền từ bất kỳ trình duyệt nào trên bất kỳ thiết bị nào, điều này rất hữu ích cho môi trường SSH và không có giao diện người dùng. Mã thông báo của bạn được lưu trữ tự động trong ~/.pixverse/ và có giá trị trong 30 ngày.
Để xác minh bạn đã đăng nhập và kiểm tra số điểm hiện có của mình:
Lệnh account info hiển thị cấp đăng ký, tín dụng không gian làm việc và bối cảnh sử dụng của bạn. pixverse account usage giúp bạn xem xét mức tiêu thụ tín dụng, trong khi pixverse account slots hiển thị các khe thế hệ đồng thời hiện tại cho các tác vụ hình ảnh và video. Phiên CLI độc lập với phiên web/ứng dụng PixVerse và bạn có thể xóa mã thông báo CLI được lưu trữ bằng pixverse auth logout. Luôn kiểm tra số dư của bạn và các khe có sẵn trước khi chạy các công việc hàng loạt.
Lệnh khởi động nhanh
Nếu bạn chỉ cần đường đi ngắn nhất từ quá trình cài đặt đến nội dung được tạo, hãy bắt đầu với trình tự sau:
npm install -g pixverse
pixverse auth login
pixverse create image --prompt "A photorealistic forest path at golden hour" --json
pixverse create video --prompt "A sunset over ocean waves" --model v6 --quality 720p --duration 5 --jsonĐối với quy trình làm việc của tác nhân và CI, hãy luôn bật --json hoặc -p để stdout vẫn có thể đọc được bằng máy trong khi tiến trình và lỗi vẫn ở trên stderr. Đối với các lần thử sản xuất lại, hãy thêm --idempotency-key <key> vào các lệnh tạo để việc gửi đi lặp lại không vô tình tạo ra các công việc bị tính phí trùng lặp.
Bước 3: Tạo hình ảnh đầu tiên của bạn
Tạo văn bản thành hình ảnh là cách nhanh nhất để kiểm tra thiết lập của bạn. Chạy:
GitHub README hiện tại liệt kê GPT Image 2 làm mẫu hình ảnh mặc định. Để tự động hóa có thể tái tạo, vẫn đặt --model một cách rõ ràng và kiểm tra trợ giúp CLI trực tiếp hoặc capabilities.json trước khi làm việc hàng loạt. Cờ --json trả về kết quả có cấu trúc:
Để có đầu ra có độ phân giải cao hơn, hãy chỉ định kiểu máy hỗ trợ nó:
PixVerse hỗ trợ một số mẫu hình ảnh, mỗi mẫu có trần độ phân giải và hỗ trợ tỷ lệ khung hình khác nhau:
| người mẫu | --model value | chất lượng | Ghi chú |
|---|---|---|---|
| GPT Image 2 | gpt-image-2.0 | 1080p, 1440p, 2160p | Mô hình hình ảnh mặc định; hỗ trợ tỷ lệ khung hình rộng và cao |
| Nano Banana 2 | gemini-3.1-flash | 512p, 1080p, 1440p, 2160p | auto linh hoạt và tỷ lệ khung hình tiêu chuẩn |
| Qwen Image | qwen-image | 720p, 1080p | Tạo nhanh cho các tác vụ sáng tạo thông thường |
| Nano Banana Pro | gemini-3.0 | 1080p, 1440p, 2160p | Tạo hình ảnh chất lượng cao ở kích thước lớn hơn |
| Nano Banana | gemini-2.5-flash | 1080p | Tạo hình ảnh nhẹ với tốc độ quay vòng nhanh |
| Seedream 5.0 Lite | seedream-5.0-lite | 1440p, 1800p, 2160p | Hình ảnh sáng tạo có độ chi tiết cao |
| Seedream 4.5 | seedream-4.5 | 1440p, 2160p | Tạo hình ảnh có độ phân giải cao |
| Seedream 4.0 | seedream-4.0 | 1080p, 1440p, 2160p | Tùy chọn Seedream bổ sung cho quy trình làm việc hình ảnh |
| Kling Image O3 | kling-image-o3 | 1080p, 1440p, 2160p | Đầu ra trực quan được cách điệu hóa với khung hình linh hoạt |
| Kling Image V3 | kling-image-v3 | 1080p, 1440p | Cân bằng chất lượng và tốc độ |
Bạn cũng có thể chuyển đổi hình ảnh hiện có bằng hình ảnh thành hình ảnh:
Để tải xuống hình ảnh được tạo:
Bước 4: Tạo video đầu tiên của bạn
Chuyển văn bản thành video hoạt động theo cách tương tự. Tạo clip dài 5 giây:
Đối với một thế hệ được tùy chỉnh hoàn toàn:
Cờ --audio cho phép âm thanh xung quanh do AI tạo ra phù hợp với nội dung video của bạn. Cờ --json trả về video_url khi hoàn thành mà bạn có thể chuyển trực tiếp tới lệnh tải xuống hoặc bước tiếp theo trong quy trình.
PixVerse cung cấp nhiều mẫu video với chất lượng, thời lượng và hỗ trợ chế độ khác nhau:
| người mẫu | --model value | Chất lượng tối đa | Thời lượng | Ghi chú |
|---|---|---|---|---|
| PixVerse V6 | v6 | 1080p | 1–15 giây | Mô hình video mặc định; hỗ trợ tỷ lệ khung hình rộng |
| PixVerse C1 | pixverse-c1 | 1080p | 1–15 giây | Hỗ trợ mạnh mẽ trên các quy trình làm việc bằng video, tài liệu tham khảo và chuyển tiếp |
| Seedance 2.0 Standard | seedance-2.0-standard | 2160p | 4–15 giây | Hỗ trợ các chế độ video, tham chiếu và chuyển tiếp |
| Seedance 2.0 Fast | seedance-2.0-fast | 720p | 4–15 giây | Tùy chọn Seedance nhanh hơn cho các chế độ video, tham chiếu và chuyển tiếp |
| Seedance 2.0 Mini | seedance-2.0-mini | 720p | 4–15 giây | Tùy chọn Seedance nhẹ cho các chế độ video, tham chiếu và chuyển tiếp |
| Happy Horse 1.0 | happyhorse-1.0 | 1080p | 3–15 giây | Tùy chọn video nhận biết âm thanh có sẵn cho create video |
| Kling O3 Pro | kling-o3-pro | 720p | 3–15 giây | Hỗ trợ quy trình làm việc video, tham chiếu và chuyển tiếp |
| Kling O3 Standard | kling-o3-standard | 720p | 3–15 giây | Tùy chọn Kling O3 tiêu chuẩn |
| Kling 3.0 Pro | kling-3.0-pro | 720p | 3–15 giây | Hỗ trợ quy trình làm việc video và chuyển tiếp |
| Kling 3.0 Standard | kling-3.0-standard | 720p | 3–15 giây | Tùy chọn Kling 3.0 tiêu chuẩn |
| Grok Imagine 1.5 | grok-imagine-1.5 | 720p | 1–15 giây | Chỉ chuyển hình ảnh thành video; yêu cầu --image và tuân theo tỷ lệ khung hình của hình ảnh đầu vào |
| Grok Imagine | grok-imagine | 720p | 1–15 giây | Tùy chọn Grok trước đó; hỗ trợ quy trình làm việc video, mở rộng và tham chiếu |
| Veo 3.1 Lite | veo-3.1-lite | 1080p | 4, 6 hoặc 8 giây | Hỗ trợ quy trình chuyển đổi video và 2 khung hình |
| Veo 3.1 Standard | veo-3.1-standard | 2160p | 4, 6 hoặc 8 giây | Tùy chọn Veo có độ phân giải cao hơn |
| Veo 3.1 Fast | veo-3.1-fast | 2160p | 4, 6 hoặc 8 giây | Tùy chọn Veo nhanh hơn |
| Sora 2 Pro | sora-2-pro | 1080p | 4, 8 hoặc 12 giây | Tùy chọn Sora có thời lượng cố định |
| Sora 2 | sora-2 | 720p | 4, 8 hoặc 12 giây | Tùy chọn Sora tiêu chuẩn |
| PixVerse v5.6 | v5.6 | 1080p | 1–10 giây | Vẫn được sử dụng cho quy trình điều khiển chuyển động và thế hệ được chọn |
| PixVerse v5.5 | v5.5 | 1080p | 1–10 giây | Được sử dụng cho quy trình công việc create modify |
| PixVerse v5 | v5 | 1080p | 1–10 giây | Được sử dụng cho hơn 3 quy trình chuyển đổi khung |
Tạo hoạt ảnh cho hình ảnh tĩnh
Để biến ảnh hoặc hình ảnh được tạo thành video, hãy cung cấp cờ --image:
Bạn có thể chuyển đường dẫn tệp cục bộ hoặc URL. Các tệp cục bộ được tải lên tự động - không cần bước tải lên thủ công. Đầu vào hình ảnh cục bộ lớn hơn 1920x1920 hoặc 5MB sẽ tự động được thay đổi kích thước hoặc nén trước khi tải lên; URL hình ảnh từ xa được xác thực bởi phần phụ trợ.
Đối với Grok Imagine 1.5, cần có hình ảnh và tỷ lệ khung hình đầu ra tuân theo hình ảnh đó:
Sử dụng Tham chiếu, Chuyển tiếp, Điều khiển chuyển động và Mẫu
CLI hiện tại hỗ trợ nhiều tính năng hơn là chuyển văn bản thành video và hình ảnh thành video đơn giản. Các chế độ tạo này rất hữu ích khi bạn cần kiểm soát nhiều hơn các ký tự, khung hình chính, chỉnh sửa hoặc hiệu ứng:
Không phải mọi mô hình đều hỗ trợ mọi chế độ sáng tạo. Trong ma trận README hiện tại, create video hỗ trợ v6, pixverse-c1, Seedance 2.0 Standard/Fast/Mini, Happy Horse 1.0, Kling O3, Kling 3.0, Grok Imagine, Veo 3.1, Sora 2 và v5.6. grok-imagine-1.5 chỉ chuyển từ hình ảnh sang video và yêu cầu --image; create extend hỗ trợ v6 và grok-imagine; create reference hỗ trợ v6, pixverse-c1, Seedance 2.0 Standard/Fast/Mini, Kling O3, grok-imagine và v5.6; Chuyển tiếp 2 khung hình hỗ trợ các dòng video mới hơn; Hơn 3 lần chuyển đổi khung sử dụng v5; create modify sử dụng v5.5; và create motion-control sử dụng v5.6.
Bước 5: Tạo giọng nói và âm nhạc
GitHub README hiện tại ghi lại âm thanh độc lập thông qua các lệnh tạo chuyên dụng. Sử dụng create voice để chuyển văn bản thành giọng nói và create music để tạo lời nhắc thành nhạc. Đầu ra giọng nói và âm nhạc được lưu dưới dạng nội dung âm thanh, vì vậy bạn có thể theo dõi chúng bằng task, liệt kê chúng bằng asset list --type audio và tải chúng xuống bằng asset download --type audio. Để có môi trường video gốc, hãy sử dụng --audio hoặc --no-audio trên các lệnh tạo video được hỗ trợ.
Tạo âm thanh giọng nói:
Duyệt các mẫu giọng nói và giọng nói cài sẵn:
Tạo nhạc:
Đối với các bản nhạc cụ, hãy sử dụng --instrumental. Đối với các mẫu có khả năng viết lời bài hát, hãy chuyển lời bài hát dưới dạng văn bản chữ, đường dẫn tệp cục bộ hoặc stdin:
Các dòng mẫu giọng nói hiện tại bao gồm các mẫu MiniMax Speech 2.8 và ElevenLabs. Các dòng mẫu âm nhạc hiện tại bao gồm MiniMax Music, ElevenLabs Music và Google Lyria 3 Pro. Sử dụng pixverse voice models và pixverse music models cho danh mục trực tiếp trước khi viết kịch bản cho quy trình sản xuất.
Bước 6: Chạy Trình hướng dẫn tương tác
Nếu bạn đang khám phá lần đầu tiên và chưa quen với tất cả các cờ có sẵn, hãy chạy bất kỳ lệnh tạo nào mà không có đối số để vào trình hướng dẫn được hướng dẫn:
Trình hướng dẫn sẽ hướng dẫn bạn từng bước về lời nhắc, lựa chọn mô hình, chất lượng, tỷ lệ khung hình, thời lượng và các tùy chọn khác — hữu ích để khám phá những tham số nào có sẵn trước khi tạo tập lệnh cho chúng.
Beyond Generation: Quản lý tài sản và không gian làm việc của bạn
PixVerse CLI hiện tại cũng bao gồm các lệnh quản lý giúp bạn xây dựng quy trình làm việc của thiết bị đầu cuối từ đầu đến cuối:
pixverse task status <id>vàpixverse task wait <id>để kiểm tra nhiệm vụpixverse task status --ids 123,456,789 --type video --jsonđể kiểm tra trạng thái hàng loạtpixverse asset list,asset upload,asset info,asset downloadvàasset deletedành cho các hoạt động trong vòng đời nội dung video, hình ảnh và âm thanhpixverse saved list,saved items,saved new,saved rename,saved add,saved removevàsaved deletecho các thư mục đã lưupixverse template categories,template list,template searchvàtemplate infođể khám phá các hiệu ứng và mẫupixverse voice models,voice presetsvàmusic modelsđể khám phá mô hình âm thanh trực tiếppixverse workspace list,workspace status,workspace switchvàworkspace managecho hoạt động đa không gian làm việcpixverse account info,account usagevàaccount slotsđể kiểm tra tín dụng, mức sử dụng và đồng thờipixverse config set,config list,config pathvàconfig defaultscho các giá trị mặc định cục bộ có thể lặp lại
Điều này giúp việc tự động hóa không chỉ quá trình tạo mà còn cả việc tổ chức, khám phá mẫu, khám phá âm thanh, tải xuống, định tuyến không gian làm việc và phân phối trong một tập lệnh trở nên đơn giản. Nếu bạn cần chạy một lệnh trên một không gian làm việc khác, hãy sử dụng cờ --workspace-id <id> chung; 0 hướng tới không gian làm việc cá nhân của bạn.
Cờ thân thiện với tập lệnh
Hầu hết tự động hóa đều phụ thuộc vào kết quả đầu ra có thể dự đoán được và hành vi thời gian chạy có thể dự đoán được. Những cờ này đặc biệt hữu ích trong tập lệnh và quy trình làm việc của tác nhân AI:
| Cờ | Sử dụng nó cho |
|---|---|
--json | Trả về đầu ra JSON có cấu trúc |
-p | Bí danh ngắn cho --json |
--count <n> | Tạo 1–4 biến thể từ một yêu cầu |
--seed <number> | Làm cho một thế hệ dễ dàng sinh sản hơn |
--off-peak | Sử dụng giá thấp điểm khi có sẵn |
--audio / --no-audio | Bật hoặc tắt tính năng tạo âm thanh trên các lệnh tạo được hỗ trợ |
--multi-shot / --no-multi-shot | Bật hoặc tắt chế độ chụp nhiều ảnh cho video |
--no-wait | Nộp hồ sơ và về ngay |
--timeout <sec> | Đặt thời gian chờ bỏ phiếu, mặc định là 300 giây |
--workspace-id <id> | Ghi đè không gian làm việc đang hoạt động cho một lệnh |
--trace-id <uuid> | Đính kèm UUIDv4 do người gọi cung cấp vào các yêu cầu API để gỡ lỗi và khả năng quan sát |
--idempotency-key <key> | Thử lại các yêu cầu tạo một cách an toàn mà không vô tình tạo ra các công việc bị tính phí trùng lặp |
Cờ nhập văn bản giờ đây dễ dàng tự động hóa hơn. --prompt, --text và --lyrics có thể chấp nhận chuỗi ký tự, đường dẫn tệp cục bộ hoặc - cho stdin:
Hướng dẫn tác nhân AI của bạn cách tạo phương tiện
Đây là lúc PixVerse CLI trở nên biến đổi thực sự. Vì các lệnh có thể trả về JSON có cấu trúc và sử dụng mã thoát xác định nên bất kỳ tác nhân AI nào có thể chạy lệnh shell đều có thể được dạy để tạo hình ảnh và video theo yêu cầu.
Đang cài đặt PixVerse Skills
PixVerse Skillslà thư viện kỹ năng có cấu trúc hướng dẫn các tác nhân cách sử dụng CLI một cách chính xác: cờ lệnh, ràng buộc mô hình, quy trình nhiều bước và xử lý lỗi mạnh mẽ.
Đối với Claude Code và các tác nhân khác hỗ trợ định dạng kỹ năng, hãy thêm trực tiếp các kỹ năng PixVerse:
Đối với Cursor, Claude Code, Codex và các khung tác nhân khác, kỹ năng này cải thiện độ tin cậy bằng cách đưa ra các ràng buộc rõ ràng cho tác nhân thay vì buộc nó phải suy ra chúng từ đầu.
PixVerse CLI cũng cung cấp một bản kê khai lệnh nhỏ gọn có thể đọc được bằng máy tại dist/capabilities.json, với nguồn công khai có sẵn dưới dạng capabilities.json trong kho lưu trữ GitHub. Tệp kê khai này mô tả các lệnh, cờ, mã thoát, kỳ vọng đầu ra của JSON và các danh mục hiệu ứng để nhân viên hỗ trợ có thể kiểm tra hợp đồng CLI mà không cần xóa văn bản trợ giúp.
Sau khi nhân viên hỗ trợ của bạn đã tải các kỹ năng PixVerse, bạn có thể đưa ra các hướng dẫn bằng ngôn ngữ tự nhiên như:
- “Tạo video demo sản phẩm dài 10 giây từ ảnh chụp màn hình này”
- “Tạo bốn biến thể của ảnh bìa blog này ở định dạng 16:9”
- “Hoạt hình hóa sơ đồ này thành clip giải thích dài 5 giây với âm thanh xung quanh”
- “Tạo ba clip quảng cáo 16:9 dài 8 giây với các chuyển động camera khác nhau”
Tác nhân sẽ dịch các hướng dẫn đó thành các lệnh CLI chính xác, phân tích đầu ra JSON, đồng thời xử lý việc thăm dò và tải xuống — không cần can thiệp thủ công.
Claude Code
Trong Claude Code, PixVerse CLI trở thành công cụ gốc mà tác nhân sử dụng một cách tự động. Sau khi tải các kỹ năng PixVerse, bạn có thể đưa trực tiếp việc tạo phương tiện vào bất kỳ tác vụ nào:
Claude Code sẽ gọi các lệnh CLI chính xác, phân tích URL hình ảnh từ phản hồi JSON và tải tệp xuống đường dẫn đã chỉ định của bạn - tất cả trong cùng một phiên nơi nó cũng đang viết mã của bạn.
Quy trình làm việc Claude Code điển hình:
Cursor
Người dùng Cursor có thể tải PixVerse Skills dưới dạng tệp ngữ cảnh dự án. Đặt các tệp kỹ năng có liên quan vào thư mục .cursor/ của bạn hoặc thêm chúng vào quy tắc không gian làm việc của bạn. Sau khi được tải, Cursor có nhận thức đầy đủ về mọi lệnh PixVerse CLI và có thể tạo phương tiện như một phần của bất kỳ tác vụ mã hóa nào.
Quy trình làm việc chung của Cursor: yêu cầu nhân viên tạo hình ảnh mô phỏng dựa trên thiết kế mà bạn đang xây dựng, sau đó sử dụng nó làm tài liệu tham khảo trực tiếp trong phiên IDE của bạn — mà không cần rời khỏi trình chỉnh sửa.
Codex và các agent khác
PixVerse CLI tương thích với bất kỳ tác nhân nào có thể thực thi các lệnh shell và phân tích JSON. Định dạng đầu ra có cấu trúc — tên trường nhất quán, mã lỗi có thể dự đoán và thông báo lỗi được phân tách bằng stderr — đảm bảo rằng ngay cả các tác nhân tạo tập lệnh đơn giản cũng có thể tích hợp việc tạo một cách đáng tin cậy.
Hợp đồng mã thoát giúp việc xử lý lỗi trở nên đơn giản:
| Mã | Ý nghĩa | Hành động của tác nhân |
|---|---|---|
| 0 | thành công | Phân tích đầu ra JSON |
| 1 | Lỗi chung | Kiểm tra stderr và thử lại với thông tin đầu vào đã được xác thực |
| 2 | Hết giờ | Thử lại với --timeout dài hơn |
| 3 | Xác thực đã hết hạn | Chạy lại pixverse auth login |
| 4 | Hết tín dụng | Kiểm tra số dư, thông báo cho người dùng |
| 5 | Thế hệ không thành công | Hãy thử các thông số khác nhau |
| 6 | Lỗi xác thực | Xem lại giá trị cờ |
Đường ống tự động hóa
Khi bạn hiểu các lệnh riêng lẻ, PixVerse CLI sẽ mở ra các quy trình công việc gồm nhiều bước mạnh mẽ chạy hoàn toàn mà không cần sự tương tác của người dùng.
Chuyển văn bản thành hình ảnh thành video
Một trong những quy trình hữu ích nhất: tạo hình ảnh có độ phân giải cao từ lời nhắc văn bản, sau đó tạo hoạt ảnh cho hình ảnh đó thành video.
Quy trình sản xuất video đầy đủ
Để có đầu ra được đánh bóng, tạo chuỗi với các bước xử lý hậu kỳ. Sử dụng --audio hoặc --no-audio khi bạn muốn âm thanh gốc trên các lệnh tạo video được hỗ trợ, sau đó sử dụng create voice cho âm thanh chuyển văn bản sang giọng nói và create music cho nội dung nhạc độc lập mà bạn sẽ kết hợp xuôi dòng:
Tạo hàng loạt
Đối với các quy trình nội dung yêu cầu nhiều biến thể, hãy chạy song song các công việc:
Cờ --no-wait gửi công việc và trả về ngay lập tức kèm theo ID nhiệm vụ, cho phép bạn gửi nhiều công việc trước khi bỏ phiếu. Với --no-wait --json, ghi lại ID tác vụ được trả về và giải quyết các tham số tạo để ghi nhật ký và tái tạo. Sử dụng --count <n> khi bạn muốn có nhiều biến thể từ một lời nhắc và sử dụng task status --ids theo lô khi bạn muốn có một phản hồi trạng thái cho một số công việc đang chạy. Lệnh pixverse task wait xử lý việc bỏ phiếu thích ứng cho bạn.
Định cấu hình mặc định
Nếu bạn thường xuyên sử dụng cùng một kiểu máy, chất lượng hoặc tỷ lệ khung hình, hãy đặt chúng làm mặc định để bạn không phải lặp lại cờ mỗi lần:
Cờ dòng lệnh luôn ghi đè các giá trị mặc định đã định cấu hình của bạn, do đó bạn vẫn giữ được sự linh hoạt hoàn toàn trong khi giảm sự lặp lại. Để tự động hóa dành riêng cho không gian làm việc, hãy thêm --workspace-id <id> vào lệnh khi bạn muốn ghi đè không gian làm việc đang hoạt động cho lần chạy đó.
Những gì bạn có thể xây dựng
Với PixVerse CLI được tích hợp vào workflow agent của bạn, phạm vi tác vụ có thể tự động hóa sẽ mở rộng đáng kể:
- Tài liệu— tự động tạo video giới thiệu sản phẩm và ảnh chụp màn hình như một phần của quá trình xây dựng tài liệu của bạn
- Tiếp thị— chạy các công việc hàng loạt hàng đêm để tạo ra các biến thể nội dung trên mạng xã hội từ một thư viện lời nhắc duy nhất
- Phát triển ứng dụng— cho phép tác nhân mã hóa của bạn tạo hình ảnh giữ chỗ, hoạt ảnh mô phỏng hoặc tải video màn hình trong khi bạn xây dựng giao diện người dùng
- Quy trình làm việc về âm thanh— tạo bản nháp lồng tiếng, bản nhạc gợi ý hoặc nội dung âm thanh để chỉnh sửa sau này
- Quy trình nội dung— gọi CLI theo chuỗi bằng các công cụ khác (ffmpeg, ImageMagick, lưu trữ đám mây) để xây dựng quy trình sản xuất phương tiện hoàn toàn tự động
- Tạo nguyên mẫu— tạo ra các ý tưởng chuyển động nhanh trong vài giây để xác thực các ý tưởng trước khi đưa vào sản xuất hoàn chỉnh
CLI được thiết kế để phù hợp một cách tự nhiên với mọi quy trình làm việc dựa trên shell. Nếu quá trình tự động hóa hiện tại của bạn chạy trong bash, Python, Node hoặc đường dẫn CI/CD, thì PixVerse CLI sẽ đưa vào mà không cần bất kỳ chi phí tích hợp bổ sung nào.
Danh sách kiểm tra bắt đầu
- Cài đặt Node.js 20 trở lên
- Chạy
npm install -g pixverse - Chạy
pixverse auth loginvà ủy quyền trong trình duyệt - Chạy
pixverse account infođể xác minh tín dụng - Chạy
pixverse account slotstrước khi thực hiện thao tác hàng loạt đồng thời - Tạo hình ảnh đầu tiên của bạn:
pixverse create image --prompt "..." --json - Tạo video đầu tiên của bạn:
pixverse create video --prompt "..." --json - Tạo nội dung giọng nói đầu tiên của bạn:
pixverse create voice --text "..." --json - Tạo nội dung âm nhạc đầu tiên của bạn:
pixverse create music --prompt "..." --json - Khám phá các mẫu với
pixverse template list - Cài đặt PixVerse Skills cho agent của bạn (Claude Code, Cursor hoặc Codex)
- Thiết lập các giá trị mặc định ưa thích của bạn với
pixverse config defaults set - Xây dựng quy trình tự động hóa đầu tiên của bạn
Luôn cập nhật CLI
Sử dụng trình cập nhật tích hợp để cập nhật CLI cục bộ của bạn:
Bạn cũng có thể sử dụng npm trực tiếp:
Để biết các thay đổi ở cấp độ phát hành và các mẫu mới được hỗ trợ, hãy kiểm tra các nguồn CLI chính thức:
Các tài liệu hiện tại nêu bật PixVerse V6 là mô hình video mặc định, GPT Image 2 là mô hình hình ảnh mặc định, hỗ trợ Seedance 2.0 Mini, quy trình làm việc PixVerse v5 và v5.5 theo chế độ cụ thể, các lệnh create voice và create music chuyên dụng, quản lý nội dung âm thanh, thư mục đã lưu, chuyển đổi không gian làm việc, config defaults, capabilities.json dành cho agent, pixverse update, hỗ trợ stdin cho đầu vào văn bản, --trace-id và --idempotency-key để thử lại an toàn hơn.
Các bước tiếp theo
PixVerse CLI trên GitHub và npm (npm install -g pixverse) cho phép bạn truy cập ngay vào quá trình tạo, kiểm tra nhiệm vụ, quản lý nội dung, mẫu, thư mục đã lưu, kiểm tra tài khoản, khám phá mô hình âm thanh và điều khiển không gian làm việc từ một giao diện duy nhất. Kho lưu trữ PixVerse Skills bổ sung thêm hướng dẫn dành cho tác nhân để Claude Code, Cursor, Codex và các công cụ khác có thể chạy các quy trình công việc này với độ tin cậy cao hơn.
Sự kết hợp giữa CLI đáng tin cậy và thư viện kỹ năng sẵn sàng cho tác nhân có nghĩa là việc tạo hình ảnh, video, giọng nói và âm nhạc có thể hoạt động trong cùng một quy trình làm việc với mã của bạn — được quản lý bởi cùng một tác nhân, trong cùng một thiết bị đầu cuối mà không cần chuyển đổi công cụ.
Bắt đầu với một lệnh duy nhất. Xây dựng từ đó.