PixVerse CLI: สร้างวิดีโอและภาพ AI ในเทอร์มินัล

ติดตั้ง PixVerse CLI เพื่อสร้างวิดีโอ ภาพ เสียงพูด และเพลง AI ในเทอร์มินัล พร้อมทำเวิร์กโฟลว์เอเจนต์อัตโนมัติด้วย JSON

Product Update
PixVerse CLI: สร้างวิดีโอและภาพ AI ในเทอร์มินัล

บทนำ

ขั้นตอนการทำงานสร้างสรรค์ทุกอย่างมีปัญหาคอขวด เมื่อคุณต้องออกจากโปรแกรมแก้ไขโค้ด เปิดเบราว์เซอร์ และคลิกด้วยตนเองผ่านอินเทอร์เฟซเว็บเพื่อสร้างสื่อ สำหรับนักพัฒนา ตัวแทน AI และใครก็ตามที่สร้างไปป์ไลน์เนื้อหาอัตโนมัติ การสลับบริบทนั้นถือเป็นอุปสรรคที่เพิ่มมากขึ้นอย่างรวดเร็ว

PixVerse CLIขจัดปัญหาคอขวดนั้น เป็นอินเทอร์เฟซบรรทัดคำสั่งอย่างเป็นทางการสำหรับ PixVerse ทำให้คุณสามารถเข้าถึงเวิร์กโฟลว์การสร้างและพื้นที่ทำงาน PixVerse ได้โดยตรงจากเทอร์มินัลของคุณ ข้อความเป็นวิดีโอ รูปภาพเป็นวิดีโอ ข้อความเป็นรูปภาพ รูปภาพเป็นรูปภาพ การเปลี่ยน การสร้างเสียง การสร้างเพลง วิดีโออ้างอิง การควบคุมการเคลื่อนไหว เทมเพลต การลดขนาด และการจัดการสินทรัพย์ ล้วนเป็นสคริปต์ สามารถไปป์ได้ และพร้อมใช้งานโดยไม่ต้องแตะเบราว์เซอร์

สิ่งที่ทำให้ PixVerse CLI มีประโยชน์อย่างยิ่งคือปรัชญาการออกแบบ: สร้างขึ้นโดยคำนึงถึงตัวแทน AI คำสั่งสามารถส่งคืน JSON ที่มีโครงสร้างด้วย --json หรือ -p รหัสทางออกถูกกำหนดไว้ และทุกขั้นตอนไปป์ไลน์สามารถประกอบได้ ซึ่งหมายความว่าคุณสามารถสอน Claude Code, Cursor, Codex หรือตัวแทนอื่น ๆ เพื่อสร้างภาพ วิดีโอ เสียง และเพลงในนามของคุณได้ด้วยแฮนด์ออฟที่เปราะบางน้อยลง

คู่มือนี้สอดคล้องกับ PixVerseAI/cli GitHub README ในปัจจุบันและ [รายการความสามารถ] (https://github.com/PixVerseAI/cli/blob/main/capabilities.json) สาธารณะในปัจจุบัน ซึ่งตรวจสอบเมื่อวันที่ 29 มิถุนายน 2026 ความพร้อมใช้งานของโมเดล โมเดลเริ่มต้น และแฟล็กคำสั่งสามารถเปลี่ยนแปลงได้เร็วกว่าบทช่วยสอนที่ใช้งานตลอด ดังนั้นสคริปต์ที่ใช้งานจริงจึงควรตรวจสอบ pixverse --version, pixverse create <mode> --help และ pixverse update ก่อนที่จะรันเป็นกลุ่มจำนวนมาก

ข้อกำหนดเบื้องต้น

ก่อนที่จะเริ่ม คุณต้องมี:

  • Node.js 20 หรือสูงกว่า— ตรวจสอบกับ node --version
  • บัญชี PixVerse— ลงทะเบียนที่ pixverse.ai
  • การสมัครสมาชิก PixVerse ที่ใช้งานได้— CLI ใช้ระบบเครดิตเดียวกันกับเว็บไซต์ เฉพาะผู้ใช้ที่สมัครเป็นสมาชิกเท่านั้นที่สามารถสร้างเนื้อหาได้

PixVerse CLI ไม่จำเป็นต้องคัดลอกคีย์ API ใด ๆ ด้วยตนเอง การรับรองความถูกต้องได้รับการจัดการผ่านโฟลว์ OAuth บนเบราว์เซอร์ซึ่งจัดเก็บโทเค็นของคุณไว้ในเครื่อง

ขั้นตอนที่ 1: ติดตั้ง CLI

ติดตั้งทั่วโลกด้วย npm:

npm install -g pixverse

ตรวจสอบการติดตั้ง:

pixverse --version

หากคุณไม่ต้องการติดตั้งแบบโกลบอล คุณสามารถรันคำสั่งผ่าน npx ได้:

npx pixverse create video --prompt "A cat walking on Mars"

ขั้นตอนที่ 2: ตรวจสอบสิทธิ์

รันคำสั่งเข้าสู่ระบบ:

pixverse auth login

CLI เปิดเบราว์เซอร์สำหรับการอนุญาตอุปกรณ์ OAuth คุณยังสามารถคัดลอก URL และทำการอนุญาตให้เสร็จสิ้นจากเบราว์เซอร์ใดก็ได้บนอุปกรณ์ใดก็ได้ ซึ่งมีประโยชน์สำหรับ SSH และสภาพแวดล้อมที่ไม่มีส่วนหัว โทเค็นของคุณจะถูกจัดเก็บโดยอัตโนมัติใน ~/.pixverse/ และมีอายุ 30 วัน

เพื่อยืนยันว่าคุณได้เข้าสู่ระบบและตรวจสอบเครดิตที่มีอยู่ของคุณ:

pixverse auth status pixverse account info pixverse account slots

คำสั่ง account info แสดงระดับการสมัครสมาชิก เครดิตพื้นที่ทำงาน และบริบทการใช้งานของคุณ pixverse account usage ช่วยคุณตรวจสอบการใช้เครดิต ในขณะที่ pixverse account slots แสดงช่องการสร้างพร้อมกันในปัจจุบันสำหรับงานรูปภาพและวิดีโอ เซสชัน CLI ไม่ขึ้นอยู่กับเซสชันเว็บ/แอป PixVerse และคุณสามารถลบโทเค็น CLI ที่เก็บไว้ด้วย pixverse auth logout ได้ ตรวจสอบยอดเงินคงเหลือและช่องว่างของคุณก่อนรันงานแบบแบตช์เสมอ

คำสั่งเริ่มต้นอย่างรวดเร็ว

หากคุณต้องการเพียงเส้นทางที่สั้นที่สุดจากการติดตั้งไปยังสินทรัพย์ที่สร้างขึ้น ให้เริ่มต้นด้วยลำดับนี้:

npm install -g pixverse
pixverse auth login
pixverse create image --prompt "A photorealistic forest path at golden hour" --json
pixverse create video --prompt "A sunset over ocean waves" --model v6 --quality 720p --duration 5 --json

สำหรับเอเจนต์และเวิร์กโฟลว์ CI ให้เปิดใช้งาน --json หรือ -p ไว้เพื่อให้ stdout ยังคงสามารถอ่านด้วยเครื่องได้ ในขณะที่ความคืบหน้าและข้อผิดพลาดยังคงอยู่ใน stderr สำหรับการลองการผลิตใหม่ ให้เพิ่ม --idempotency-key <key> ลงในคำสั่งการสร้าง เพื่อให้การส่งซ้ำไม่สร้างงานที่เรียกเก็บเงินซ้ำโดยไม่ได้ตั้งใจ

ขั้นตอนที่ 3: สร้างภาพแรกของคุณ

การสร้างข้อความเป็นรูปภาพเป็นวิธีที่เร็วที่สุดในการทดสอบการตั้งค่าของคุณ วิ่ง:

pixverse create image --prompt "A photorealistic forest path at golden hour" --json

GitHub README ปัจจุบันแสดงรายการ GPT Image 2 เป็นโมเดลรูปภาพเริ่มต้น สำหรับการทำงานอัตโนมัติที่ทำซ้ำได้ ให้ตั้งค่า --model ไว้อย่างชัดเจน และตรวจสอบวิธีใช้ CLI แบบสดหรือ capabilities.json ก่อนการทำงานเป็นชุด ธง --json ส่งคืนเอาต์พุตที่มีโครงสร้าง:

{ "image_id": 789012, "status": "completed", "image_url": "https://...", "prompt": "A photorealistic forest path at golden hour", "model": "gpt-image-2.0", "width": 1440, "height": 1440 }

สำหรับเอาต์พุตที่มีความละเอียดสูงกว่า ให้ระบุรุ่นที่รองรับ:

pixverse create image \ --prompt "A photorealistic forest path at golden hour" \ --model seedream-5.0-lite \ --quality 2160p \ --aspect-ratio 16:9 \ --json

PixVerse รองรับโมเดลรูปภาพหลายรุ่น โดยแต่ละรุ่นมีเพดานความละเอียดที่แตกต่างกันและการรองรับอัตราส่วนภาพ:

รุ่น--model valueคุณภาพหมายเหตุ
GPT Image 2gpt-image-2.01080p, 1440p, 2160pโมเดลรูปภาพเริ่มต้น รองรับอัตราส่วนภาพกว้างและสูง
Nano Banana 2gemini-3.1-flash512p, 1080p, 1440p, 2160pauto ที่ยืดหยุ่นและอัตราส่วนภาพมาตรฐาน
Qwen Imageqwen-image720p, 1080pรุ่นที่รวดเร็วสำหรับงานสร้างสรรค์ทั่วไป
Nano Banana Progemini-3.01080p, 1440p, 2160pการสร้างภาพคุณภาพสูงในขนาดที่ใหญ่ขึ้น
Nano Bananagemini-2.5-flash1080pการสร้างภาพที่มีน้ำหนักเบาพร้อมการตอบสนองที่รวดเร็ว
Seedream 5.0 Liteseedream-5.0-lite1440p, 1800p, 2160pภาพสร้างสรรค์ที่มีรายละเอียดสูง
Seedream 4.5seedream-4.51440p, 2160pการสร้างภาพที่มีความละเอียดสูง
Seedream 4.0seedream-4.01080p, 1440p, 2160pตัวเลือก Seedream เพิ่มเติมสำหรับเวิร์กโฟลว์รูปภาพ
Kling Image O3kling-image-o31080p, 1440p, 2160pเอาท์พุตภาพมีสไตล์พร้อมกรอบที่ยืดหยุ่น
Kling Image V3kling-image-v31080p, 1440pคุณภาพและความเร็วที่สมดุล

คุณยังสามารถแปลงรูปภาพที่มีอยู่ด้วยรูปภาพเป็นรูปภาพ:

pixverse create image \ --prompt "Turn this product photo into a clean watercolor illustration" \ --image ./product-photo.png \ --model gpt-image-2.0 \ --json

หากต้องการดาวน์โหลดรูปภาพที่สร้างขึ้น:

pixverse asset download 789012

ขั้นตอนที่ 4: สร้างวิดีโอแรกของคุณ

การแปลงข้อความเป็นวิดีโอก็ทำงานในลักษณะเดียวกัน สร้างคลิป 5 วินาที:

pixverse create video --prompt "A sunset over ocean waves" --json

สำหรับรุ่นที่ปรับแต่งได้อย่างเต็มที่:

pixverse create video \ --prompt "A cinematic drone shot over a misty mountain valley at dawn" \ --model v6 \ --quality 1080p \ --aspect-ratio 16:9 \ --duration 8 \ --audio \ --json

ธง --audio เปิดใช้งานเสียงรอบข้างที่สร้างโดย AI ซึ่งตรงกับเนื้อหาวิดีโอของคุณ แฟล็ก --json จะส่งคืน video_url เมื่อเสร็จสิ้นซึ่งคุณสามารถส่งผ่านโดยตรงไปยังคำสั่งดาวน์โหลดหรือขั้นตอนถัดไปในไปป์ไลน์

PixVerse มีวิดีโอหลายรุ่นที่มีคุณภาพ ระยะเวลา และโหมดที่แตกต่างกัน:

รุ่น--model valueคุณภาพสูงสุดระยะเวลาหมายเหตุ
PixVerse V6v61080p1–15 วินาทีโมเดลวิดีโอเริ่มต้น การสนับสนุนอัตราส่วนกว้างยาว
PixVerse C1pixverse-c11080p1–15 วินาทีการสนับสนุนอย่างดีเยี่ยมสำหรับวิดีโอ ข้อมูลอ้างอิง และเวิร์กโฟลว์การเปลี่ยนแปลง
Seedance 2.0 Standardseedance-2.0-standard2160p4–15 วินาทีรองรับโหมดวิดีโอ ข้อมูลอ้างอิง และการเปลี่ยนภาพ
Seedance 2.0 Fastseedance-2.0-fast720p4–15 วินาทีตัวเลือก Seedance ที่เร็วขึ้นสำหรับวิดีโอ การอ้างอิง และโหมดการเปลี่ยนผ่าน
Seedance 2.0 Miniseedance-2.0-mini720p4–15 วินาทีตัวเลือก Seedance น้ำหนักเบาสำหรับวิดีโอ การอ้างอิง และโหมดการเปลี่ยนภาพ
Happy Horse 1.0happyhorse-1.01080p3–15 วินาทีตัวเลือกวิดีโอการรับรู้เสียงมีให้สำหรับ create video
Kling O3 Prokling-o3-pro720p3–15 วินาทีรองรับวิดีโอ ข้อมูลอ้างอิง และเวิร์กโฟลว์การเปลี่ยนแปลง
Kling O3 Standardkling-o3-standard720p3–15 วินาทีตัวเลือก Kling O3 มาตรฐาน
Kling 3.0 Prokling-3.0-pro720p3–15 วินาทีรองรับเวิร์กโฟลว์วิดีโอและการเปลี่ยนแปลง
Kling 3.0 Standardkling-3.0-standard720p3–15 วินาทีตัวเลือกมาตรฐาน Kling 3.0
Grok Imagine 1.5grok-imagine-1.5720p1–15 วินาทีรูปภาพต่อวิดีโอเท่านั้น ต้องใช้ --image และเป็นไปตามอัตราส่วนภาพของอินพุต
Grok Imaginegrok-imagine720p1–15 วินาทีตัวเลือก Grok ก่อนหน้า; รองรับวิดีโอ ขยาย และเวิร์กโฟลว์อ้างอิง
Veo 3.1 Liteveo-3.1-lite1080p4, 6 หรือ 8 วินาทีรองรับเวิร์กโฟลว์การเปลี่ยนวิดีโอและ 2 เฟรม
Veo 3.1 Standardveo-3.1-standard2160p4, 6 หรือ 8 วินาทีตัวเลือก Veo ที่มีความละเอียดสูงกว่า
Veo 3.1 Fastveo-3.1-fast2160p4, 6 หรือ 8 วินาทีตัวเลือก Veo ที่เร็วขึ้น
Sora 2 Prosora-2-pro1080p4, 8 หรือ 12 วินาทีตัวเลือก Sora ที่มีระยะเวลาคงที่
Sora 2sora-2720p4, 8 หรือ 12 วินาทีตัวเลือกโซระมาตรฐาน
PixVerse v5.6v5.61080p1–10 วินาทียังคงใช้สำหรับการควบคุมการเคลื่อนไหวและเวิร์กโฟลว์การสร้างที่เลือก
PixVerse v5.5v5.51080p1–10 วินาทีใช้สำหรับเวิร์กโฟลว์ create modify
PixVerse v5v51080p1–10 วินาทีใช้สำหรับเวิร์กโฟลว์การเปลี่ยนเฟรม 3+

ทำให้ภาพนิ่งเคลื่อนไหว

หากต้องการเปลี่ยนภาพถ่ายหรือรูปภาพที่สร้างขึ้นให้เป็นวิดีโอ ให้ระบุธง --image:

pixverse create video \ --prompt "Gentle wind moves through the scene" \ --image ./product-photo.jpg \ --model v6 \ --quality 1080p \ --json

คุณสามารถส่งเส้นทางไฟล์ในเครื่องหรือ URL ได้ ไฟล์ในเครื่องจะถูกอัปโหลดโดยอัตโนมัติ — ไม่ต้องมีขั้นตอนการอัปโหลดด้วยตนเอง อินพุตรูปภาพในเครื่องที่ใหญ่กว่า 1920x1920 หรือ 5MB จะถูกปรับขนาดหรือบีบอัดโดยอัตโนมัติก่อนอัปโหลด URL รูปภาพระยะไกลได้รับการตรวจสอบโดยแบ็กเอนด์ตามที่เป็นอยู่

สำหรับ Grok Imagine 1.5 จำเป็นต้องมีรูปภาพและอัตราส่วนเอาต์พุตจะเป็นไปตามรูปภาพนั้น:

pixverse create video \ --prompt "Slow camera push-in, subtle fabric motion, clean native ambience" \ --image ./campaign-poster.png \ --model grok-imagine-1.5 \ --quality 720p \ --duration 6 \ --json

ใช้การอ้างอิง การเปลี่ยน การควบคุมการเคลื่อนไหว และเทมเพลต

CLI ปัจจุบันรองรับมากกว่าข้อความเป็นวิดีโอและรูปภาพเป็นวิดีโอธรรมดา โหมดการสร้างเหล่านี้มีประโยชน์เมื่อคุณต้องการควบคุมอักขระ คีย์เฟรม การแก้ไข หรือเอฟเฟกต์เพิ่มเติม:

# Create a transition between keyframes pixverse create transition --images ./frame1.png ./frame2.png # สร้างเสียงพูดจากข้อความ pixverse create voice --text "Welcome to the launch" --voice-id <preset_voice_id> --output ./voiceover.mp3 # สร้างเพลงจากพรอมต์ pixverse create music --prompt "A cinematic synth-pop intro with bright percussion" --auto-lyrics pixverse create music --prompt "Uplifting piano theme for a product reveal" --instrumental --duration-seconds 60 # ขยายวิดีโอที่สร้างขึ้น pixverse create extend --video <video_id> # แก้ไขวิดีโอที่มีอยู่ pixverse create modify --video <video_id> --prompt "Change the background to a beach" # ความละเอียดวิดีโอระดับสูง pixverse create upscale --video <video_id> --quality 1080p # สร้างวิดีโอพร้อมรูปภาพอ้างอิง pixverse create reference --images ./char1.png ./char2.png --prompt "Two friends walking in a park" # การอ้างอิง Seedance 2.0 สามารถผสมอินพุตรูปภาพและวิดีโอได้ pixverse create reference \ --model seedance-2.0-standard \ --images ./character.png \ --videos ./motion.mp4 \ --prompt "@image1 follows the motion in @video1" # รุ่น Seedance 2.0 รองรับรูปภาพอ้างอิงได้สูงสุด 9 รูป pixverse create reference \ --model seedance-2.0-standard \ --images ./char1.png ./char2.png ./char3.png ./char4.png \ --prompt "@image1 and @image2 walk through the scene together" # การควบคุมการเคลื่อนไหวด้วยภาพตัวละครและวิดีโออ้างอิงการเคลื่อนไหว pixverse create motion-control --image ./character.png --video ./dance.mp4 # สร้างจากเทมเพลตหรือเอฟเฟกต์ pixverse create template --template-id 12345 --image ./photo.png

ไม่ใช่ทุกรุ่นที่รองรับโหมดการสร้างทุกโหมด ในเมทริกซ์ README ปัจจุบัน create video รองรับ v6, pixverse-c1, Seedance 2.0 Standard/Fast/Mini, Happy Horse 1.0, Kling O3, Kling 3.0, Grok Imagine, Veo 3.1, Sora 2 และ v5.6 grok-imagine-1.5 เป็นภาพต่อวิดีโอเท่านั้น และต้องใช้ --image create extend รองรับ v6 และ grok-imagine; create reference รองรับ v6, pixverse-c1, Seedance 2.0 Standard/Fast/Mini, Kling O3, grok-imagine และ v5.6; การเปลี่ยนภาพแบบ 2 เฟรมรองรับตระกูลวิดีโอรุ่นใหม่ การเปลี่ยนเฟรม 3+ เฟรมใช้ v5; create modify ใช้ v5.5; และ create motion-control ใช้ v5.6.

ขั้นตอนที่ 5: สร้างเสียงและดนตรี

GitHub README ในปัจจุบันจัดทำเอกสารเสียงแบบสแตนด์อโลนผ่านคำสั่งการสร้างเฉพาะ ใช้ create voice สำหรับการอ่านออกเสียงข้อความ และ create music สำหรับการสร้างข้อความพร้อมท์เป็นเสียงเพลง เอาต์พุตเสียงและเสียงเพลงจะถูกบันทึกเป็นเนื้อหาเสียง ดังนั้นคุณจึงสามารถติดตามด้วย task แสดงรายการด้วย asset list --type audio และดาวน์โหลดด้วย asset download --type audio สำหรับบรรยากาศวิดีโอเนทิฟ ให้ใช้ --audio หรือ --no-audio กับคำสั่งการสร้างวิดีโอที่รองรับ

สร้างเสียงพูด:

pixverse create voice \ --text "Welcome to the launch. Here is what changed this week." \ --model speech-2.8-hd \ --voice-id <preset_voice_id> \ --output ./voiceover.mp3 \ --json

เรียกดูโมเดลเสียงและเสียงที่ตั้งไว้ล่วงหน้า:

pixverse voice models --json pixverse voice presets --model speech-2.8-hd --json

สร้างเพลง:

pixverse create music \ --prompt "A bright cinematic synth-pop track for a 30-second product reveal" \ --auto-lyrics \ --duration-seconds 30 \ --json

สำหรับเพลงบรรเลง ให้ใช้ --instrumental สำหรับโมเดลที่มีความสามารถเนื้อเพลง ให้ส่งเนื้อเพลงเป็นข้อความตามตัวอักษร พาธของไฟล์ในเครื่อง หรือ stdin:

pixverse create music \ --prompt "Uplifting electronic pop with a confident chorus" \ --lyrics ./lyrics.txt \ --json

ตระกูลโมเดลเสียงในปัจจุบัน ได้แก่ รุ่น MiniMax Speech 2.8 และ ElevenLabs ตระกูลโมเดลเพลงในปัจจุบัน ได้แก่ MiniMax Music, ElevenLabs Music และ Google Lyria 3 Pro ใช้ pixverse voice models และ pixverse music models สำหรับแค็ตตาล็อกสดก่อนที่จะเขียนสคริปต์เวิร์กโฟลว์การผลิต

ขั้นตอนที่ 6: เรียกใช้ตัวช่วยสร้างแบบโต้ตอบ

หากคุณกำลังสำรวจเป็นครั้งแรกและยังไม่คุ้นเคยกับแฟล็กที่มีอยู่ทั้งหมด ให้รันคำสั่งการสร้างใดๆ โดยไม่มีอาร์กิวเมนต์เพื่อเข้าสู่วิซาร์ดที่แนะนำ:

pixverse create video pixverse create image

ตัวช่วยสร้างจะแนะนำคุณเกี่ยวกับข้อความแจ้ง การเลือกโมเดล คุณภาพ อัตราส่วนภาพ ระยะเวลา และตัวเลือกอื่นๆ ทีละขั้นตอน ซึ่งมีประโยชน์ในการค้นหาว่าพารามิเตอร์ใดบ้างที่พร้อมใช้งานก่อนที่จะเขียนสคริปต์

Beyond Generation: จัดการทรัพย์สินและพื้นที่ทำงานของคุณ

PixVerse CLI ปัจจุบันยังมีคำสั่งการจัดการที่ช่วยคุณสร้างเวิร์กโฟลว์เทอร์มินัลตั้งแต่ต้นทางถึงปลายทาง:

  • pixverse task status <id> และ pixverse task wait <id> สำหรับการโพลงาน
  • pixverse task status --ids 123,456,789 --type video --json สำหรับการตรวจสอบสถานะแบตช์
  • pixverse asset list, asset upload, asset info, asset download และ asset delete สำหรับการดำเนินงานวงจรชีวิตของสินทรัพย์วิดีโอ รูปภาพ และเสียง
  • pixverse saved list, saved items, saved new, saved rename, saved add, saved remove และ saved delete สำหรับโฟลเดอร์ที่บันทึกไว้
  • pixverse template categories, template list, template search และ template info สำหรับการค้นหาเอฟเฟกต์และเทมเพลต
  • pixverse voice models, voice presets และ music models สำหรับการค้นหาโมเดลเสียงสด
  • pixverse workspace list, workspace status, workspace switch และ workspace manage สำหรับการดำเนินงานหลายพื้นที่ทำงาน
  • pixverse account info, account usage และ account slots สำหรับการตรวจสอบเครดิต การใช้งาน และการทำงานพร้อมกัน
  • pixverse config set, config list, config path และ config defaults สำหรับค่าเริ่มต้นท้องถิ่นที่ทำซ้ำได้

สิ่งนี้ทำให้ตรงไปตรงมาไม่เพียงแต่สร้างอัตโนมัติเท่านั้น แต่ยังรวมถึงการจัดระเบียบ การค้นพบเทมเพลต การค้นพบเสียง ดาวน์โหลด การกำหนดเส้นทางพื้นที่ทำงาน และการส่งมอบในสคริปต์เดียว หากคุณต้องการรันหนึ่งคำสั่งกับเวิร์กสเปซอื่น ให้ใช้แฟล็ก --workspace-id <id> โกลบอล 0 กำหนดเป้าหมายพื้นที่ทำงานส่วนตัวของคุณ

ธงที่เป็นมิตรกับสคริปต์

ระบบอัตโนมัติส่วนใหญ่ขึ้นอยู่กับเอาต์พุตที่คาดการณ์ได้และพฤติกรรมรันไทม์ที่คาดการณ์ได้ แฟล็กเหล่านี้มีประโยชน์อย่างยิ่งในสคริปต์และเวิร์กโฟลว์ตัวแทน AI:

ธงใช้สำหรับ
--jsonส่งคืนเอาต์พุต JSON ที่มีโครงสร้าง
-pนามแฝงแบบสั้นสำหรับ --json
--count <n>สร้างรูปแบบ 1–4 รูปแบบจากคำขอเดียว
--seed <number>ทำให้รุ่นง่ายต่อการสืบพันธุ์
--off-peakใช้การกำหนดราคานอกช่วงสูงสุดเมื่อมี
--audio / --no-audioเปิดหรือปิดการสร้างเสียงด้วยคำสั่งการสร้างที่รองรับ
--multi-shot / --no-multi-shotเปิดหรือปิดโหมดมัลติช็อตสำหรับวิดีโอ
--no-waitส่งงานแล้วกลับทันที
--timeout <sec>ตั้งค่าการหมดเวลาการโพล โดยค่าเริ่มต้นเป็น 300 วินาที
--workspace-id <id>แทนที่พื้นที่ทำงานที่ใช้งานอยู่สำหรับคำสั่งเดียว
--trace-id <uuid>แนบ UUIDv4 ที่ผู้โทรส่งมากับคำขอ API สำหรับการดีบักและความสามารถในการสังเกต
--idempotency-key <key>ลองส่งคำขอสร้างอีกครั้งอย่างปลอดภัยโดยไม่สร้างงานที่เรียกเก็บเงินซ้ำโดยไม่ได้ตั้งใจ

ตอนนี้การตั้งค่าสถานะการป้อนข้อความทำให้ง่ายขึ้นโดยอัตโนมัติ --prompt, --text และ --lyrics สามารถยอมรับสตริงตัวอักษร พาธของไฟล์ในเครื่อง หรือ - สำหรับ stdin:

pixverse create video --prompt ./scene.txt --json cat scene.txt | pixverse create image --prompt - --json echo "Hello from the command line" | pixverse create voice --text - --json pixverse create music --prompt "Bright synth-pop" --lyrics ./lyrics.txt --json

การสอนตัวแทน AI ของคุณให้สร้างสื่อ

นี่คือจุดที่ PixVerse CLI กลายเป็นการเปลี่ยนแปลงอย่างแท้จริง เนื่องจากคำสั่งสามารถส่งคืน JSON ที่มีโครงสร้าง และใช้โค้ดทางออกที่กำหนดได้ เอเจนต์ AI ใดๆ ที่สามารถรันคำสั่งเชลล์จึงสามารถสอนให้สร้างรูปภาพและวิดีโอได้ตามต้องการ

การติดตั้ง PixVerse Skills

PixVerse Skillsเป็นไลบรารีทักษะที่มีโครงสร้างซึ่งสอนตัวแทนถึงวิธีใช้ CLI อย่างถูกต้อง: แฟล็กคำสั่ง ข้อจำกัดของโมเดล ไปป์ไลน์แบบหลายขั้นตอน และการจัดการข้อผิดพลาดที่มีประสิทธิภาพ

สำหรับ Claude Code และเอเจนต์อื่นๆ ที่สนับสนุนรูปแบบทักษะ ให้เพิ่มทักษะ PixVerse โดยตรง:

npx skills add https://github.com/pixverseai/skills --skill pixverse-ai-image-and-video-generator

สำหรับ Cursor, Claude Code, Codex และเอเจนต์เฟรมเวิร์กอื่นๆ ทักษะนี้ปรับปรุงความน่าเชื่อถือโดยให้เอเจนต์มีข้อจำกัดที่ชัดเจน แทนที่จะบังคับให้เอเจนต์อนุมานตั้งแต่ต้น

นอกจากนี้ PixVerse CLI ยังจัดส่งรายการคำสั่งที่เครื่องอ่านได้ขนาดกะทัดรัดที่ dist/capabilities.json โดยมีแหล่งข้อมูลสาธารณะเป็น capabilities.json ในพื้นที่เก็บข้อมูล GitHub รายการนี้จะอธิบายคำสั่ง แฟล็ก รหัสทางออก ความคาดหวังเอาต์พุต JSON และหมวดหมู่เอฟเฟกต์ เพื่อให้เจ้าหน้าที่ตรวจสอบสัญญา CLI โดยไม่ต้องคัดลอกข้อความช่วยเหลือ

เมื่อตัวแทนของคุณโหลดทักษะ PixVerse แล้ว คุณสามารถให้คำแนะนำที่เป็นภาษาธรรมชาติได้ เช่น:

  • “สร้างวิดีโอสาธิตผลิตภัณฑ์ 10 วินาทีจากภาพหน้าจอนี้”
  • “สร้างภาพปกบล็อกนี้สี่รูปแบบในรูปแบบ 16:9”
  • “ทำให้แผนภาพนี้เป็นคลิปอธิบายความยาว 5 วินาทีพร้อมเสียงรอบข้าง”
  • “สร้างคลิปโปรโมต 8 วินาที 16:9 สามคลิปด้วยการเคลื่อนไหวของกล้องที่แตกต่างกัน”

เอเจนต์จะแปลคำสั่งเหล่านั้นเป็นคำสั่ง CLI ที่ถูกต้อง แยกวิเคราะห์เอาต์พุต JSON และจัดการการสำรวจและดาวน์โหลด โดยไม่จำเป็นต้องมีการแทรกแซงด้วยตนเอง

Claude Code

ใน Claude Code นั้น PixVerse CLI จะกลายเป็นเครื่องมือเนทิฟที่เอเจนต์ใช้โดยอัตโนมัติ หลังจากโหลดทักษะ PixVerse แล้ว คุณสามารถรวมการสร้างสื่อในงานใดๆ ได้โดยตรง:

Generate a cover image for this blog post about machine learning, use the seedream-5.0-lite model at 2160p in 16:9 format, download it to ./assets/cover.webp

Claude Code จะเรียกใช้คำสั่ง CLI ที่ถูกต้อง แยกวิเคราะห์ URL รูปภาพจากการตอบกลับของ JSON และดาวน์โหลดไฟล์ไปยังพาธที่คุณระบุ ทั้งหมดนี้อยู่ในเซสชันเดียวกับที่ไฟล์กำลังเขียนโค้ดของคุณด้วย

เวิร์กโฟลว์ Claude Code ทั่วไป:

# Claude Code runs this autonomously based on your instruction IMG=$(pixverse create image \ --prompt "Abstract visualization of neural network layers, dark background, blue and purple tones" \ --model seedream-5.0-lite \ --quality 2160p \ --aspect-ratio 16:9 \ --json | jq -r '.image_url') # จากนั้นทำให้เคลื่อนไหว pixverse create video \ --prompt "Slow pan across glowing neural connections" \ --image "$IMG" \ --model v6 \ --quality 1080p \ --duration 6 \ --json

Cursor

ผู้ใช้ Cursor สามารถโหลด PixVerse Skills เป็นไฟล์บริบทของโครงการได้ วางไฟล์ทักษะที่เกี่ยวข้องในไดเร็กทอรี .cursor/ ของคุณ หรือเพิ่มลงในกฎพื้นที่ทำงานของคุณ เมื่อโหลดแล้ว Cursor จะรับรู้ทุกคำสั่ง PixVerse CLI อย่างครบถ้วน และสามารถสร้างสื่อซึ่งเป็นส่วนหนึ่งของงานเขียนโค้ดใดๆ ได้

เวิร์กโฟลว์ทั่วไปของ Cursor: ขอให้ตัวแทนสร้างภาพจำลองตามการออกแบบที่คุณกำลังสร้าง จากนั้นใช้เป็นข้อมูลอ้างอิงโดยตรงในเซสชัน IDE ของคุณ โดยไม่ต้องออกจากโปรแกรมแก้ไข

Codex และตัวแทนอื่นๆ

PixVerse CLI เข้ากันได้กับเอเจนต์ใดๆ ที่สามารถดำเนินการคำสั่งเชลล์และแยกวิเคราะห์ JSON รูปแบบเอาต์พุตที่มีโครงสร้าง — ชื่อฟิลด์ที่สอดคล้องกัน รหัสข้อผิดพลาดที่คาดเดาได้ และข้อความแสดงข้อผิดพลาดที่แยกออกจาก stderr ช่วยให้มั่นใจได้ว่าแม้แต่เอเจนต์การเขียนสคริปต์ธรรมดาก็สามารถบูรณาการการสร้างได้อย่างน่าเชื่อถือ

สัญญารหัสทางออกทำให้การจัดการข้อผิดพลาดตรงไปตรงมา:

รหัสความหมายการกระทำของตัวแทน
0ความสำเร็จแยกเอาต์พุต JSON
1ข้อผิดพลาดทั่วไปตรวจสอบ stderr และลองอีกครั้งโดยใช้อินพุตที่ได้รับการตรวจสอบแล้ว
2หมดเวลาลองอีกครั้งด้วย --timeout ที่ยาวขึ้น
3การตรวจสอบสิทธิ์หมดอายุแล้วรัน pixverse auth login อีกครั้ง
4เครดิตหมดตรวจสอบยอดเงิน แจ้งผู้ใช้
5การสร้างล้มเหลวลองใช้พารามิเตอร์อื่น
6ข้อผิดพลาดในการตรวจสอบตรวจสอบค่าแฟล็ก

ท่อส่งอัตโนมัติ

เมื่อคุณเข้าใจแต่ละคำสั่งแล้ว PixVerse CLI จะปลดล็อกเวิร์กโฟลว์หลายขั้นตอนอันทรงพลังที่ทำงานทั้งหมดโดยไม่ต้องโต้ตอบกับผู้ใช้

ข้อความเป็นรูปภาพเป็นวิดีโอ

ไปป์ไลน์ที่มีประโยชน์ที่สุดอย่างหนึ่ง: สร้างภาพที่มีความละเอียดสูงจากข้อความแจ้ง จากนั้นทำให้เคลื่อนไหวเป็นวิดีโอ

# Step 1: Generate a base image IMG_RESULT=$(pixverse create image \ --prompt "A cyberpunk cityscape at night, neon lights reflecting on wet pavement" \ --model gemini-3.1-flash \ --quality 2160p \ --aspect-ratio 16:9 \ --json) IMAGE_URL=$(echo "$IMG_RESULT" | jq -r '.image_url') # ขั้นตอนที่ 2: ทำให้เคลื่อนไหวเป็นวิดีโอ VID_RESULT=$(pixverse create video \ --prompt "Camera slowly pans across the neon-lit streets" \ --image "$IMAGE_URL" \ --model v6 \ --quality 1080p \ --duration 8 \ --json) VIDEO_ID=$(echo "$VID_RESULT" | jq -r '.video_id') # ขั้นตอนที่ 3: ดาวน์โหลดวิดีโอสุดท้าย pixverse asset download "$VIDEO_ID" --json

ขั้นตอนการผลิตวิดีโอเต็มรูปแบบ

สำหรับเอาต์พุตที่สวยงาม การสร้างลูกโซ่พร้อมขั้นตอนหลังการประมวลผล ใช้ --audio หรือ --no-audio เมื่อคุณต้องการเสียงเนทีฟในคำสั่งการสร้างวิดีโอที่รองรับ จากนั้นใช้ create voice สำหรับเสียงการแปลงข้อความเป็นคำพูด และ create music สำหรับเนื้อหาเพลงแบบสแตนด์อโลนที่คุณจะรวมดาวน์สตรีม:

# Step 1: Create the base video RESULT=$(pixverse create video \ --prompt "A product being assembled in slow motion" \ --model v6 \ --quality 720p \ --duration 5 \ --audio \ --json) VID=$(echo "$RESULT" | jq -r '.video_id') # ขั้นตอนที่ 2: ขยายระยะเวลา EXTENDED=$(pixverse create extend \ --video "$VID" \ --json | jq -r '.video_id') pixverse task wait "$EXTENDED" --json # ขั้นตอนที่ 3: เพิ่มสเกลเป็น 1080p FINAL=$(pixverse create upscale \ --video "$EXTENDED" \ --quality 1080p \ --json | jq -r '.video_id') pixverse task wait "$FINAL" --json # ขั้นตอนที่ 4: ดาวน์โหลด pixverse asset download "$FINAL" --json # ทางเลือก: สร้างเนื้อหาการพากย์เสียงแยกต่างหาก pixverse create voice \ --text "The final reveal starts now." \ --voice-id <preset_voice_id> \ --output ./voiceover.mp3 \ --json

การสร้างแบทช์

สำหรับไปป์ไลน์เนื้อหาที่ต้องใช้หลายรูปแบบ ให้รันงานแบบขนาน:

# Check credits and concurrent generation slots first pixverse account info --json pixverse account slots --json # ส่งสี่รุ่นคู่ขนาน pixverse create video --prompt "Sunrise over mountains" --no-wait --json > /tmp/v1.json & pixverse create video --prompt "Sunset over ocean" --no-wait --json > /tmp/v2.json & pixverse create video --prompt "Stars over a desert" --no-wait --json > /tmp/v3.json & pixverse create video --prompt "Aurora over a frozen lake" --no-wait --json > /tmp/v4.json & wait # ตรวจสอบ ID งานที่ส่งคืนทั้งหมดในการเรียกสถานะแบตช์ครั้งเดียว IDS=$(jq -r '.video_id' /tmp/v1.json /tmp/v2.json /tmp/v3.json /tmp/v4.json | paste -sd, -) pixverse task status --ids "$IDS" --type video --json # รอแต่ละอันแล้วดาวน์โหลด for f in /tmp/v1.json /tmp/v2.json /tmp/v3.json /tmp/v4.json; do ID=$(jq -r '.video_id' "$f") pixverse task wait "$ID" --json pixverse asset download "$ID" --json done

แฟล็ก --no-wait จะส่งงานและส่งคืนทันทีพร้อมรหัสงาน ช่วยให้คุณสามารถส่งงานหลายรายการก่อนโพลได้ ด้วย --no-wait --json บันทึก ID งานที่ส่งคืนและพารามิเตอร์การสร้างที่แก้ไขแล้วสำหรับการบันทึกและความสามารถในการทำซ้ำ ใช้ --count <n> เมื่อคุณต้องการหลายรูปแบบจากพรอมต์เดียว และใช้ชุด task status --ids เมื่อคุณต้องการการตอบสนองสถานะเดียวสำหรับงานที่รันอยู่หลายงาน คำสั่ง pixverse task wait จัดการการโพลแบบปรับได้สำหรับคุณ

การกำหนดค่าเริ่มต้น

หากคุณใช้รุ่น คุณภาพ หรืออัตราส่วนภาพเดียวกันเป็นประจำ ให้ตั้งค่าเป็นค่าเริ่มต้น เพื่อที่คุณจะได้ไม่ต้องแฟล็กซ้ำทุกครั้ง:

pixverse config defaults set video model v6 pixverse config defaults set video quality 1080p pixverse config defaults set image model seedream-5.0-lite pixverse config set output-dir ~/Downloads/pixverse pixverse config defaults show pixverse config list pixverse config path

ธงบรรทัดคำสั่งจะแทนที่ค่าเริ่มต้นที่คุณกำหนดไว้เสมอ ดังนั้นคุณจึงยังคงความยืดหยุ่นอย่างเต็มที่ในขณะที่ลดการทำซ้ำ สำหรับการทำงานอัตโนมัติเฉพาะพื้นที่ทำงาน ให้เพิ่ม --workspace-id <id> ให้กับคำสั่งเมื่อคุณต้องการแทนที่พื้นที่ทำงานที่ใช้งานอยู่สำหรับการรันครั้งเดียวนั้น

สิ่งที่คุณสามารถสร้างได้

เมื่อรวม PixVerse CLI เข้ากับเวิร์กโฟลว์ตัวแทนของคุณ ช่วงของงานอัตโนมัติจะขยายออกไปอย่างมาก:

  • เอกสารประกอบ— สร้างวิดีโอสาธิตผลิตภัณฑ์และภาพหน้าจอโดยอัตโนมัติโดยเป็นส่วนหนึ่งของกระบวนการสร้างเอกสารของคุณ
  • การตลาด— รันงานเป็นกลุ่มทุกคืนที่สร้างเนื้อหาโซเชียลมีเดียที่หลากหลายจากไลบรารีพร้อมท์เดียว
  • การพัฒนาแอป— ให้ตัวแทนการเขียนโค้ดของคุณสร้างภาพตัวยึดตำแหน่ง ภาพเคลื่อนไหวจำลอง หรือวิดีโอหน้าจอการโหลดในขณะที่คุณสร้าง UI
  • เวิร์กโฟลว์เสียง— สร้างเสียงพากย์แบบร่าง แทร็กพร้อมสำหรับเพลง หรือเนื้อหาเสียงสำหรับการแก้ไขในภายหลัง
  • ไปป์ไลน์เนื้อหา— เชื่อมโยงการเรียก CLI กับเครื่องมืออื่นๆ (ffmpeg, ImageMagick, ที่เก็บข้อมูลบนคลาวด์) เพื่อสร้างเวิร์กโฟลว์การผลิตสื่ออัตโนมัติเต็มรูปแบบ
  • การสร้างต้นแบบ— สร้างแนวคิดควิกโมชั่นในไม่กี่วินาทีเพื่อตรวจสอบความถูกต้องของแนวคิดก่อนที่จะดำเนินการผลิตเต็มรูปแบบ

CLI ได้รับการออกแบบเพื่อให้เข้ากับขั้นตอนการทำงานแบบเชลล์ได้อย่างเป็นธรรมชาติ หากระบบอัตโนมัติที่มีอยู่ของคุณทำงานใน bash, Python, Node หรือไปป์ไลน์ CI/CD PixVerse CLI จะเสียบเข้าโดยไม่มีค่าใช้จ่ายในการผสานรวมเพิ่มเติม

รายการตรวจสอบการเริ่มต้นใช้งาน

  • ติดตั้ง Node.js 20 หรือสูงกว่า
  • รัน npm install -g pixverse
  • เรียกใช้ pixverse auth login และอนุญาตในเบราว์เซอร์
  • เรียกใช้ pixverse account info เพื่อตรวจสอบเครดิต
  • รัน pixverse account slots ก่อนที่จะทำงานเป็นแบตช์พร้อมกัน
  • สร้างภาพแรกของคุณ: pixverse create image --prompt "..." --json
  • สร้างวิดีโอแรกของคุณ: pixverse create video --prompt "..." --json
  • สร้างเนื้อหาเสียงแรกของคุณ: pixverse create voice --text "..." --json
  • สร้างเนื้อหาเพลงแรกของคุณ: pixverse create music --prompt "..." --json
  • สำรวจเทมเพลตด้วย pixverse template list
  • ติดตั้ง PixVerse Skills สำหรับตัวแทนของคุณ (Claude Code, Cursor หรือ Codex)
  • ตั้งค่าเริ่มต้นที่คุณต้องการด้วย pixverse config defaults set
  • สร้างไปป์ไลน์อัตโนมัติแรกของคุณ

ทำให้ CLI เป็นปัจจุบันอยู่เสมอ

ใช้ตัวอัพเดตในตัวเพื่อให้ CLI ในเครื่องของคุณเป็นปัจจุบัน:

pixverse update

คุณยังสามารถใช้ npm ได้โดยตรง:

npm install -g pixverse@latest

สำหรับการเปลี่ยนแปลงระดับการเปิดตัวและรุ่นที่รองรับใหม่ ให้ตรวจสอบแหล่งที่มาอย่างเป็นทางการของ CLI:

เอกสารปัจจุบันเน้น PixVerse V6 เป็นโมเดลวิดีโอเริ่มต้น, GPT Image 2 เป็นโมเดลรูปภาพเริ่มต้น, รองรับ Seedance 2.0 Mini, เวิร์กโฟลว์ PixVerse v5 และ v5.5 เฉพาะโหมด, คำสั่ง create voice และ create music เฉพาะ, การจัดการสินทรัพย์เสียง, โฟลเดอร์ที่บันทึกไว้, การสลับพื้นที่ทำงาน, config defaults, capabilities.json สำหรับตัวแทน, pixverse update, รองรับ stdin สำหรับการป้อนข้อความ, --trace-id และ --idempotency-key เพื่อการลองใหม่ที่ปลอดภัยยิ่งขึ้น

ขั้นตอนต่อไป

PixVerse CLI บน GitHub และ npm (npm install -g pixverse) ช่วยให้คุณเข้าถึงการสร้าง การโพลงาน การจัดการสินทรัพย์ เทมเพลต โฟลเดอร์ที่บันทึกไว้ การตรวจสอบบัญชี การค้นพบโมเดลเสียง และการควบคุมพื้นที่ทำงานได้ทันทีจากอินเทอร์เฟซเดียว พื้นที่เก็บข้อมูล PixVerse Skills เพิ่มคำแนะนำที่พร้อมสำหรับตัวแทน ดังนั้น Claude Code, Cursor, Codex และเครื่องมืออื่นๆ สามารถรันเวิร์กโฟลว์เหล่านี้ด้วยความน่าเชื่อถือที่แข็งแกร่งยิ่งขึ้น

การผสมผสานระหว่าง CLI ที่เชื่อถือได้และคลังทักษะที่พร้อมใช้งานของตัวแทนหมายความว่าการสร้างภาพ วิดีโอ เสียง และเพลงสามารถอยู่ในขั้นตอนการทำงานเดียวกันกับโค้ดของคุณ ซึ่งจัดการโดยตัวแทนคนเดียวกัน ในเทอร์มินัลเดียวกัน โดยไม่ต้องเปลี่ยนเครื่องมือ

เริ่มต้นด้วยคำสั่งเดียว สร้างจากที่นั่น