PixVerse CLI: สร้างวิดีโอและภาพ AI ในเทอร์มินัล
ติดตั้ง PixVerse CLI เพื่อสร้างวิดีโอ ภาพ เสียงพูด และเพลง AI ในเทอร์มินัล พร้อมทำเวิร์กโฟลว์เอเจนต์อัตโนมัติด้วย JSON
บทนำ
ขั้นตอนการทำงานสร้างสรรค์ทุกอย่างมีปัญหาคอขวด เมื่อคุณต้องออกจากโปรแกรมแก้ไขโค้ด เปิดเบราว์เซอร์ และคลิกด้วยตนเองผ่านอินเทอร์เฟซเว็บเพื่อสร้างสื่อ สำหรับนักพัฒนา ตัวแทน AI และใครก็ตามที่สร้างไปป์ไลน์เนื้อหาอัตโนมัติ การสลับบริบทนั้นถือเป็นอุปสรรคที่เพิ่มมากขึ้นอย่างรวดเร็ว
PixVerse CLIขจัดปัญหาคอขวดนั้น เป็นอินเทอร์เฟซบรรทัดคำสั่งอย่างเป็นทางการสำหรับ PixVerse ทำให้คุณสามารถเข้าถึงเวิร์กโฟลว์การสร้างและพื้นที่ทำงาน PixVerse ได้โดยตรงจากเทอร์มินัลของคุณ ข้อความเป็นวิดีโอ รูปภาพเป็นวิดีโอ ข้อความเป็นรูปภาพ รูปภาพเป็นรูปภาพ การเปลี่ยน การสร้างเสียง การสร้างเพลง วิดีโออ้างอิง การควบคุมการเคลื่อนไหว เทมเพลต การลดขนาด และการจัดการสินทรัพย์ ล้วนเป็นสคริปต์ สามารถไปป์ได้ และพร้อมใช้งานโดยไม่ต้องแตะเบราว์เซอร์
สิ่งที่ทำให้ PixVerse CLI มีประโยชน์อย่างยิ่งคือปรัชญาการออกแบบ: สร้างขึ้นโดยคำนึงถึงตัวแทน AI คำสั่งสามารถส่งคืน JSON ที่มีโครงสร้างด้วย --json หรือ -p รหัสทางออกถูกกำหนดไว้ และทุกขั้นตอนไปป์ไลน์สามารถประกอบได้ ซึ่งหมายความว่าคุณสามารถสอน Claude Code, Cursor, Codex หรือตัวแทนอื่น ๆ เพื่อสร้างภาพ วิดีโอ เสียง และเพลงในนามของคุณได้ด้วยแฮนด์ออฟที่เปราะบางน้อยลง
คู่มือนี้สอดคล้องกับ PixVerseAI/cli GitHub README ในปัจจุบันและ [รายการความสามารถ] (https://github.com/PixVerseAI/cli/blob/main/capabilities.json) สาธารณะในปัจจุบัน ซึ่งตรวจสอบเมื่อวันที่ 29 มิถุนายน 2026 ความพร้อมใช้งานของโมเดล โมเดลเริ่มต้น และแฟล็กคำสั่งสามารถเปลี่ยนแปลงได้เร็วกว่าบทช่วยสอนที่ใช้งานตลอด ดังนั้นสคริปต์ที่ใช้งานจริงจึงควรตรวจสอบ pixverse --version, pixverse create <mode> --help และ pixverse update ก่อนที่จะรันเป็นกลุ่มจำนวนมาก
ข้อกำหนดเบื้องต้น
ก่อนที่จะเริ่ม คุณต้องมี:
- Node.js 20 หรือสูงกว่า— ตรวจสอบกับ
node --version - บัญชี PixVerse— ลงทะเบียนที่ pixverse.ai
- การสมัครสมาชิก PixVerse ที่ใช้งานได้— CLI ใช้ระบบเครดิตเดียวกันกับเว็บไซต์ เฉพาะผู้ใช้ที่สมัครเป็นสมาชิกเท่านั้นที่สามารถสร้างเนื้อหาได้
PixVerse CLI ไม่จำเป็นต้องคัดลอกคีย์ API ใด ๆ ด้วยตนเอง การรับรองความถูกต้องได้รับการจัดการผ่านโฟลว์ OAuth บนเบราว์เซอร์ซึ่งจัดเก็บโทเค็นของคุณไว้ในเครื่อง
ขั้นตอนที่ 1: ติดตั้ง CLI
ติดตั้งทั่วโลกด้วย npm:
ตรวจสอบการติดตั้ง:
หากคุณไม่ต้องการติดตั้งแบบโกลบอล คุณสามารถรันคำสั่งผ่าน npx ได้:
ขั้นตอนที่ 2: ตรวจสอบสิทธิ์
รันคำสั่งเข้าสู่ระบบ:
CLI เปิดเบราว์เซอร์สำหรับการอนุญาตอุปกรณ์ OAuth คุณยังสามารถคัดลอก URL และทำการอนุญาตให้เสร็จสิ้นจากเบราว์เซอร์ใดก็ได้บนอุปกรณ์ใดก็ได้ ซึ่งมีประโยชน์สำหรับ SSH และสภาพแวดล้อมที่ไม่มีส่วนหัว โทเค็นของคุณจะถูกจัดเก็บโดยอัตโนมัติใน ~/.pixverse/ และมีอายุ 30 วัน
เพื่อยืนยันว่าคุณได้เข้าสู่ระบบและตรวจสอบเครดิตที่มีอยู่ของคุณ:
คำสั่ง account info แสดงระดับการสมัครสมาชิก เครดิตพื้นที่ทำงาน และบริบทการใช้งานของคุณ pixverse account usage ช่วยคุณตรวจสอบการใช้เครดิต ในขณะที่ pixverse account slots แสดงช่องการสร้างพร้อมกันในปัจจุบันสำหรับงานรูปภาพและวิดีโอ เซสชัน CLI ไม่ขึ้นอยู่กับเซสชันเว็บ/แอป PixVerse และคุณสามารถลบโทเค็น CLI ที่เก็บไว้ด้วย pixverse auth logout ได้ ตรวจสอบยอดเงินคงเหลือและช่องว่างของคุณก่อนรันงานแบบแบตช์เสมอ
คำสั่งเริ่มต้นอย่างรวดเร็ว
หากคุณต้องการเพียงเส้นทางที่สั้นที่สุดจากการติดตั้งไปยังสินทรัพย์ที่สร้างขึ้น ให้เริ่มต้นด้วยลำดับนี้:
npm install -g pixverse
pixverse auth login
pixverse create image --prompt "A photorealistic forest path at golden hour" --json
pixverse create video --prompt "A sunset over ocean waves" --model v6 --quality 720p --duration 5 --jsonสำหรับเอเจนต์และเวิร์กโฟลว์ CI ให้เปิดใช้งาน --json หรือ -p ไว้เพื่อให้ stdout ยังคงสามารถอ่านด้วยเครื่องได้ ในขณะที่ความคืบหน้าและข้อผิดพลาดยังคงอยู่ใน stderr สำหรับการลองการผลิตใหม่ ให้เพิ่ม --idempotency-key <key> ลงในคำสั่งการสร้าง เพื่อให้การส่งซ้ำไม่สร้างงานที่เรียกเก็บเงินซ้ำโดยไม่ได้ตั้งใจ
ขั้นตอนที่ 3: สร้างภาพแรกของคุณ
การสร้างข้อความเป็นรูปภาพเป็นวิธีที่เร็วที่สุดในการทดสอบการตั้งค่าของคุณ วิ่ง:
GitHub README ปัจจุบันแสดงรายการ GPT Image 2 เป็นโมเดลรูปภาพเริ่มต้น สำหรับการทำงานอัตโนมัติที่ทำซ้ำได้ ให้ตั้งค่า --model ไว้อย่างชัดเจน และตรวจสอบวิธีใช้ CLI แบบสดหรือ capabilities.json ก่อนการทำงานเป็นชุด ธง --json ส่งคืนเอาต์พุตที่มีโครงสร้าง:
สำหรับเอาต์พุตที่มีความละเอียดสูงกว่า ให้ระบุรุ่นที่รองรับ:
PixVerse รองรับโมเดลรูปภาพหลายรุ่น โดยแต่ละรุ่นมีเพดานความละเอียดที่แตกต่างกันและการรองรับอัตราส่วนภาพ:
| รุ่น | --model value | คุณภาพ | หมายเหตุ |
|---|---|---|---|
| GPT Image 2 | gpt-image-2.0 | 1080p, 1440p, 2160p | โมเดลรูปภาพเริ่มต้น รองรับอัตราส่วนภาพกว้างและสูง |
| Nano Banana 2 | gemini-3.1-flash | 512p, 1080p, 1440p, 2160p | auto ที่ยืดหยุ่นและอัตราส่วนภาพมาตรฐาน |
| Qwen Image | qwen-image | 720p, 1080p | รุ่นที่รวดเร็วสำหรับงานสร้างสรรค์ทั่วไป |
| Nano Banana Pro | gemini-3.0 | 1080p, 1440p, 2160p | การสร้างภาพคุณภาพสูงในขนาดที่ใหญ่ขึ้น |
| Nano Banana | gemini-2.5-flash | 1080p | การสร้างภาพที่มีน้ำหนักเบาพร้อมการตอบสนองที่รวดเร็ว |
| Seedream 5.0 Lite | seedream-5.0-lite | 1440p, 1800p, 2160p | ภาพสร้างสรรค์ที่มีรายละเอียดสูง |
| Seedream 4.5 | seedream-4.5 | 1440p, 2160p | การสร้างภาพที่มีความละเอียดสูง |
| Seedream 4.0 | seedream-4.0 | 1080p, 1440p, 2160p | ตัวเลือก Seedream เพิ่มเติมสำหรับเวิร์กโฟลว์รูปภาพ |
| Kling Image O3 | kling-image-o3 | 1080p, 1440p, 2160p | เอาท์พุตภาพมีสไตล์พร้อมกรอบที่ยืดหยุ่น |
| Kling Image V3 | kling-image-v3 | 1080p, 1440p | คุณภาพและความเร็วที่สมดุล |
คุณยังสามารถแปลงรูปภาพที่มีอยู่ด้วยรูปภาพเป็นรูปภาพ:
หากต้องการดาวน์โหลดรูปภาพที่สร้างขึ้น:
ขั้นตอนที่ 4: สร้างวิดีโอแรกของคุณ
การแปลงข้อความเป็นวิดีโอก็ทำงานในลักษณะเดียวกัน สร้างคลิป 5 วินาที:
สำหรับรุ่นที่ปรับแต่งได้อย่างเต็มที่:
ธง --audio เปิดใช้งานเสียงรอบข้างที่สร้างโดย AI ซึ่งตรงกับเนื้อหาวิดีโอของคุณ แฟล็ก --json จะส่งคืน video_url เมื่อเสร็จสิ้นซึ่งคุณสามารถส่งผ่านโดยตรงไปยังคำสั่งดาวน์โหลดหรือขั้นตอนถัดไปในไปป์ไลน์
PixVerse มีวิดีโอหลายรุ่นที่มีคุณภาพ ระยะเวลา และโหมดที่แตกต่างกัน:
| รุ่น | --model value | คุณภาพสูงสุด | ระยะเวลา | หมายเหตุ |
|---|---|---|---|---|
| PixVerse V6 | v6 | 1080p | 1–15 วินาที | โมเดลวิดีโอเริ่มต้น การสนับสนุนอัตราส่วนกว้างยาว |
| PixVerse C1 | pixverse-c1 | 1080p | 1–15 วินาที | การสนับสนุนอย่างดีเยี่ยมสำหรับวิดีโอ ข้อมูลอ้างอิง และเวิร์กโฟลว์การเปลี่ยนแปลง |
| Seedance 2.0 Standard | seedance-2.0-standard | 2160p | 4–15 วินาที | รองรับโหมดวิดีโอ ข้อมูลอ้างอิง และการเปลี่ยนภาพ |
| Seedance 2.0 Fast | seedance-2.0-fast | 720p | 4–15 วินาที | ตัวเลือก Seedance ที่เร็วขึ้นสำหรับวิดีโอ การอ้างอิง และโหมดการเปลี่ยนผ่าน |
| Seedance 2.0 Mini | seedance-2.0-mini | 720p | 4–15 วินาที | ตัวเลือก Seedance น้ำหนักเบาสำหรับวิดีโอ การอ้างอิง และโหมดการเปลี่ยนภาพ |
| Happy Horse 1.0 | happyhorse-1.0 | 1080p | 3–15 วินาที | ตัวเลือกวิดีโอการรับรู้เสียงมีให้สำหรับ create video |
| Kling O3 Pro | kling-o3-pro | 720p | 3–15 วินาที | รองรับวิดีโอ ข้อมูลอ้างอิง และเวิร์กโฟลว์การเปลี่ยนแปลง |
| Kling O3 Standard | kling-o3-standard | 720p | 3–15 วินาที | ตัวเลือก Kling O3 มาตรฐาน |
| Kling 3.0 Pro | kling-3.0-pro | 720p | 3–15 วินาที | รองรับเวิร์กโฟลว์วิดีโอและการเปลี่ยนแปลง |
| Kling 3.0 Standard | kling-3.0-standard | 720p | 3–15 วินาที | ตัวเลือกมาตรฐาน Kling 3.0 |
| Grok Imagine 1.5 | grok-imagine-1.5 | 720p | 1–15 วินาที | รูปภาพต่อวิดีโอเท่านั้น ต้องใช้ --image และเป็นไปตามอัตราส่วนภาพของอินพุต |
| Grok Imagine | grok-imagine | 720p | 1–15 วินาที | ตัวเลือก Grok ก่อนหน้า; รองรับวิดีโอ ขยาย และเวิร์กโฟลว์อ้างอิง |
| Veo 3.1 Lite | veo-3.1-lite | 1080p | 4, 6 หรือ 8 วินาที | รองรับเวิร์กโฟลว์การเปลี่ยนวิดีโอและ 2 เฟรม |
| Veo 3.1 Standard | veo-3.1-standard | 2160p | 4, 6 หรือ 8 วินาที | ตัวเลือก Veo ที่มีความละเอียดสูงกว่า |
| Veo 3.1 Fast | veo-3.1-fast | 2160p | 4, 6 หรือ 8 วินาที | ตัวเลือก Veo ที่เร็วขึ้น |
| Sora 2 Pro | sora-2-pro | 1080p | 4, 8 หรือ 12 วินาที | ตัวเลือก Sora ที่มีระยะเวลาคงที่ |
| Sora 2 | sora-2 | 720p | 4, 8 หรือ 12 วินาที | ตัวเลือกโซระมาตรฐาน |
| PixVerse v5.6 | v5.6 | 1080p | 1–10 วินาที | ยังคงใช้สำหรับการควบคุมการเคลื่อนไหวและเวิร์กโฟลว์การสร้างที่เลือก |
| PixVerse v5.5 | v5.5 | 1080p | 1–10 วินาที | ใช้สำหรับเวิร์กโฟลว์ create modify |
| PixVerse v5 | v5 | 1080p | 1–10 วินาที | ใช้สำหรับเวิร์กโฟลว์การเปลี่ยนเฟรม 3+ |
ทำให้ภาพนิ่งเคลื่อนไหว
หากต้องการเปลี่ยนภาพถ่ายหรือรูปภาพที่สร้างขึ้นให้เป็นวิดีโอ ให้ระบุธง --image:
คุณสามารถส่งเส้นทางไฟล์ในเครื่องหรือ URL ได้ ไฟล์ในเครื่องจะถูกอัปโหลดโดยอัตโนมัติ — ไม่ต้องมีขั้นตอนการอัปโหลดด้วยตนเอง อินพุตรูปภาพในเครื่องที่ใหญ่กว่า 1920x1920 หรือ 5MB จะถูกปรับขนาดหรือบีบอัดโดยอัตโนมัติก่อนอัปโหลด URL รูปภาพระยะไกลได้รับการตรวจสอบโดยแบ็กเอนด์ตามที่เป็นอยู่
สำหรับ Grok Imagine 1.5 จำเป็นต้องมีรูปภาพและอัตราส่วนเอาต์พุตจะเป็นไปตามรูปภาพนั้น:
ใช้การอ้างอิง การเปลี่ยน การควบคุมการเคลื่อนไหว และเทมเพลต
CLI ปัจจุบันรองรับมากกว่าข้อความเป็นวิดีโอและรูปภาพเป็นวิดีโอธรรมดา โหมดการสร้างเหล่านี้มีประโยชน์เมื่อคุณต้องการควบคุมอักขระ คีย์เฟรม การแก้ไข หรือเอฟเฟกต์เพิ่มเติม:
ไม่ใช่ทุกรุ่นที่รองรับโหมดการสร้างทุกโหมด ในเมทริกซ์ README ปัจจุบัน create video รองรับ v6, pixverse-c1, Seedance 2.0 Standard/Fast/Mini, Happy Horse 1.0, Kling O3, Kling 3.0, Grok Imagine, Veo 3.1, Sora 2 และ v5.6 grok-imagine-1.5 เป็นภาพต่อวิดีโอเท่านั้น และต้องใช้ --image create extend รองรับ v6 และ grok-imagine; create reference รองรับ v6, pixverse-c1, Seedance 2.0 Standard/Fast/Mini, Kling O3, grok-imagine และ v5.6; การเปลี่ยนภาพแบบ 2 เฟรมรองรับตระกูลวิดีโอรุ่นใหม่ การเปลี่ยนเฟรม 3+ เฟรมใช้ v5; create modify ใช้ v5.5; และ create motion-control ใช้ v5.6.
ขั้นตอนที่ 5: สร้างเสียงและดนตรี
GitHub README ในปัจจุบันจัดทำเอกสารเสียงแบบสแตนด์อโลนผ่านคำสั่งการสร้างเฉพาะ ใช้ create voice สำหรับการอ่านออกเสียงข้อความ และ create music สำหรับการสร้างข้อความพร้อมท์เป็นเสียงเพลง เอาต์พุตเสียงและเสียงเพลงจะถูกบันทึกเป็นเนื้อหาเสียง ดังนั้นคุณจึงสามารถติดตามด้วย task แสดงรายการด้วย asset list --type audio และดาวน์โหลดด้วย asset download --type audio สำหรับบรรยากาศวิดีโอเนทิฟ ให้ใช้ --audio หรือ --no-audio กับคำสั่งการสร้างวิดีโอที่รองรับ
สร้างเสียงพูด:
เรียกดูโมเดลเสียงและเสียงที่ตั้งไว้ล่วงหน้า:
สร้างเพลง:
สำหรับเพลงบรรเลง ให้ใช้ --instrumental สำหรับโมเดลที่มีความสามารถเนื้อเพลง ให้ส่งเนื้อเพลงเป็นข้อความตามตัวอักษร พาธของไฟล์ในเครื่อง หรือ stdin:
ตระกูลโมเดลเสียงในปัจจุบัน ได้แก่ รุ่น MiniMax Speech 2.8 และ ElevenLabs ตระกูลโมเดลเพลงในปัจจุบัน ได้แก่ MiniMax Music, ElevenLabs Music และ Google Lyria 3 Pro ใช้ pixverse voice models และ pixverse music models สำหรับแค็ตตาล็อกสดก่อนที่จะเขียนสคริปต์เวิร์กโฟลว์การผลิต
ขั้นตอนที่ 6: เรียกใช้ตัวช่วยสร้างแบบโต้ตอบ
หากคุณกำลังสำรวจเป็นครั้งแรกและยังไม่คุ้นเคยกับแฟล็กที่มีอยู่ทั้งหมด ให้รันคำสั่งการสร้างใดๆ โดยไม่มีอาร์กิวเมนต์เพื่อเข้าสู่วิซาร์ดที่แนะนำ:
ตัวช่วยสร้างจะแนะนำคุณเกี่ยวกับข้อความแจ้ง การเลือกโมเดล คุณภาพ อัตราส่วนภาพ ระยะเวลา และตัวเลือกอื่นๆ ทีละขั้นตอน ซึ่งมีประโยชน์ในการค้นหาว่าพารามิเตอร์ใดบ้างที่พร้อมใช้งานก่อนที่จะเขียนสคริปต์
Beyond Generation: จัดการทรัพย์สินและพื้นที่ทำงานของคุณ
PixVerse CLI ปัจจุบันยังมีคำสั่งการจัดการที่ช่วยคุณสร้างเวิร์กโฟลว์เทอร์มินัลตั้งแต่ต้นทางถึงปลายทาง:
pixverse task status <id>และpixverse task wait <id>สำหรับการโพลงานpixverse task status --ids 123,456,789 --type video --jsonสำหรับการตรวจสอบสถานะแบตช์pixverse asset list,asset upload,asset info,asset downloadและasset deleteสำหรับการดำเนินงานวงจรชีวิตของสินทรัพย์วิดีโอ รูปภาพ และเสียงpixverse saved list,saved items,saved new,saved rename,saved add,saved removeและsaved deleteสำหรับโฟลเดอร์ที่บันทึกไว้pixverse template categories,template list,template searchและtemplate infoสำหรับการค้นหาเอฟเฟกต์และเทมเพลตpixverse voice models,voice presetsและmusic modelsสำหรับการค้นหาโมเดลเสียงสดpixverse workspace list,workspace status,workspace switchและworkspace manageสำหรับการดำเนินงานหลายพื้นที่ทำงานpixverse account info,account usageและaccount slotsสำหรับการตรวจสอบเครดิต การใช้งาน และการทำงานพร้อมกันpixverse config set,config list,config pathและconfig defaultsสำหรับค่าเริ่มต้นท้องถิ่นที่ทำซ้ำได้
สิ่งนี้ทำให้ตรงไปตรงมาไม่เพียงแต่สร้างอัตโนมัติเท่านั้น แต่ยังรวมถึงการจัดระเบียบ การค้นพบเทมเพลต การค้นพบเสียง ดาวน์โหลด การกำหนดเส้นทางพื้นที่ทำงาน และการส่งมอบในสคริปต์เดียว หากคุณต้องการรันหนึ่งคำสั่งกับเวิร์กสเปซอื่น ให้ใช้แฟล็ก --workspace-id <id> โกลบอล 0 กำหนดเป้าหมายพื้นที่ทำงานส่วนตัวของคุณ
ธงที่เป็นมิตรกับสคริปต์
ระบบอัตโนมัติส่วนใหญ่ขึ้นอยู่กับเอาต์พุตที่คาดการณ์ได้และพฤติกรรมรันไทม์ที่คาดการณ์ได้ แฟล็กเหล่านี้มีประโยชน์อย่างยิ่งในสคริปต์และเวิร์กโฟลว์ตัวแทน AI:
| ธง | ใช้สำหรับ |
|---|---|
--json | ส่งคืนเอาต์พุต JSON ที่มีโครงสร้าง |
-p | นามแฝงแบบสั้นสำหรับ --json |
--count <n> | สร้างรูปแบบ 1–4 รูปแบบจากคำขอเดียว |
--seed <number> | ทำให้รุ่นง่ายต่อการสืบพันธุ์ |
--off-peak | ใช้การกำหนดราคานอกช่วงสูงสุดเมื่อมี |
--audio / --no-audio | เปิดหรือปิดการสร้างเสียงด้วยคำสั่งการสร้างที่รองรับ |
--multi-shot / --no-multi-shot | เปิดหรือปิดโหมดมัลติช็อตสำหรับวิดีโอ |
--no-wait | ส่งงานแล้วกลับทันที |
--timeout <sec> | ตั้งค่าการหมดเวลาการโพล โดยค่าเริ่มต้นเป็น 300 วินาที |
--workspace-id <id> | แทนที่พื้นที่ทำงานที่ใช้งานอยู่สำหรับคำสั่งเดียว |
--trace-id <uuid> | แนบ UUIDv4 ที่ผู้โทรส่งมากับคำขอ API สำหรับการดีบักและความสามารถในการสังเกต |
--idempotency-key <key> | ลองส่งคำขอสร้างอีกครั้งอย่างปลอดภัยโดยไม่สร้างงานที่เรียกเก็บเงินซ้ำโดยไม่ได้ตั้งใจ |
ตอนนี้การตั้งค่าสถานะการป้อนข้อความทำให้ง่ายขึ้นโดยอัตโนมัติ --prompt, --text และ --lyrics สามารถยอมรับสตริงตัวอักษร พาธของไฟล์ในเครื่อง หรือ - สำหรับ stdin:
การสอนตัวแทน AI ของคุณให้สร้างสื่อ
นี่คือจุดที่ PixVerse CLI กลายเป็นการเปลี่ยนแปลงอย่างแท้จริง เนื่องจากคำสั่งสามารถส่งคืน JSON ที่มีโครงสร้าง และใช้โค้ดทางออกที่กำหนดได้ เอเจนต์ AI ใดๆ ที่สามารถรันคำสั่งเชลล์จึงสามารถสอนให้สร้างรูปภาพและวิดีโอได้ตามต้องการ
การติดตั้ง PixVerse Skills
PixVerse Skillsเป็นไลบรารีทักษะที่มีโครงสร้างซึ่งสอนตัวแทนถึงวิธีใช้ CLI อย่างถูกต้อง: แฟล็กคำสั่ง ข้อจำกัดของโมเดล ไปป์ไลน์แบบหลายขั้นตอน และการจัดการข้อผิดพลาดที่มีประสิทธิภาพ
สำหรับ Claude Code และเอเจนต์อื่นๆ ที่สนับสนุนรูปแบบทักษะ ให้เพิ่มทักษะ PixVerse โดยตรง:
สำหรับ Cursor, Claude Code, Codex และเอเจนต์เฟรมเวิร์กอื่นๆ ทักษะนี้ปรับปรุงความน่าเชื่อถือโดยให้เอเจนต์มีข้อจำกัดที่ชัดเจน แทนที่จะบังคับให้เอเจนต์อนุมานตั้งแต่ต้น
นอกจากนี้ PixVerse CLI ยังจัดส่งรายการคำสั่งที่เครื่องอ่านได้ขนาดกะทัดรัดที่ dist/capabilities.json โดยมีแหล่งข้อมูลสาธารณะเป็น capabilities.json ในพื้นที่เก็บข้อมูล GitHub รายการนี้จะอธิบายคำสั่ง แฟล็ก รหัสทางออก ความคาดหวังเอาต์พุต JSON และหมวดหมู่เอฟเฟกต์ เพื่อให้เจ้าหน้าที่ตรวจสอบสัญญา CLI โดยไม่ต้องคัดลอกข้อความช่วยเหลือ
เมื่อตัวแทนของคุณโหลดทักษะ PixVerse แล้ว คุณสามารถให้คำแนะนำที่เป็นภาษาธรรมชาติได้ เช่น:
- “สร้างวิดีโอสาธิตผลิตภัณฑ์ 10 วินาทีจากภาพหน้าจอนี้”
- “สร้างภาพปกบล็อกนี้สี่รูปแบบในรูปแบบ 16:9”
- “ทำให้แผนภาพนี้เป็นคลิปอธิบายความยาว 5 วินาทีพร้อมเสียงรอบข้าง”
- “สร้างคลิปโปรโมต 8 วินาที 16:9 สามคลิปด้วยการเคลื่อนไหวของกล้องที่แตกต่างกัน”
เอเจนต์จะแปลคำสั่งเหล่านั้นเป็นคำสั่ง CLI ที่ถูกต้อง แยกวิเคราะห์เอาต์พุต JSON และจัดการการสำรวจและดาวน์โหลด โดยไม่จำเป็นต้องมีการแทรกแซงด้วยตนเอง
Claude Code
ใน Claude Code นั้น PixVerse CLI จะกลายเป็นเครื่องมือเนทิฟที่เอเจนต์ใช้โดยอัตโนมัติ หลังจากโหลดทักษะ PixVerse แล้ว คุณสามารถรวมการสร้างสื่อในงานใดๆ ได้โดยตรง:
Claude Code จะเรียกใช้คำสั่ง CLI ที่ถูกต้อง แยกวิเคราะห์ URL รูปภาพจากการตอบกลับของ JSON และดาวน์โหลดไฟล์ไปยังพาธที่คุณระบุ ทั้งหมดนี้อยู่ในเซสชันเดียวกับที่ไฟล์กำลังเขียนโค้ดของคุณด้วย
เวิร์กโฟลว์ Claude Code ทั่วไป:
Cursor
ผู้ใช้ Cursor สามารถโหลด PixVerse Skills เป็นไฟล์บริบทของโครงการได้ วางไฟล์ทักษะที่เกี่ยวข้องในไดเร็กทอรี .cursor/ ของคุณ หรือเพิ่มลงในกฎพื้นที่ทำงานของคุณ เมื่อโหลดแล้ว Cursor จะรับรู้ทุกคำสั่ง PixVerse CLI อย่างครบถ้วน และสามารถสร้างสื่อซึ่งเป็นส่วนหนึ่งของงานเขียนโค้ดใดๆ ได้
เวิร์กโฟลว์ทั่วไปของ Cursor: ขอให้ตัวแทนสร้างภาพจำลองตามการออกแบบที่คุณกำลังสร้าง จากนั้นใช้เป็นข้อมูลอ้างอิงโดยตรงในเซสชัน IDE ของคุณ โดยไม่ต้องออกจากโปรแกรมแก้ไข
Codex และตัวแทนอื่นๆ
PixVerse CLI เข้ากันได้กับเอเจนต์ใดๆ ที่สามารถดำเนินการคำสั่งเชลล์และแยกวิเคราะห์ JSON รูปแบบเอาต์พุตที่มีโครงสร้าง — ชื่อฟิลด์ที่สอดคล้องกัน รหัสข้อผิดพลาดที่คาดเดาได้ และข้อความแสดงข้อผิดพลาดที่แยกออกจาก stderr ช่วยให้มั่นใจได้ว่าแม้แต่เอเจนต์การเขียนสคริปต์ธรรมดาก็สามารถบูรณาการการสร้างได้อย่างน่าเชื่อถือ
สัญญารหัสทางออกทำให้การจัดการข้อผิดพลาดตรงไปตรงมา:
| รหัส | ความหมาย | การกระทำของตัวแทน |
|---|---|---|
| 0 | ความสำเร็จ | แยกเอาต์พุต JSON |
| 1 | ข้อผิดพลาดทั่วไป | ตรวจสอบ stderr และลองอีกครั้งโดยใช้อินพุตที่ได้รับการตรวจสอบแล้ว |
| 2 | หมดเวลา | ลองอีกครั้งด้วย --timeout ที่ยาวขึ้น |
| 3 | การตรวจสอบสิทธิ์หมดอายุแล้ว | รัน pixverse auth login อีกครั้ง |
| 4 | เครดิตหมด | ตรวจสอบยอดเงิน แจ้งผู้ใช้ |
| 5 | การสร้างล้มเหลว | ลองใช้พารามิเตอร์อื่น |
| 6 | ข้อผิดพลาดในการตรวจสอบ | ตรวจสอบค่าแฟล็ก |
ท่อส่งอัตโนมัติ
เมื่อคุณเข้าใจแต่ละคำสั่งแล้ว PixVerse CLI จะปลดล็อกเวิร์กโฟลว์หลายขั้นตอนอันทรงพลังที่ทำงานทั้งหมดโดยไม่ต้องโต้ตอบกับผู้ใช้
ข้อความเป็นรูปภาพเป็นวิดีโอ
ไปป์ไลน์ที่มีประโยชน์ที่สุดอย่างหนึ่ง: สร้างภาพที่มีความละเอียดสูงจากข้อความแจ้ง จากนั้นทำให้เคลื่อนไหวเป็นวิดีโอ
ขั้นตอนการผลิตวิดีโอเต็มรูปแบบ
สำหรับเอาต์พุตที่สวยงาม การสร้างลูกโซ่พร้อมขั้นตอนหลังการประมวลผล ใช้ --audio หรือ --no-audio เมื่อคุณต้องการเสียงเนทีฟในคำสั่งการสร้างวิดีโอที่รองรับ จากนั้นใช้ create voice สำหรับเสียงการแปลงข้อความเป็นคำพูด และ create music สำหรับเนื้อหาเพลงแบบสแตนด์อโลนที่คุณจะรวมดาวน์สตรีม:
การสร้างแบทช์
สำหรับไปป์ไลน์เนื้อหาที่ต้องใช้หลายรูปแบบ ให้รันงานแบบขนาน:
แฟล็ก --no-wait จะส่งงานและส่งคืนทันทีพร้อมรหัสงาน ช่วยให้คุณสามารถส่งงานหลายรายการก่อนโพลได้ ด้วย --no-wait --json บันทึก ID งานที่ส่งคืนและพารามิเตอร์การสร้างที่แก้ไขแล้วสำหรับการบันทึกและความสามารถในการทำซ้ำ ใช้ --count <n> เมื่อคุณต้องการหลายรูปแบบจากพรอมต์เดียว และใช้ชุด task status --ids เมื่อคุณต้องการการตอบสนองสถานะเดียวสำหรับงานที่รันอยู่หลายงาน คำสั่ง pixverse task wait จัดการการโพลแบบปรับได้สำหรับคุณ
การกำหนดค่าเริ่มต้น
หากคุณใช้รุ่น คุณภาพ หรืออัตราส่วนภาพเดียวกันเป็นประจำ ให้ตั้งค่าเป็นค่าเริ่มต้น เพื่อที่คุณจะได้ไม่ต้องแฟล็กซ้ำทุกครั้ง:
ธงบรรทัดคำสั่งจะแทนที่ค่าเริ่มต้นที่คุณกำหนดไว้เสมอ ดังนั้นคุณจึงยังคงความยืดหยุ่นอย่างเต็มที่ในขณะที่ลดการทำซ้ำ สำหรับการทำงานอัตโนมัติเฉพาะพื้นที่ทำงาน ให้เพิ่ม --workspace-id <id> ให้กับคำสั่งเมื่อคุณต้องการแทนที่พื้นที่ทำงานที่ใช้งานอยู่สำหรับการรันครั้งเดียวนั้น
สิ่งที่คุณสามารถสร้างได้
เมื่อรวม PixVerse CLI เข้ากับเวิร์กโฟลว์ตัวแทนของคุณ ช่วงของงานอัตโนมัติจะขยายออกไปอย่างมาก:
- เอกสารประกอบ— สร้างวิดีโอสาธิตผลิตภัณฑ์และภาพหน้าจอโดยอัตโนมัติโดยเป็นส่วนหนึ่งของกระบวนการสร้างเอกสารของคุณ
- การตลาด— รันงานเป็นกลุ่มทุกคืนที่สร้างเนื้อหาโซเชียลมีเดียที่หลากหลายจากไลบรารีพร้อมท์เดียว
- การพัฒนาแอป— ให้ตัวแทนการเขียนโค้ดของคุณสร้างภาพตัวยึดตำแหน่ง ภาพเคลื่อนไหวจำลอง หรือวิดีโอหน้าจอการโหลดในขณะที่คุณสร้าง UI
- เวิร์กโฟลว์เสียง— สร้างเสียงพากย์แบบร่าง แทร็กพร้อมสำหรับเพลง หรือเนื้อหาเสียงสำหรับการแก้ไขในภายหลัง
- ไปป์ไลน์เนื้อหา— เชื่อมโยงการเรียก CLI กับเครื่องมืออื่นๆ (ffmpeg, ImageMagick, ที่เก็บข้อมูลบนคลาวด์) เพื่อสร้างเวิร์กโฟลว์การผลิตสื่ออัตโนมัติเต็มรูปแบบ
- การสร้างต้นแบบ— สร้างแนวคิดควิกโมชั่นในไม่กี่วินาทีเพื่อตรวจสอบความถูกต้องของแนวคิดก่อนที่จะดำเนินการผลิตเต็มรูปแบบ
CLI ได้รับการออกแบบเพื่อให้เข้ากับขั้นตอนการทำงานแบบเชลล์ได้อย่างเป็นธรรมชาติ หากระบบอัตโนมัติที่มีอยู่ของคุณทำงานใน bash, Python, Node หรือไปป์ไลน์ CI/CD PixVerse CLI จะเสียบเข้าโดยไม่มีค่าใช้จ่ายในการผสานรวมเพิ่มเติม
รายการตรวจสอบการเริ่มต้นใช้งาน
- ติดตั้ง Node.js 20 หรือสูงกว่า
- รัน
npm install -g pixverse - เรียกใช้
pixverse auth loginและอนุญาตในเบราว์เซอร์ - เรียกใช้
pixverse account infoเพื่อตรวจสอบเครดิต - รัน
pixverse account slotsก่อนที่จะทำงานเป็นแบตช์พร้อมกัน - สร้างภาพแรกของคุณ:
pixverse create image --prompt "..." --json - สร้างวิดีโอแรกของคุณ:
pixverse create video --prompt "..." --json - สร้างเนื้อหาเสียงแรกของคุณ:
pixverse create voice --text "..." --json - สร้างเนื้อหาเพลงแรกของคุณ:
pixverse create music --prompt "..." --json - สำรวจเทมเพลตด้วย
pixverse template list - ติดตั้ง PixVerse Skills สำหรับตัวแทนของคุณ (Claude Code, Cursor หรือ Codex)
- ตั้งค่าเริ่มต้นที่คุณต้องการด้วย
pixverse config defaults set - สร้างไปป์ไลน์อัตโนมัติแรกของคุณ
ทำให้ CLI เป็นปัจจุบันอยู่เสมอ
ใช้ตัวอัพเดตในตัวเพื่อให้ CLI ในเครื่องของคุณเป็นปัจจุบัน:
คุณยังสามารถใช้ npm ได้โดยตรง:
สำหรับการเปลี่ยนแปลงระดับการเปิดตัวและรุ่นที่รองรับใหม่ ให้ตรวจสอบแหล่งที่มาอย่างเป็นทางการของ CLI:
เอกสารปัจจุบันเน้น PixVerse V6 เป็นโมเดลวิดีโอเริ่มต้น, GPT Image 2 เป็นโมเดลรูปภาพเริ่มต้น, รองรับ Seedance 2.0 Mini, เวิร์กโฟลว์ PixVerse v5 และ v5.5 เฉพาะโหมด, คำสั่ง create voice และ create music เฉพาะ, การจัดการสินทรัพย์เสียง, โฟลเดอร์ที่บันทึกไว้, การสลับพื้นที่ทำงาน, config defaults, capabilities.json สำหรับตัวแทน, pixverse update, รองรับ stdin สำหรับการป้อนข้อความ, --trace-id และ --idempotency-key เพื่อการลองใหม่ที่ปลอดภัยยิ่งขึ้น
ขั้นตอนต่อไป
PixVerse CLI บน GitHub และ npm (npm install -g pixverse) ช่วยให้คุณเข้าถึงการสร้าง การโพลงาน การจัดการสินทรัพย์ เทมเพลต โฟลเดอร์ที่บันทึกไว้ การตรวจสอบบัญชี การค้นพบโมเดลเสียง และการควบคุมพื้นที่ทำงานได้ทันทีจากอินเทอร์เฟซเดียว พื้นที่เก็บข้อมูล PixVerse Skills เพิ่มคำแนะนำที่พร้อมสำหรับตัวแทน ดังนั้น Claude Code, Cursor, Codex และเครื่องมืออื่นๆ สามารถรันเวิร์กโฟลว์เหล่านี้ด้วยความน่าเชื่อถือที่แข็งแกร่งยิ่งขึ้น
การผสมผสานระหว่าง CLI ที่เชื่อถือได้และคลังทักษะที่พร้อมใช้งานของตัวแทนหมายความว่าการสร้างภาพ วิดีโอ เสียง และเพลงสามารถอยู่ในขั้นตอนการทำงานเดียวกันกับโค้ดของคุณ ซึ่งจัดการโดยตัวแทนคนเดียวกัน ในเทอร์มินัลเดียวกัน โดยไม่ต้องเปลี่ยนเครื่องมือ
เริ่มต้นด้วยคำสั่งเดียว สร้างจากที่นั่น