PixVerse CLI: สร้างวิดีโอและรูปภาพด้วย AI สำหรับนักพัฒนา
เรียนรู้วิธีติดตั้ง PixVerse CLI สร้างรูปภาพและวิดีโอ AI ชิ้นแรกของคุณ และอัตโนมัติขั้นตอนการสร้างสรรค์ใน Claude Code, Cursor และ AI Agent
PixVerse CLI: สร้างวิดีโอและรูปภาพด้วย AI สำหรับนักพัฒนา
บทนำ
ทุกขั้นตอนการทำงานสร้างสรรค์มีจุดคอขวด — ช่วงเวลาที่คุณต้องออกจาก code editor เปิดเบราว์เซอร์ และคลิกผ่าน web interface ด้วยตนเองเพื่อสร้างสื่อชิ้นหนึ่ง สำหรับนักพัฒนา AI Agent และทุกคนที่สร้าง pipeline เนื้อหาแบบอัตโนมัติ การเปลี่ยนบริบทนั้นคือแรงเสียดทานที่สะสมขึ้นอย่างรวดเร็ว
PixVerse CLI กำจัดจุดคอขวดนั้น มันคือ command-line interface อย่างเป็นทางการสำหรับ PixVerse ที่ให้คุณเข้าถึงทุกโมเดล ทุกฟีเจอร์ และทุกความสามารถจากแพลตฟอร์ม PixVerse — โดยตรงจาก terminal ของคุณ Text-to-video, image-to-video, text-to-image, lip-sync speech, sound effects, upscaling — ทั้งหมด scripting ได้ ต่อท่อได้ และใช้งานได้โดยไม่ต้องแตะเบราว์เซอร์
สิ่งที่ทำให้ PixVerse CLI มีพลังเป็นพิเศษคือปรัชญาการออกแบบ: มันถูกสร้างขึ้นโดยคำนึงถึง AI Agent ทุก command ส่งออก JSON ที่มีโครงสร้าง ทุก exit code เป็น deterministic และทุกขั้นตอน pipeline สามารถประกอบกันได้ ซึ่งหมายความว่าคุณสามารถสอน Claude Code, Cursor, Codex หรือ Agent อื่นใดให้สร้างรูปภาพและวิดีโอแทนคุณ — และพวกมันจะทำได้อย่างถูกต้องทุกครั้ง
คู่มือนี้จะพาคุณผ่านเส้นทางที่สมบูรณ์: ตั้งแต่การติดตั้งไปจนถึงการสร้างชิ้นแรก จากนั้นสู่ automation pipeline หลายขั้นตอนและขั้นตอนการทำงานที่รองรับ Agent โดยตรง
ข้อกำหนดเบื้องต้น
ก่อนเริ่มต้น คุณต้องมี:
- Node.js 20 หรือสูงกว่า — ตรวจสอบด้วย
node --version - บัญชี PixVerse — สมัครสมาชิกที่ pixverse.ai
- การสมัครสมาชิก PixVerse ที่ใช้งานอยู่ — CLI ใช้ระบบเครดิตเดียวกับเว็บไซต์ เฉพาะผู้ใช้ที่สมัครสมาชิกเท่านั้นที่สามารถสร้างเนื้อหาได้
PixVerse CLI ไม่ต้องการ API key ที่ต้องคัดลอกด้วยตนเอง การยืนยันตัวตนดำเนินการผ่าน OAuth flow บนเบราว์เซอร์ที่เก็บ token ของคุณไว้ในเครื่อง
ขั้นตอนที่ 1: ติดตั้ง CLI
ติดตั้งแบบ global ด้วย npm:
npm install -g pixverseตรวจสอบการติดตั้ง:
pixverse --versionหากคุณไม่ต้องการติดตั้งแบบ global คุณสามารถรัน command ผ่าน npx ได้เช่นกัน:
npx pixverse create video --prompt "แมวเดินบนดาวอังคาร"ขั้นตอนที่ 2: ยืนยันตัวตน
รัน command เข้าสู่ระบบ:
pixverse auth loginCLI จะแสดง URL สั้นและรหัส เปิด URL ในเบราว์เซอร์ของคุณ ป้อนรหัส และอนุมัติด้วยบัญชี PixVerse ของคุณ Token ของคุณจะถูกเก็บโดยอัตโนมัติใน ~/.pixverse/ และมีอายุ 30 วัน
เพื่อตรวจสอบว่าคุณเข้าสู่ระบบแล้วและตรวจสอบเครดิตที่มีอยู่:
pixverse auth status
pixverse account infoCommand account info แสดงระดับการสมัครสมาชิก เครดิตที่เหลือ และกำหนดการรีเซ็ตเครดิตรายวันของคุณ ควรตรวจสอบยอดเครดิตเสมอก่อนรัน batch job
ขั้นตอนที่ 3: สร้างรูปภาพชิ้นแรก
การสร้างรูปภาพจากข้อความเป็นวิธีที่รวดเร็วที่สุดในการทดสอบการตั้งค่าของคุณ รัน:
pixverse create image --prompt "เส้นทางในป่าที่สมจริงในช่วง golden hour" --jsonflag --json ส่งคืนผลลัพธ์ที่มีโครงสร้าง:
{
"image_id": 789012,
"status": "completed",
"image_url": "https://...",
"prompt": "A photorealistic forest path at golden hour",
"model": "qwen-image",
"width": 1024,
"height": 1024
}สำหรับผลลัพธ์ความละเอียดสูงกว่า ระบุโมเดลที่รองรับ:
pixverse create image \
--prompt "เส้นทางในป่าที่สมจริงในช่วง golden hour" \
--model seedream-5.0-lite \
--quality 1800p \
--aspect-ratio 16:9 \
--jsonPixVerse รองรับโมเดลรูปภาพหลายตัว แต่ละตัวมีขีดจำกัดความละเอียดและจุดแข็งที่แตกต่างกัน:
| โมเดล | ความละเอียดสูงสุด | เหมาะสำหรับ |
|---|---|---|
qwen-image | 1080p | สร้างรวดเร็ว ใช้งานทั่วไป |
seedream-5.0-lite | 1800p | รูปภาพสร้างสรรค์ที่มีรายละเอียดสูง |
seedream-4.5 | 2160p | ความละเอียดสูงพิเศษ |
gemini-3.1-flash (Nano Banana 2) | 2160p | ช่วงความละเอียดกว้าง รวดเร็ว |
gemini-3.0 (Nano Banana Pro) | 2160p | คุณภาพสูงในระดับขนาดใหญ่ |
gemini-2.5-flash (Nano Banana) | 1080p | เบา รวดเร็ว |
เพื่อดาวน์โหลดรูปภาพที่สร้าง:
pixverse asset download 789012ขั้นตอนที่ 4: สร้างวิดีโอชิ้นแรก
Text-to-video ทำงานในลักษณะเดียวกัน สร้างคลิป 5 วินาที:
pixverse create video --prompt "พระอาทิตย์ตกเหนือคลื่นมหาสมุทร" --jsonสำหรับการสร้างที่กำหนดเองอย่างสมบูรณ์:
pixverse create video \
--prompt "ภาพโดรนแบบ cinematic เหนือหุบเขาภูเขาที่มีหมอกในยามรุ่งสาง" \
--model v5.6 \
--quality 1080p \
--aspect-ratio 16:9 \
--duration 8 \
--audio \
--jsonflag --audio เปิดใช้งานเสียง ambient ที่สร้างด้วย AI ที่ตรงกับเนื้อหาวิดีโอของคุณ flag --json ส่งคืน video_url เมื่อเสร็จสิ้นซึ่งคุณสามารถส่งต่อไปยัง command ดาวน์โหลดหรือขั้นตอนถัดไปใน pipeline ได้โดยตรง
PixVerse มีโมเดลวิดีโอหลายตัวที่มีความสามารถต่างกัน:
| โมเดล | คุณภาพสูงสุด | ช่วงความยาว | หมายเหตุ |
|---|---|---|---|
v5.6 | 1080p | 1–10 วินาที | ยืดหยุ่นที่สุด ช่วงความยาวกว้างที่สุด |
sora-2-pro | 1080p | 4, 8, 12 วินาที | ผลลัพธ์ cinematic คุณภาพสูง |
veo-3.1-standard | 1080p | 4, 6, 8 วินาที | รองรับโหมด Transition |
grok-imagine | 720p | 1–15 วินาที | ความยาวสูงสุดนานที่สุด |
ทำให้รูปภาพนิ่งเคลื่อนไหว
เพื่อเปลี่ยนรูปถ่ายหรือรูปภาพที่สร้างให้เป็นวิดีโอ ใส่ flag --image:
pixverse create video \
--prompt "ลมอ่อนๆ พัดผ่านฉากนั้น" \
--image ./product-photo.jpg \
--model v5.6 \
--quality 1080p \
--jsonคุณสามารถส่ง path ไฟล์ในเครื่องหรือ URL ได้ ไฟล์ในเครื่องจะอัปโหลดโดยอัตโนมัติ — ไม่ต้องอัปโหลดด้วยตนเอง
ขั้นตอนที่ 5: รัน Interactive Wizard
หากคุณกำลังสำรวจเป็นครั้งแรกและยังไม่คุ้นเคยกับ flag ที่มีทั้งหมด ให้รัน command การสร้างใดๆ โดยไม่มี argument เพื่อเข้าสู่ wizard แบบแนะนำ:
pixverse create video
pixverse create imageWizard จะนำคุณผ่าน prompt การเลือกโมเดล คุณภาพ aspect ratio ความยาว และตัวเลือกอื่นๆ ทีละขั้นตอน — มีประโยชน์สำหรับการค้นหาพารามิเตอร์ที่มีก่อนที่จะ script พวกมัน
สอน AI Agent ของคุณให้สร้างสื่อ
นี่คือจุดที่ PixVerse CLI กลายเป็นสิ่งที่เปลี่ยนแปลงได้อย่างแท้จริง เนื่องจากทุก command ส่งคืน JSON ที่มีโครงสร้างและใช้ exit code แบบ deterministic AI Agent ใดๆ ที่สามารถรัน shell command ได้ก็สามารถถูกสอนให้สร้างรูปภาพและวิดีโอตามต้องการ
การติดตั้ง PixVerse Skills
PixVerse Skills คือไลบรารีของไฟล์ skill ที่มีโครงสร้างซึ่งสอน Agent อย่างชัดเจนว่าจะใช้ CLI อย่างไร: flag ใดที่แต่ละ command รับ โมเดลใดรองรับพารามิเตอร์ใด วิธีเชื่อม command เป็น pipeline และวิธีจัดการข้อผิดพลาด
สำหรับ Claude Code และ Agent อื่นๆ ที่รองรับรูปแบบ skills ให้เพิ่ม PixVerse skills โดยตรง:
npx skills add https://github.com/pixverseai/skills --skill pixverse-ai-image-and-video-generatorสำหรับ Cursor skills จะอยู่ที่ skills/ ใน GitHub repository ของ PixVerse Skills และสามารถโหลดเป็น context โดยตรงเข้าสู่ editor ของคุณได้ สำหรับ Codex และ Agent ที่ใช้ LangChain แต่ละไฟล์ skill เป็น markdown ที่มีในตัวเองซึ่งสามารถ inject เข้าใน system prompt ของ Agent ได้
เมื่อ Agent ของคุณโหลด PixVerse skills แล้ว คุณสามารถให้คำสั่งภาษาธรรมชาติแก่มัน เช่น:
- “สร้างวิดีโอ demo สินค้า 10 วินาทีจาก screenshot นี้”
- “สร้าง cover รูปภาพบล็อกสี่รูปแบบในรูปแบบ 16:9”
- “ทำให้ diagram นี้เคลื่อนไหวเป็นคลิปอธิบาย 5 วินาทีพร้อมเสียง ambient”
Agent จะแปลคำสั่งเหล่านั้นเป็น CLI command ที่ถูกต้อง parse ผลลัพธ์ JSON และจัดการการ polling และการดาวน์โหลด — โดยไม่ต้องมีการแทรกแซงด้วยตนเอง
Claude Code
ใน Claude Code, PixVerse CLI กลายเป็นเครื่องมือ native ที่ Agent ใช้งานอย่างอิสระ หลังจากโหลด PixVerse skills แล้ว คุณสามารถรวมการสร้างสื่อในงานใดก็ได้:
สร้าง cover image สำหรับบล็อกโพสต์นี้เกี่ยวกับ machine learning
ใช้โมเดล seedream-5.0-lite ที่ 1800p ในรูปแบบ 16:9
ดาวน์โหลดไปที่ ./assets/cover.webp
Claude Code จะเรียกใช้ CLI command ที่ถูกต้อง parse URL รูปภาพจากการตอบสนอง JSON และดาวน์โหลดไฟล์ไปยัง path ที่คุณระบุ — ทั้งหมดในเซสชันเดียวกับที่มันกำลังเขียน code ของคุณ
ขั้นตอนการทำงาน Claude Code ทั่วไป:
# Claude Code รันสิ่งนี้โดยอัตโนมัติตามคำสั่งของคุณ
IMG=$(pixverse create image \
--prompt "การแสดงภาพนามธรรมของชั้น neural network พื้นหลังมืด โทนสีน้ำเงินและม่วง" \
--model seedream-5.0-lite \
--quality 1800p \
--aspect-ratio 16:9 \
--json | jq -r '.image_url')
# จากนั้นทำให้เคลื่อนไหว
pixverse create video \
--prompt "กล้องเคลื่อนช้าๆ ข้ามการเชื่อมต่อ neural ที่เรืองแสง" \
--image "$IMG" \
--model v5.6 \
--quality 1080p \
--duration 6 \
--jsonCursor
ผู้ใช้ Cursor สามารถโหลด PixVerse Skills เป็นไฟล์ context โครงการ วางไฟล์ skill ที่เกี่ยวข้องในไดเรกทอรี .cursor/ ของคุณหรือเพิ่มลงใน workspace rules ของคุณ เมื่อโหลดแล้ว Cursor จะรับรู้ PixVerse CLI command ทุกตัวและสามารถสร้างสื่อเป็นส่วนหนึ่งของงาน coding ใดก็ได้
ขั้นตอนการทำงาน Cursor ทั่วไป: ให้ Agent สร้างรูปภาพ mockup ตามการออกแบบที่คุณกำลังสร้าง แล้วใช้เป็น reference โดยตรงในเซสชัน IDE ของคุณ — โดยไม่ต้องออกจาก editor เลย
Codex และ Agent อื่นๆ
PixVerse CLI เข้ากันได้กับ Agent ใดก็ตามที่สามารถรัน shell command และ parse JSON ได้ รูปแบบผลลัพธ์ที่มีโครงสร้าง — ชื่อ field ที่สอดคล้องกัน error code ที่คาดเดาได้ และ error message ที่แยกจาก stderr — ทำให้แม้แต่ Agent สคริปต์ง่ายๆ ก็สามารถรวมการสร้างได้อย่างน่าเชื่อถือ
สัญญา exit code ทำให้การจัดการข้อผิดพลาดตรงไปตรงมา:
| รหัส | ความหมาย | การกระทำของ Agent |
|---|---|---|
| 0 | สำเร็จ | Parse ผลลัพธ์ JSON |
| 2 | หมดเวลา | ลองใหม่ด้วย --timeout ที่นานกว่า |
| 3 | Auth หมดอายุ | รัน pixverse auth login อีกครั้ง |
| 4 | เครดิตหมด | ตรวจสอบยอดเครดิต แจ้งผู้ใช้ |
| 5 | การสร้างล้มเหลว | ลองพารามิเตอร์อื่น |
| 6 | Validation error | ตรวจสอบค่า flag |
Automation Pipelines
เมื่อคุณเข้าใจ command แต่ละตัวแล้ว PixVerse CLI จะปลดล็อก workflow หลายขั้นตอนที่ทรงพลังซึ่งทำงานโดยไม่ต้องมีการโต้ตอบจากผู้ใช้เลย
Text to Image to Video
หนึ่งใน pipeline ที่มีประโยชน์ที่สุด: สร้างรูปภาพความละเอียดสูงจาก text prompt แล้วทำให้เคลื่อนไหวเป็นวิดีโอ
# ขั้นตอนที่ 1: สร้างรูปภาพพื้นฐาน
IMG_RESULT=$(pixverse create image \
--prompt "ภาพเมือง cyberpunk ในตอนกลางคืน ไฟนีออนสะท้อนบนพื้นเปียก" \
--model gemini-3.1-flash \
--quality 2160p \
--aspect-ratio 16:9 \
--json)
IMAGE_URL=$(echo "$IMG_RESULT" | jq -r '.image_url')
# ขั้นตอนที่ 2: ทำให้เคลื่อนไหวเป็นวิดีโอ
VID_RESULT=$(pixverse create video \
--prompt "กล้องเคลื่อนช้าๆ ข้ามถนนที่มีไฟนีออน" \
--image "$IMAGE_URL" \
--model v5.6 \
--quality 1080p \
--duration 8 \
--json)
VIDEO_ID=$(echo "$VID_RESULT" | jq -r '.video_id')
# ขั้นตอนที่ 3: ดาวน์โหลดวิดีโอสุดท้าย
pixverse asset download "$VIDEO_ID" --jsonFull Video Production Pipeline
สำหรับผลลัพธ์ที่สวยงาม เชื่อมการสร้างกับขั้นตอนการประมวลผลหลังการถ่ายทำ:
# ขั้นตอนที่ 1: สร้างวิดีโอพื้นฐาน
RESULT=$(pixverse create video \
--prompt "สินค้าถูกประกอบในภาพ slow motion" \
--model v5.6 \
--quality 720p \
--duration 5 \
--json)
VID=$(echo "$RESULT" | jq -r '.video_id')
# ขั้นตอนที่ 2: ขยายความยาว
EXTENDED=$(pixverse create extend \
--video "$VID" \
--prompt "ดำเนินลำดับการประกอบต่อ" \
--duration 5 \
--json | jq -r '.video_id')
pixverse task wait "$EXTENDED" --json
# ขั้นตอนที่ 3: เพิ่มเสียง ambient
WITH_SOUND=$(pixverse create sound \
--video "$EXTENDED" \
--prompt "บรรยากาศโรงงานอุตสาหกรรม เสียงกลไกอ่อนๆ" \
--json | jq -r '.video_id')
pixverse task wait "$WITH_SOUND" --json
# ขั้นตอนที่ 4: Upscale เป็น 1080p
FINAL=$(pixverse create upscale \
--video "$WITH_SOUND" \
--quality 1080p \
--json | jq -r '.video_id')
pixverse task wait "$FINAL" --json
# ขั้นตอนที่ 5: ดาวน์โหลด
pixverse asset download "$FINAL" --jsonBatch Generation
สำหรับ content pipeline ที่ต้องการหลายรูปแบบ ให้รัน job แบบขนาน:
# ตรวจสอบเครดิตก่อน
CREDITS=$(pixverse account info --json | jq -r '.credits.total')
echo "เครดิตที่มีอยู่: $CREDITS"
# ส่ง 4 การสร้างแบบขนาน
pixverse create video --prompt "พระอาทิตย์ขึ้นเหนือภูเขา" --no-wait --json > /tmp/v1.json &
pixverse create video --prompt "พระอาทิตย์ตกเหนือมหาสมุทร" --no-wait --json > /tmp/v2.json &
pixverse create video --prompt "ดาวเหนือทะเลทราย" --no-wait --json > /tmp/v3.json &
pixverse create video --prompt "แสง Aurora เหนือทะเลสาบที่แข็งตัว" --no-wait --json > /tmp/v4.json &
wait
# รอแต่ละรายการและดาวน์โหลด
for f in /tmp/v1.json /tmp/v2.json /tmp/v3.json /tmp/v4.json; do
ID=$(jq -r '.video_id' "$f")
pixverse task wait "$ID" --json
pixverse asset download "$ID" --json
doneflag --no-wait ส่ง job และส่งคืนทันทีพร้อม task ID ช่วยให้คุณส่ง job หลายรายการก่อน polling flag pixverse task wait จัดการการ polling แบบ adaptive ให้คุณ — ไม่ต้องใช้ sleep loop ด้วยตนเอง
การกำหนดค่าเริ่มต้น
หากคุณใช้โมเดล คุณภาพ หรือ aspect ratio เดิมอย่างสม่ำเสมอ ให้ตั้งค่าเป็นค่าเริ่มต้นเพื่อที่คุณจะได้ไม่ต้องพิมพ์ flag ซ้ำทุกครั้ง:
pixverse config defaults set --mode video --model v5.6 --quality 1080p --aspect-ratio 16:9
pixverse config defaults set --mode image --model seedream-5.0-lite --quality 1800p
pixverse config set output-dir ~/Downloads/pixverseflag ใน command line จะ override ค่าเริ่มต้นที่กำหนดไว้เสมอ ดังนั้นคุณยังคงมีความยืดหยุ่นเต็มที่ในขณะที่ลดการทำซ้ำ
สิ่งที่คุณสามารถสร้างได้
ด้วย PixVerse CLI ที่รวมอยู่ใน workflow ของ Agent ของคุณ ขอบเขตของงานที่สามารถอัตโนมัติได้จะขยายออกไปอย่างมาก:
- เอกสาร — สร้างวิดีโอ demo สินค้าและ screenshot โดยอัตโนมัติเป็นส่วนหนึ่งของกระบวนการสร้างเอกสาร
- การตลาด — รัน batch job ในยามค่ำคืนที่ผลิตเนื้อหา social media หลายรูปแบบจากไลบรารี prompt เดียว
- การพัฒนาแอป — ให้ coding agent สร้างภาพ placeholder, mockup animation หรือวิดีโอหน้า loading ขณะที่คุณสร้าง UI
- Content pipeline — เชื่อม CLI call กับเครื่องมืออื่น (ffmpeg, ImageMagick, cloud storage) เพื่อสร้าง workflow การผลิตสื่อแบบอัตโนมัติอย่างสมบูรณ์
- Prototyping — สร้างแนวคิดการเคลื่อนไหวอย่างรวดเร็วในไม่กี่วินาทีเพื่อตรวจสอบไอเดียก่อนที่จะลงทุนในการผลิตเต็มรูปแบบ
CLI ถูกออกแบบมาให้เข้ากับ workflow ที่ใช้ shell ได้อย่างเป็นธรรมชาติ หากระบบ automation ที่มีอยู่ของคุณทำงานใน bash, Python, Node หรือ CI/CD pipeline, PixVerse CLI จะเข้ากันได้โดยไม่มีภาระการ integration เพิ่มเติม
รายการตรวจสอบการเริ่มต้น
- ติดตั้ง Node.js 20 หรือสูงกว่า
- รัน
npm install -g pixverse - รัน
pixverse auth loginและอนุมัติในเบราว์เซอร์ - รัน
pixverse account infoเพื่อตรวจสอบเครดิต - สร้างรูปภาพชิ้นแรก:
pixverse create image --prompt "..." --json - สร้างวิดีโอชิ้นแรก:
pixverse create video --prompt "..." --json - ติดตั้ง PixVerse Skills สำหรับ Agent ของคุณ (Claude Code, Cursor หรือ Codex)
- ตั้งค่าเริ่มต้นที่ต้องการด้วย
pixverse config defaults set - สร้าง automation pipeline แรกของคุณ
ขั้นตอนถัดไป
PixVerse CLI บน npm (npm install -g pixverse) ให้คุณเข้าถึงความสามารถการสร้างทั้งหมดได้ทันที PixVerse Skills repository ให้ไฟล์ skill ที่มีโครงสร้างซึ่งสอน AI Agent ของคุณว่าจะใช้ความสามารถเหล่านั้นอย่างถูกต้องในบริบทใดก็ได้
การรวมกันของ CLI ที่เชื่อถือได้และไลบรารี skill ที่พร้อมสำหรับ Agent หมายความว่าการสร้างรูปภาพและวิดีโอสามารถอยู่ภายใน workflow เดียวกับ code ของคุณได้แล้ว — จัดการโดย Agent เดียวกัน ใน terminal เดียวกัน โดยไม่ต้องเปลี่ยนเครื่องมือ
เริ่มต้นด้วย command เดียว แล้วค่อยๆ สร้างต่อจากนั้น