PixVerse CLI: создание AI-видео и изображений в терминале
Установите PixVerse CLI, создавайте AI-видео, изображения, речь и музыку в терминале и автоматизируйте агентные процессы через JSON.
Введение
У каждого творческого рабочего процесса есть узкое место — момент, когда вам нужно выйти из редактора кода, открыть браузер и вручную щелкнуть веб-интерфейс, чтобы создать медиафайл. Для разработчиков, агентов ИИ и всех, кто занимается созданием автоматизированных конвейеров контента, такое переключение контекста — это быстро накапливающееся препятствие.
PixVerse CLIустраняет это узкое место. Это официальный интерфейс командной строки для PixVerse, предоставляющий вам доступ к рабочим процессам создания PixVerse и рабочей области непосредственно с вашего терминала. Преобразование текста в видео, изображение в видео, преобразование текста в изображение, изображение в изображение, переходы, генерация голоса, генерация музыки, эталонное видео, управление движением, шаблоны, масштабирование и управление ресурсами — все это можно использовать в сценариях, по конвейеру и доступно без необходимости прикасаться к браузеру.
Что делает PixVerse CLI особенно полезным, так это его философия дизайна: он был создан с учетом агентов искусственного интеллекта. Команды могут возвращать структурированный JSON с --json или -p, коды завершения являются детерминированными, и каждый шаг конвейера является компонуемым. Это означает, что вы можете научить Claude Code, Cursor, Codex или любой другой агент генерировать изображения, видео, голос и музыку от вашего имени с меньшим количеством хрупких операций.
Это руководство соответствует текущему PixVerseAI/cli GitHub README и его общедоступному [манифесту возможностей] (https://github.com/PixVerseAI/cli/blob/main/capabilities.json), проверенному 29 июня 2026 г. Доступность модели, модели по умолчанию и флаги команд могут меняться быстрее, чем постоянно обновляемые руководства, поэтому рабочие сценарии все равно должны проверять pixverse --version, pixverse create <mode> --help и pixverse update перед запуском большого пакета.
Предварительные условия
Прежде чем начать, вам необходимо:
- Node.js 20 или выше— проверьте с помощью
node --version - Аккаунт PixVerse— зарегистрируйтесь на pixverse.ai
- Активная подписка на PixVerse— CLI использует ту же кредитную систему, что и веб-сайт; только подписанные пользователи могут создавать контент
PixVerse CLI не требует ручного копирования ключей API. Аутентификация осуществляется через поток OAuth на основе браузера, в котором ваш токен хранится локально.
Шаг 1. Установите CLI.
Установите глобально с помощью npm:
Проверьте установку:
Если вы предпочитаете не устанавливать глобально, вы также можете запускать команды через npx:
Шаг 2: Аутентификация
Запустите команду входа:
CLI открывает браузер для авторизации устройства OAuth. Вы также можете скопировать URL-адрес и завершить авторизацию из любого браузера на любом устройстве, что полезно для SSH и автономных сред. Ваш токен автоматически сохраняется в ~/.pixverse/ и действителен в течение 30 дней.
Чтобы подтвердить, что вы вошли в систему, и проверить доступные кредиты:
Команда account info показывает ваш уровень подписки, кредиты рабочей области и контекст использования. pixverse account usage помогает вам просмотреть потребление кредитов, а pixverse account slots показывает текущие слоты одновременной генерации для заданий изображения и видео. Сеансы CLI не зависят от сеансов веб-сайта или приложения PixVerse, и вы можете удалить сохраненный токен CLI с помощью pixverse auth logout. Всегда проверяйте свой баланс и доступные слоты перед запуском пакетных заданий.
Команды быстрого запуска
Если вам нужен только кратчайший путь от установки до созданного актива, начните со следующей последовательности:
npm install -g pixverse
pixverse auth login
pixverse create image --prompt "A photorealistic forest path at golden hour" --json
pixverse create video --prompt "A sunset over ocean waves" --model v6 --quality 720p --duration 5 --jsonДля рабочих процессов агента и CI оставьте --json или -p включенными, чтобы stdout оставался машиночитаемым, а ход выполнения и ошибки оставались на stderr. При повторных попытках производства добавьте --idempotency-key <key> к командам создания, чтобы повторные отправки случайно не создавали повторяющиеся оплачиваемые задания.
Шаг 3. Создайте свое первое изображение
Преобразование текста в изображение — это самый быстрый способ протестировать вашу настройку. Запустить:
Текущий GitHub README указывает GPT Image 2 в качестве модели изображения по умолчанию. Для воспроизводимой автоматизации по-прежнему задайте --model явно и проверьте интерактивную справку CLI или capabilities.json перед пакетной работой. Флаг --json возвращает структурированный вывод:
Для вывода с более высоким разрешением укажите модель, которая его поддерживает:
PixVerse поддерживает несколько моделей изображений, каждая из которых имеет разное максимальное разрешение и соотношение сторон:
| Модель | --model value | Качество | Примечания |
|---|---|---|---|
| GPT Image 2 | gpt-image-2.0 | 1080p, 1440p, 2160p | Модель изображения по умолчанию; поддерживает широкие и высокие соотношения сторон |
| Nano Banana 2 | gemini-3.1-flash | 512p, 1080p, 1440p, 2160p | Гибкий auto и стандартные соотношения сторон |
| Qwen Image | qwen-image | 720p, 1080p | Быстрая генерация для типичных творческих задач |
| Nano Banana Pro | gemini-3.0 | 1080p, 1440p, 2160p | Создание высококачественных изображений больших размеров. |
| Nano Banana | gemini-2.5-flash | 1080p | Легкое создание изображений с быстрой обработкой |
| Seedream 5.0 Lite | seedream-5.0-lite | 1440p, 1800p, 2160p | Высокодетализированные креативные изображения |
| Seedream 4.5 | seedream-4.5 | 1440p, 2160p | Генерация изображений высокого разрешения |
| Seedream 4.0 | seedream-4.0 | 1080p, 1440p, 2160p | Дополнительная опция Seedream для рабочих процессов с изображениями |
| Kling Image O3 | kling-image-o3 | 1080p, 1440p, 2160p | Стилизованные визуальные эффекты с гибким кадрированием |
| Kling Image V3 | kling-image-v3 | 1080p, 1440p | Сбалансированное качество и скорость |
Вы также можете преобразовать существующее изображение с помощью изображения в изображение:
Чтобы загрузить сгенерированное изображение:
Шаг 4: Создайте свое первое видео
Преобразование текста в видео работает таким же образом. Создайте 5-секундный клип:
Для полностью кастомизированного поколения:
Флаг --audio включает окружающий звук, создаваемый искусственным интеллектом, который соответствует вашему видеоконтенту. Флаг --json после завершения возвращает video_url, который можно передать непосредственно команде загрузки или следующему шагу конвейера.
PixVerse предоставляет несколько моделей видео с разным качеством, продолжительностью и поддержкой режимов:
| Модель | --model value | Максимальное качество | Продолжительность | Примечания |
|---|---|---|---|---|
| PixVerse V6 | v6 | 1080p | 1–15 секунд | Модель видео по умолчанию; широкая поддержка соотношения сторон |
| PixVerse C1 | pixverse-c1 | 1080p | 1–15 секунд | Надежная поддержка рабочих процессов видео, справок и переходов. |
| Seedance 2.0 Standard | seedance-2.0-standard | 2160p | 4–15 сек. | Поддерживает режимы видео, эталона и перехода. |
| Seedance 2.0 Fast | seedance-2.0-fast | 720p | 4–15 сек. | Опция Faster Seedance для режимов видео, эталона и перехода. |
| Seedance 2.0 Mini | seedance-2.0-mini | 720p | 4–15 сек. | Опция облегченного просмотра для режимов видео, эталона и перехода. |
| Happy Horse 1.0 | happyhorse-1.0 | 1080p | 3–15 сек. | Опция видео с поддержкой аудио доступна для create video |
| Kling O3 Pro | kling-o3-pro | 720p | 3–15 сек. | Поддерживает рабочие процессы видео, справок и переходов. |
| Kling O3 Standard | kling-o3-standard | 720p | 3–15 сек. | Стандартный вариант Клинг О3 |
| Kling 3.0 Pro | kling-3.0-pro | 720p | 3–15 сек. | Поддерживает рабочие процессы видео и переходов. |
| Kling 3.0 Standard | kling-3.0-standard | 720p | 3–15 сек. | Стандартный вариант Клинг 3.0 |
| Grok Imagine 1.5 | grok-imagine-1.5 | 720p | 1–15 секунд | Только преобразование изображения в видео; требует --image и соответствует соотношению сторон входного изображения |
| Grok Imagine | grok-imagine | 720p | 1–15 секунд | Более ранний вариант Грока; поддерживает видео, расширение и справочные рабочие процессы |
| Veo 3.1 Lite | veo-3.1-lite | 1080p | 4, 6 или 8 секунд | Поддерживает рабочие процессы видео и двухкадровых переходов. |
| Veo 3.1 Standard | veo-3.1-standard | 2160p | 4, 6 или 8 секунд | Опция Veo с более высоким разрешением |
| Veo 3.1 Fast | veo-3.1-fast | 2160p | 4, 6 или 8 секунд | Более быстрый вариант Veo |
| Sora 2 Pro | sora-2-pro | 1080p | 4, 8 или 12 секунд | Опция Сора с фиксированной продолжительностью |
| Sora 2 | sora-2 | 720p | 4, 8 или 12 секунд | Стандартный вариант Сора |
| PixVerse v5.6 | v5.6 | 1080p | 1–10 секунд | Все еще используется для управления движением и некоторых рабочих процессов генерации. |
| PixVerse v5.5 | v5.5 | 1080p | 1–10 секунд | Используется для рабочих процессов create modify. |
| PixVerse v5 | v5 | 1080p | 1–10 секунд | Используется для рабочих процессов перехода более чем из 3 кадров. |
Анимация статического изображения
Чтобы превратить фотографию или сгенерированное изображение в видео, укажите флаг --image:
Вы можете передать путь к локальному файлу или URL-адрес. Локальные файлы загружаются автоматически — загрузка вручную не требуется. Локальные входные изображения размером более 1920x1920 или 5MB автоматически изменяются или сжимаются перед загрузкой; URL-адреса удаленных изображений проверяются серверной частью как есть.
Для Grok Imagine 1.5 требуется изображение, и выходное соотношение сторон соответствует этому изображению:
Используйте ссылку, переход, управление движением и шаблоны.
Текущий CLI поддерживает больше, чем просто преобразование текста в видео и изображения в видео. Эти режимы создания полезны, когда вам нужен больший контроль над персонажами, ключевыми кадрами, изменениями или эффектами:
Не каждая модель поддерживает все режимы создания. В текущей матрице README create video поддерживает v6, pixverse-c1, Seedance 2.0 Standard/Fast/Mini, Happy Horse 1.0, Kling O3, Kling 3.0, Grok Imagine, Veo 3.1, Sora 2 и v5.6. grok-imagine-1.5 предназначен только для преобразования изображения в видео и требует --image; create extend поддерживает v6 и grok-imagine; create reference поддерживает v6, pixverse-c1, Seedance 2.0 Standard/Fast/Mini, Kling O3, grok-imagine и v5.6; Двухкадровые переходы поддерживают новые семейства видео; Для 3+ кадровых переходов используется v5; create modify использует v5.5; а create motion-control использует v5.6.
Шаг 5: Создайте голос и музыку
Текущий GitHub README документирует автономный звук с помощью специальных команд создания. Используйте create voice для преобразования текста в речь и create music для создания подсказок к музыке. Голосовые и музыкальные выходы сохраняются как аудиоресурсы, поэтому вы можете отслеживать их с помощью task, составлять список с помощью asset list --type audio и загружать с помощью asset download --type audio. Для создания собственной видеосреды используйте --audio или --no-audio в поддерживаемых командах создания видео.
Создать голосовой звук:
Просмотрите модели голоса и предустановленные голоса:
Генерировать музыку:
Для инструментальных треков используйте --instrumental. Для моделей с поддержкой текстов песен передайте тексты песен как буквальный текст, путь к локальному файлу или стандартный ввод:
Текущие семейства голосовых моделей включают модели MiniMax Speech 2.8 и ElevenLabs. Текущие семейства музыкальных моделей включают MiniMax Music, ElevenLabs Music и Google Lyria 3 Pro. Используйте pixverse voice models и pixverse music models для оперативного каталога перед написанием сценария производственного рабочего процесса.
Шаг 6. Запустите интерактивный мастер
Если вы исследуете впервые и еще не знакомы со всеми доступными флагами, запустите любую команду создания без аргументов, чтобы войти в управляемый мастер:
Мастер шаг за шагом проведет вас по подсказкам, выбору модели, качеству, соотношению сторон, продолжительности и другим параметрам, что полезно для определения доступных параметров перед их написанием в сценарии.
За гранью генерации: управляйте своими активами и рабочим пространством
Текущая версия PixVerse CLI также включает команды управления, которые помогут вам построить комплексные рабочие процессы терминала:
pixverse task status <id>иpixverse task wait <id>для опроса задачpixverse task status --ids 123,456,789 --type video --jsonдля проверки статуса партииpixverse asset list,asset upload,asset info,asset downloadиasset deleteдля операций жизненного цикла видео, изображений и аудио ресурсов.pixverse saved list,saved items,saved new,saved rename,saved add,saved removeиsaved deleteдля сохраненных папок.pixverse template categories,template list,template searchиtemplate infoдля поиска эффектов и шаблонов.pixverse voice models,voice presetsиmusic modelsдля обнаружения моделей звука в реальном времениpixverse workspace list,workspace status,workspace switchиworkspace manageдля операций в нескольких рабочих пространствах.pixverse account info,account usageиaccount slotsдля проверки кредитоспособности, использования и параллелизма.pixverse config set,config list,config pathиconfig defaultsдля повторяемых локальных настроек по умолчанию.
Это позволяет легко автоматизировать не только создание, но и организацию, обнаружение шаблонов, обнаружение аудио, загрузку, маршрутизацию рабочей области и доставку в одном сценарии. Если вам нужно запустить одну команду в другой рабочей области, используйте глобальный флаг --workspace-id <id>; 0 нацелен на ваше личное рабочее пространство.
Флаги, дружественные к сценариям
Большая часть автоматизации зависит от предсказуемого результата и предсказуемого поведения во время выполнения. Эти флаги особенно полезны в сценариях и рабочих процессах AI-агента:
| Флаг | Используйте его для |
|---|---|
--json | Возврат структурированного вывода JSON |
-p | Короткий псевдоним для --json |
--count <n> | Сгенерируйте 1–4 варианта по одному запросу |
--seed <number> | Сделать поколение легче воспроизводимым |
--off-peak | Используйте цены в непиковые часы, если они доступны. |
--audio / --no-audio | Включить или отключить генерацию звука для поддерживаемых команд создания. |
--multi-shot / --no-multi-shot | Включить или отключить режим мультикадра для видео |
--no-wait | Отправьте задание и немедленно вернитесь |
--timeout <sec> | Установите тайм-аут опроса, по умолчанию 300 секунд. |
--workspace-id <id> | Переопределить активное рабочее пространство для одной команды |
--trace-id <uuid> | Прикрепите UUIDv4, предоставленный вызывающей стороной, к запросам API для отладки и наблюдения. |
--idempotency-key <key> | Безопасно повторяйте запросы на создание, не создавая случайно дубликаты оплачиваемых заданий. |
Флаги ввода текста теперь легче автоматизировать. --prompt, --text и --lyrics могут принимать литеральную строку, путь к локальному файлу или - в качестве стандартного ввода:
Обучение вашего ИИ-агента созданию медиа
Именно здесь PixVerse CLI становится по-настоящему преобразующим. Поскольку команды могут возвращать структурированный JSON и использовать детерминированные коды завершения, любой ИИ-агент, который может запускать команды оболочки, можно научить генерировать изображения и видео по требованию.
Установка PixVerse Skills
PixVerse Skills— это структурированная библиотека навыков, которая учит агентов правильному использованию CLI: флаги команд, ограничения модели, многоэтапные конвейеры и надежная обработка ошибок.
Для Claude Code и других агентов, поддерживающих формат навыков, добавьте навыки PixVerse напрямую:
Для Cursor, Claude Code, Codex и других платформ агентов этот навык повышает надежность, предоставляя агенту явные ограничения вместо того, чтобы заставлять его выводить их с нуля.
PixVerse CLI также предоставляет компактный машиночитаемый манифест команд по адресу dist/capabilities.json, а общедоступный исходный код доступен как capabilities.json в репозитории GitHub. В этом манифесте описаны команды, флаги, коды выхода, ожидаемые выходные данные JSON и категории эффектов, поэтому агенты могут проверять контракт CLI, не очищая текст справки.
Как только ваш агент загрузит навыки PixVerse, вы можете давать ему инструкции на естественном языке, например:
- «Создайте 10-секундное демонстрационное видео продукта на основе этого скриншота»
- «Создайте четыре варианта обложки этого блога в формате 16:9»
- «Анимируйте эту диаграмму в 5-секундный поясняющий ролик с окружающим звуком»
- «Создать три 8-секундных промо-ролика 16:9 с разными движениями камеры»
Агент преобразует эти инструкции в правильные команды CLI, анализирует выходные данные JSON и обрабатывает опрос и загрузку — ручное вмешательство не требуется.
Claude Code
В Claude Code PixVerse CLI становится встроенным инструментом, который агент использует автономно. После загрузки навыков PixVerse вы можете включить генерацию медиа прямо в любую задачу:
Claude Code вызовет правильные команды CLI, проанализирует URL-адрес изображения из ответа JSON и загрузит файл по указанному вами пути — и все это в рамках того же сеанса, где он также пишет ваш код.
Типичный рабочий процесс Claude Code:
Cursor
Пользователи Cursor могут загрузить PixVerse Skills как файл контекста проекта. Поместите соответствующие файлы навыков в свой каталог .cursor/ или добавьте их в правила своего рабочего пространства. После загрузки Cursor полностью осознает каждую команду PixVerse CLI и может создавать медиафайлы как часть любой задачи кодирования.
Типичный рабочий процесс Cursor: попросите агента создать изображение макета на основе создаваемого вами дизайна, а затем используйте его в качестве ссылки непосредственно в сеансе IDE, даже не выходя из редактора.
Codex и другие агенты
PixVerse CLI совместим с любым агентом, который может выполнять команды оболочки и анализировать JSON. Структурированный формат вывода — согласованные имена полей, предсказуемые коды ошибок и сообщения об ошибках, разделенные stderr, — гарантирует, что даже простые агенты сценариев могут надежно интегрировать генерацию.
Контракт кода выхода упрощает обработку ошибок:
| Код | Значение | Действие агента |
|---|---|---|
| 0 | Успех | Разобрать вывод JSON |
| 1 | Общая ошибка | Проверьте stderr и повторите попытку с проверенными входными данными. |
| 2 | Тайм-аут | Повторите попытку с более длинным --timeout. |
| 3 | Срок действия аутентификации истек | Перезапустите pixverse auth login |
| 4 | Закончились кредиты | Проверить баланс, уведомить пользователя |
| 5 | Генерация не удалась | Попробуйте разные параметры |
| 6 | Ошибка проверки | Просмотрите значения флагов |
Конвейеры автоматизации
Как только вы поймете отдельные команды, PixVerse CLI откроет мощные многоэтапные рабочие процессы, которые выполняются полностью без взаимодействия с пользователем.
Преобразование текста в изображение в видео
Один из наиболее полезных конвейеров: сгенерируйте изображение с высоким разрешением из текстовой подсказки, а затем анимируйте его в видео.
Полный конвейер видеопроизводства
Для идеального результата необходимо создать цепочку с этапами постобработки. Используйте --audio или --no-audio, если вам нужен собственный звук для поддерживаемых команд создания видео, затем используйте create voice для преобразования текста в речь и create music для отдельных музыкальных ресурсов, которые вы будете объединять в дальнейшем:
Пакетная генерация
Для конвейеров контента, требующих нескольких вариантов, запускайте задания параллельно:
Флаг --no-wait отправляет задание и немедленно возвращает его с идентификатором задания, что позволяет вам отправить несколько заданий перед опросом. С помощью --no-wait --json запишите возвращенные идентификаторы задач и решенные параметры создания для протоколирования и воспроизводимости. Используйте --count <n>, если вам нужно несколько вариантов одного запроса, и используйте пакетный task status --ids, если вам нужен один ответ о состоянии для нескольких выполняемых заданий. Команда pixverse task wait выполняет за вас адаптивный опрос.
Настройка значений по умолчанию
Если вы постоянно используете одну и ту же модель, качество или соотношение сторон, установите их по умолчанию, чтобы вам не приходилось каждый раз повторять флаги:
Флаги командной строки всегда переопределяют настроенные вами значения по умолчанию, поэтому вы сохраняете полную гибкость и сокращаете количество повторений. Для автоматизации конкретной рабочей области добавьте --workspace-id <id> к команде, если вы хотите переопределить активную рабочую область для этого одного запуска.
Что вы можете построить
Благодаря интеграции PixVerse CLI в рабочий процесс вашего агента спектр автоматизируемых задач значительно расширяется:
- Документация– автоматическое создание демонстрационных видеороликов и снимков экрана продукта в рамках процесса создания документа.
- Маркетинг— ночные пакетные задания, которые создают варианты контента для социальных сетей из единой библиотеки подсказок.
- Разработка приложений— позвольте вашему агенту кодирования создавать визуальные элементы-заполнители, анимацию макета или видеоролики экрана загрузки, пока вы создаете пользовательский интерфейс.
- Рабочие процессы со звуком— создавайте черновики закадрового голоса, подсказки к музыке или аудиоматериалы для последующего редактирования.
- Конвейеры контента— объединяйте вызовы CLI с другими инструментами (ffmpeg, ImageMagick, облачное хранилище) для создания полностью автоматизированных рабочих процессов производства мультимедиа.
- Прототипирование— создавайте концепции быстрого движения за считанные секунды, чтобы проверить идеи перед тем, как приступить к полному производству.
CLI разработан так, чтобы естественным образом вписаться в любой рабочий процесс на основе оболочки. Если ваша существующая система автоматизации работает на bash, Python, Node или конвейере CI/CD, PixVerse CLI можно использовать без каких-либо дополнительных затрат на интеграцию.
Контрольный список для начала работы
- Установите Node.js 20 или выше.
- Запустите
npm install -g pixverse - Запустите
pixverse auth loginи авторизуйтесь в браузере. - Запустите
pixverse account infoдля проверки кредитов. - Запустите
pixverse account slotsперед параллельной пакетной работой. - Создайте свое первое изображение:
pixverse create image --prompt "..." --json. - Создайте свое первое видео:
pixverse create video --prompt "..." --json. - Создайте свой первый голосовой ресурс:
pixverse create voice --text "..." --json. - Создайте свой первый музыкальный ресурс:
pixverse create music --prompt "..." --json. - Изучите шаблоны с помощью
pixverse template list - Установите PixVerse Skills для своего агента (Claude Code, Cursor или Codex).
- Установите предпочтительные настройки по умолчанию с помощью
pixverse config defaults set - Создайте свой первый конвейер автоматизации
Поддержание CLI в актуальном состоянии
Используйте встроенное средство обновления, чтобы поддерживать актуальность вашего локального CLI:
Вы также можете использовать npm напрямую:
Чтобы узнать об изменениях уровня выпуска и новых поддерживаемых моделях, проверьте официальные источники CLI:
В текущих документах PixVerse V6 указана как модель видео по умолчанию, GPT Image 2 как модель изображения по умолчанию, поддержка Seedance 2.0 Mini, рабочие процессы PixVerse v5 и v5.5 для конкретного режима, специальные команды create voice и create music, управление аудиоресурсами, сохраненные папки, переключение рабочих пространств, config defaults, capabilities.json для агентов, pixverse update, поддержка стандартного ввода текста, --trace-id и --idempotency-key для более безопасных повторных попыток.
Следующие шаги
PixVerse CLI на GitHub и npm (npm install -g pixverse) предоставляют вам немедленный доступ к генерации, опросу задач, управлению активами, шаблонам, сохраненным папкам, проверкам учетных записей, обнаружению аудиомоделей и элементам управления рабочим пространством из единого интерфейса. В репозиторий PixVerse Skills добавлены готовые к работе с агентами руководства, благодаря которым Claude Code, Cursor, Codex и другие инструменты могут выполнять эти рабочие процессы с большей надежностью.
Сочетание надежного CLI и библиотеки навыков, готовой к работе с агентами, означает, что создание изображений, видео, голоса и музыки может осуществляться в том же рабочем процессе, что и ваш код, — под управлением того же агента, в том же терминале, без переключения инструментов.
Начните с одной команды. Стройте оттуда.