Grokは動画生成できますか?Video 1.5、プロンプト、価格、制限
はい、GrokはGrok Imagineで動画を生成できます。Video 1.5更新、text-to-video制限、API価格、プロンプト、PixVerseでの検証ポイントを解説します。
はい、GrokはGrok Imagineを通じて動画を生成できます。ただし正確な答えは、利用するプロダクト画面とモデルによって変わります。xAIのImagine概要ではテキストまたは静止画からの動画生成が説明されていますが、公式のgrok-imagine-video-1.5-preview APIモデルページではImageとVideoのモダリティが示され、このpreviewモデルは現在text-to-videoに対応していないと記載されています。
この違いは、次に何を検証するかを決めるうえで重要です。本ガイドでは、2026年6月のGrok Imagine Video 1.5 Preview更新、コピーして使えるプロンプト、API価格メモ、text-to-videoの制限、画像から動画と動画入力ワークフロー、そしてGrokを他のAI動画モデルと同じ制作フローで比較したい場合のPixVerseの役割を整理します。

Grokは動画を生成できますか?
はい。GrokはGrok Imagineを通じて動画を生成します。公式の xAI Imagine overview は、Imagineを画像生成、画像編集、テキストまたは静止画からの動画生成、動画編集、参照画像から動画、動画延長に対応するモデルファミリーとして説明しています。
ただし「Grokに動画生成はありますか?」への実用的な答えは、単純な「はい」だけではありません。Grok Imagineは静止画を動かし、参照画像ベースのワークフローを扱い、広義のImagineドキュメントでは動画制作や編集のパスも説明されています。一方で、すべてのGrok動画モデルでtext-to-videoを前提にするべきではありません。現在のgrok-imagine-video-1.5-preview APIページは、このモデルがtext-to-videoをサポートしないと明記しています。
そのため制作上の安全な答えは、Grokの動画対応は利用面に依存する、ということです。Grok、X、xAI API、パートナーワークフローのどれを使うのかを確認し、モデル名、入力タイプ、価格、rate limit、出力制約を必ず確認してください。
2026年6月更新:Grok Imagine Video 1.5 Preview
2026年6月3日時点で、xAIには公式の grok-imagine-video-1.5-preview モデルページがあります。重要なのは「Grokは動画を作れる」という話だけではなく、Grok Imagineではプロダクト画面と個別モデルを分けて説明する必要があることです。
モデルページには、モデル名grok-imagine-video-1.5-preview、alias grok-imagine-video-1.5-2026-05-30が記載されています。モダリティはImageとVideoであり、純粋なtext-to-videoパスではありません。また、このモデルは現在text-to-videoに対応していないとされています。
価格について、同じページはoutputを$0.08 per second、image inputを$0.01、video input 480pを$0.08/sec、video input 720pを$0.14/sec、rate limitを60 requests per minuteと記載しています。previewモデルのアクセス、制限、価格は変わる可能性があるため、これらは公式ドキュメントのスナップショットとして扱ってください。
最も安全な表現はこうです。Grok Imagineの広義の動画ワークフローでは、プロダクト画面やモデルによってtext-to-videoが含まれる場合があります。しかし現在のgrok-imagine-video-1.5-preview APIページはImageとVideoのモダリティを示し、text-to-videoはサポートしないとしています。
Grok Imagine vs Grok Imagine Video 1.5 Preview
検証パスや制作briefを決めるときは、この簡易比較が便利です。
| モデル / 画面 | 対応する入力方向 | Text-to-videoの状態 | 向いている用途 |
|---|---|---|---|
| Grok Imagineの広義のプロダクト/APIワークフロー | テキスト、画像、参照、編集、延長が画面によって現れる場合があります。 | Imagine概要では説明されていますが、可用性はモデルと画面に依存します。 | プロンプト、静止画アニメーション、参照、編集、延長を含む広いクリエイティブ探索。 |
grok-imagine-video-1.5-preview APIモデル | 公式モデルページ上は画像と動画入力ワークフロー。 | 現在のモデルページでは非対応。 | 新しいpreviewモデルでの制御された画像から動画、動画入力テスト。 |
どちらを使う場合も、現在のプロダクトアクセス、モデル名、入力タイプ、尺、解像度、保存仕様、安全審査、価格、rate limitを確認してください。コスト計画では、一般的なGrok Imagineの説明ではなく、最新の xAI pricing page と個別モデルページを確認するのが安全です。
2026年のGrok Imagine動画機能
広義のGrok Imagineエコシステムでは、xAIのImagineドキュメントに、設定可能な動画生成、画像から動画、動画編集、参照画像から動画、延長ワークフローが掲載されています。2026年の重要なポイントは、これらの機能を必ず個別モデルページと照合することです。
対応画面が文章プロンプトを受け付ける場合、text-to-videoは短いSNSクリップ、商品ムード、meme案、映画的なラフなど、素早いコンセプト探索に向いています。ただし1.5 Preview APIモデルでは、モデルページが更新されるまでこのパスを前提にしないでください。
画像から動画は、商品写真、ポスター、キャラクター、サムネイル、コンセプトフレームに向いた、より制御しやすいルートです。静止画が最初のフレームを固定するため、形状、構図、同一性が重要なときに役立ちます。
参照画像から動画は、参照画像をそのまま最初のフレームにせず、視覚的な同一性を繰り返したい場合に有効です。キャラクター、商品シルエット、衣装、スタイル、反復オブジェクトに向いています。
動画編集と延長は、より制作寄りのワークフローです。編集は既存クリップの一部を変え、他の部分を維持することを狙います。延長は最後のフレームから続きを作ります。天候変更、リスタイル、次の展開、別エンディング、ショート動画のテンポ検証に使えます。
動画化したいGrok Imagineプロンプト
商品安定性、人物モーション、映画的な環境制御という異なる強みを示すプロンプトから始めましょう。text-to-video対応のGrok Imagine画面を使う場合はそのまま使えます。grok-imagine-video-1.5-previewを試す場合は、まず開始画像を作成またはアップロードし、プロンプトを動き、カメラ、スタイルの指示として使ってください。
1. 商品広告プロンプト
商品可読性、表面ディテール、光の動き、広告らしい仕上がりをテストします。
プロンプト:
A compact black wireless speaker sits on a rain-slicked rooftop at night. Neon signs reflect across the wet surface and tiny droplets bead on the speaker grille. The camera begins in an extreme macro close-up on the droplets, then slowly pulls back to reveal the skyline. A soft blue light pulses once around the speaker rim as rain falls in slow motion. Realistic premium product commercial, shallow depth of field, vertical 9:16, no text, no logo distortion.
結果メモ: 強い出力は高級ローンチティーザーのように見えるはずです。商品シルエットが読め、雨が自然で、スピーカーを失わずに街並みへ引いていくカメラが滑らかであること。主な弱点は商品ドリフトです。グリル、リム、本体形状が動きの中で変わりすぎる場合、映像は魅力的でも実商品制作には使いにくくなります。
2. キャラクターSNSクリッププロンプト
顔の安定性、体の動き、場面転換、ショート動画のフック感をテストします。
プロンプト:
A stylish young creator in a silver jacket stands in a tiny elevator lined with mirrored panels. The lights flicker once, then the elevator doors open onto a surreal midnight city street filled with glowing billboards and drifting steam. The camera tracks backward as she steps out, smiles at the camera, and raises a small camera toward the viewer. Fast social hook, cinematic but playful, crisp facial detail, smooth motion, vertical 9:16, no captions.
結果メモ: このプロンプトは、Grok Imagineが速いSNSフックの中で人物を保てるかを見るのに向いています。良い結果では、エレベーターから街へのリビールが驚きつつも連続して見えます。リスクは顔の不安定さです。笑顔、目、ジャケットの細部がショット間でずれると、雰囲気テストとしては使えても完成度の高いクリエイター広告には弱くなります。
3. 映画的環境プロンプト
カメラスケール、反射、環境モーション、映画的構図をテストします。
プロンプト:
A lone astronaut walks across a shallow mirror-like salt flat at sunrise. The sky is pale orange and violet, and a huge broken moon hangs low on the horizon. Each step sends a soft ripple through the reflective water. The camera starts behind the astronaut, then slowly cranes upward to reveal the vast landscape and a distant glowing research station. Epic cinematic sci-fi mood, realistic reflections, slow graceful motion, widescreen 16:9, no text.
結果メモ: 3本の中で最も強いシネマティックな負荷テストです。スケール、反射、制御されたカメラ移動を同時に要求します。良い結果は、塩湖、波紋、月、クレーンアップが空間的につながって見えます。よくある失敗は、美しいが動きが曖昧なことです。壮大に見えても、宇宙飛行士、反射、遠くの研究基地が一貫しない場合があります。
用途別Grok Imagineプロンプト集
より広くテストしたい場合に使える追加プロンプトです。text-to-video例は、テキストのみで動画生成できるGrok Imagine画面向けです。Grok Imagine Video 1.5 Previewでは、ソース画像とモーション指示のbriefとして扱ってください。
テキストから動画:memeやトレンド短尺
A tiny robot barista tries to make latte art inside a crowded futuristic cafe. The foam accidentally forms a perfect smiley face, and everyone at the counter reacts with surprised laughter. Quick comedic timing, handheld social video feel, warm cafe lighting, clear robot expression, vertical 9:16, no text overlays.
テキストから動画:ビューティー/ファッション
A fashion model wearing a translucent raincoat walks through a glowing tunnel of blue LED lights. The camera tracks beside her in slow motion as water droplets sparkle on the fabric. High-fashion editorial look, crisp facial detail, glossy reflections, controlled runway pacing, vertical 9:16.
テキストから動画:フードASMR
A chef slices a glossy mango on a dark stone board under warm morning light. Juice beads along the knife edge, thin slices fan open in perfect rhythm, and a soft breeze moves a linen napkin in the background. Macro food commercial, shallow depth of field, smooth slow motion, no text.
画像から動画:商品ティーザー
Animate the uploaded product image into a premium launch teaser. Keep the product shape, color, label, and camera angle consistent. Add a slow push-in, a subtle light sweep across the surface, tiny particles floating in the background, and a clean studio shadow shift. No extra text, no extra objects, vertical 9:16.
画像から動画:ポスターアニメーション
Animate this movie poster as a short atmospheric teaser. Keep the main character, composition, title placement, and color palette unchanged. Add drifting fog, a slow camera push toward the character’s face, faint background light movement, and subtle fabric motion. Cinematic suspense mood, no new text.
参照画像から動画:キャラクター一貫性テスト
Use the reference images to preserve the character’s face, hairstyle, jacket, and color palette. Generate a new shot where the character walks through a rainy train station at night, glances over their shoulder, then disappears into a passing crowd. Smooth tracking shot, realistic reflections, moody thriller lighting, no extra characters with the same face.
参照画像から動画:商品同一性テスト
Use the reference images to preserve the product silhouette, material, color, and front label. Create a new studio scene where the product rotates slowly on a matte black pedestal while a narrow beam of light moves across the surface. Premium hardware launch style, minimal background, no logo distortion, no text changes.
動画編集:天候変更
Change the scene from sunny afternoon to light rain at dusk. Preserve the people, camera angle, building layout, and original action. Add wet pavement reflections, soft gray-blue lighting, small raindrops, and a calm cinematic mood. Do not add new people or text.
動画編集:商品色変更
Change only the product body color from white to deep matte black. Preserve the logo placement, shape, camera movement, hands, table, background, and lighting direction. Keep the rest of the scene unchanged and realistic.
動画延長:次の展開
Continue from the final frame. The camera pulls back slightly as the product lights turn on, a subtle blue pulse moves around the edge, and the background reflections become brighter. Keep the same product, setting, camera angle, lighting mood, and color palette.
動画延長:ストーリーの終わり
Continue from the final frame. The character pauses, turns toward the distant glowing doorway, and takes one slow step forward as the light brightens. Keep the same character design, wardrobe, environment, camera movement, and cinematic mood.
Grok Imagine動画プロンプトを上手く書く方法
Grokの動画プロンプトは、見た目だけでなく「動き」を書くとよく機能します。よいプロンプトは次の5点に答えるべきです。
- 読み取り可能に保つ主体を明確にします。人物、商品、物体、キャラクター、シーンなどです。
- クリップ内で何が変わるかを書きます。歩く、振り向く、光が走る、雨が降る、カメラが動くなどです。
- カメラ挙動を加えます。プッシュイン、引き、トラッキング、クレーンアップ、手持ち、マクロ、俯瞰などです。
- 環境を設定します。場所、時間帯、照明、天候、背景の動き、空気感です。
- 素材を守る制約を入れます。文字なし、ロゴを歪めない、商品ラベルを維持、人物同一性を保つ、余計な人物を出さない、などです。
画像から動画や参照画像から動画では、控えめに書くことが重要です。画像はすでに主体、構図、スタイルを持っているため、プロンプトは動き、カメラ、雰囲気、変えてはいけない要素に集中させます。
Grok Imagine Video 1.5の価格とAPIメモ
現在のxAIドキュメントでは、grok-imagine-video-1.5-previewの価格がより明確になっています。これらの数字はテスト計画には便利ですが、本番前には必ず再確認してください。
中心となる費用はoutputの$0.08 per secondです。つまり生成コストはリクエスト数だけでなく、クリップの秒数で見積もる必要があります。image inputは$0.01なので、静止画テストは比較的見積もりやすいです。video inputは高く、480p inputが$0.08/sec、720p inputが$0.14/secです。短い編集テストでも、反復が多いと費用は増えます。
モデルページには60 requests per minuteも記載されています。構造化テストには十分ですが、自動化を組む前にアカウント権限、リージョン可用性、現在のrate limitを確認してください。
短尺がワークフローを決めます。 Grok Imagineは短いクリップ生成として扱いましょう。長尺では複数クリップ、延長、編集工程を前提にします。
一貫性にはアンカーが必要です。 人物、商品、服装、物体を安定させたい場合、純粋なtext-to-videoより画像から動画や参照画像のほうが安全です。
文字とロゴは必ず確認します。 AI動画は読めるように見えるが正しくないラベルを生成することがあります。公開前に画面上の文字を確認してください。
安全ポリシーも重要です。 同意のない肖像編集、誤解を招く身元変更、実在人物の性的表現、その他センシティブな変換に依存するワークフローは避けてください。
Grok Imagine Video 1.5をテストする方法
Grok Imagine Video 1.5 Previewを、きれいなプロンプト1つだけで判断しないでください。実制作に近い入力を使い、キャンペーンと同じ基準で評価します。
まず画像から動画を試します。商品写真、パッケージ、ECヒーロー画像、ポートレート、キャラクター案、ポスター、キャンペーンサムネイルを用意します。カメラプッシュ、光の移動、軽いジェスチャー、背景の空気感、霧、布の揺れ、前景粒子など、制御された動きを加えるよう指示します。目的は派手さではなく、主体が保たれたまま映像に生命感が出るかを見ることです。
次に、動きが明確でフレーミングが安定した短い動画入力を試します。天候、照明、ムード、カラー処理、商品色、背景の時間帯、アート方向など、1回に1つだけ変えてください。これにより、モデルが動きと構図を保ったまま、指定要素だけを変えられるか分かります。
評価指標は5つです。主体一貫性、モーションの自然さ、プロンプト遵守、文字/ロゴの正確さ、商用利用可能性。美しくても商品形状が変わったりロゴが読めなかったりする場合、広告、ECページ、ブランド施策にはまだ使えません。
PixVerseでGrok Imagineテストを受け止める方法
Grokを他のAI動画モデルと比較したい場合、またtext-to-video、image-to-video、reference control、ショート広告ワークフロー、複数回の反復が必要な場合、PixVerseは単一APIに依存するのではなく、テストワークフローとして使えます。
PixVerseでは、Grokを利用可能なモデル選択肢の1つとして扱えます。同じプロンプト、画像、参照アイデアを複数モデルで試し、動き、同一性、プロンプト遵守、出力品質、反復コストを比較して、公開に最適なクリップを選びます。
Grok Imagineはどこで試せますか?
試す方法はいくつかあり、それぞれ向いている目的が違います。
GrokまたはXのプロダクト画面は、一般ユーザーの素早い実験やSNSアイデアに向いています。ただし、地域、プラン、画面で動画生成が使えるかを確認してから判断してください。
xAI APIは、開発者ワークフロー、自動化、制御された実験に向いています。本番利用前に、現在のAPI価格、入力タイプ、解像度、尺、rate limit、生成アセットの保存方法を確認しましょう。
PixVerseは、1つの制作環境でGrokと他のAI動画モデルを比較したいときに実用的です。重要なのはGrokが動くかだけではなく、どのモデルがあなたのプロンプト、参照画像、スタイル、公開チャネルに最も合うかです。
Grokを他のAI動画オプションと同じ制作ワークフローで試したい場合は、別記事の Grok Imagine on PixVerse guide をご覧ください。そちらはPixVerse向けのチュートリアルで、本記事はGrok Imagineの機能、プロンプト、制限、判断ポイントを説明します。
FAQ:Grok Imagine動画生成
Grokは動画を生成できますか?
はい。GrokはGrok Imagineを通じて動画を生成できます。2026年の重要点は、機能が画面とモデルによって異なることです。広義のGrok Imagineドキュメントにはテキストまたは静止画からの動画生成が含まれますが、grok-imagine-video-1.5-previewは画像/動画入力のpreviewモデルとして記載され、現在text-to-videoには対応していません。
Grok Imagine Video 1.5はtext-to-videoに対応していますか?
現在のxAIモデルページによれば、対応していません。公式のgrok-imagine-video-1.5-previewページはImageとVideoのモダリティを示し、このモデルは現在text-to-videoをサポートしないと記載しています。
grok-imagine-video-1.5-previewとは何ですか?
grok-imagine-video-1.5-previewは、Grok Imagine動画ワークフロー向けのxAI公式preview APIモデルです。モデルページにはalias grok-imagine-video-1.5-2026-05-30、Image/Videoモダリティ、output $0.08/sec、60 RPM rate limitが記載されています。
Grok Imagine Video 1.5の価格はいくらですか?
xAIドキュメントでは、grok-imagine-video-1.5-previewのoutputは生成1秒あたり$0.08です。同じモデルページはimage inputを$0.01、video input 480pを$0.08/sec、video input 720pを$0.14/secとしています。preview価格は変わる可能性があるため、本番前に公式ドキュメントを確認してください。
Grok ImagineとGrok Imagine Video 1.5 Previewの違いは?
Grok Imagineは広義の画像・動画生成ファミリーまたはプロダクト画面です。Grok Imagine Video 1.5 Previewは、モデル名、alias、モダリティ、価格、rate limitを持つ具体的なAPIモデルです。そのため「Grokはtext-to-videoに対応」といった一般論は、実際に使うモデルで確認する必要があります。
Grokには画像から動画生成がありますか?
はい。Grok Imagineは静止画をテキストプロンプトで動かせます。画像が視覚的な開始点になるため、商品、ポスター、キャラクター、サムネイル、制御されたビジュアル案に向いています。
Grok Imagineは画像から動画とtext-to-videoのどちらに向いていますか?
現在のgrok-imagine-video-1.5-preview APIモデルでは、画像から動画と動画入力テストに集中するのが安全です。モデルページがtext-to-video非対応と示しているためです。text-to-video対応の広義のGrok Imagine画面では、素早いアイデア探索にはテキスト、商品形状や同一性、構図、スタイルを守るには画像から動画が向いています。
PixVerseでGrok Imagineを他のAI動画モデルと比較できますか?
はい。PixVerseではGrokをモデル選択肢の1つとして、他の利用可能なAI動画モデルと一緒にテストできます。同じプロンプト、画像、参照アイデアで比較し、主体一貫性、モーション、プロンプト遵守、文字/ロゴ精度、商用利用可能性、反復コストを見ます。
最適なGrok Imagine動画プロンプト構造は?
主体、動き、カメラ、環境、制約を入れます。たとえば、主体と動きを先に書き、次にカメラ移動、照明、雰囲気、出力形式、文字なしや商品ラベル維持などの制約を追加します。
Grok Imagineは動画編集に対応していますか?
はい。xAIは既存動画を提供し、残りのシーンを保ちながら変更内容を自然言語で指示するプロンプトベースの動画編集を文書化しています。
Grok Imagineは参照画像を使えますか?
はい。参照画像から動画では、参照画像を最初のフレームに固定せずに出力を導けます。人物同一性、商品形状、衣装、ビジュアルスタイル、繰り返し使う物体に便利です。
Grok Imagine動画の長さはどれくらいですか?
xAIの現行動画概要では、生成は最大15秒、編集入力動画は最大8.7秒、延長出力は2から10秒で、入力動画要件もあります。最終納品を計画する前に、必ず現在の画面またはAPIドキュメントを確認してください。
Grokの動画生成が表示されないのはなぜですか?
可用性はプロダクト画面、アカウント、地域、ロールアウト段階、アクセス経路によって変わります。ある画面で見えない場合は、現在のGrok、X、xAI API、または対応パートナーワークフローを確認してください。
まとめ
Grokは動画を生成できます。ただし重要なのは、どのGrok Imagine画面またはモデルを指しているかです。広義のGrok Imagineでは、テキスト、静止画、参照、編集、延長が関係します。grok-imagine-video-1.5-previewでは、公式の画像/動画入力ワークフローに集中し、text-to-video対応を前提にしないでください。
実際の検証では「はい」で止めないことが大切です。上記の2026年6月モデル情報、価格メモ、プロンプト、評価フローを使い、Grokを直接試すのか、xAI APIを使うのか、PixVerseで他のAI動画モデルと比較するのかを判断しましょう。