Grok peut-il générer des vidéos ? Video 1.5, prompts, prix et limites
Oui, Grok peut générer des vidéos avec Grok Imagine. Découvrez Video 1.5, limites text-to-video, prix API, prompts et tests PixVerse.
Oui, Grok peut générer des vidéos via Grok Imagine, mais la réponse exacte dépend de la surface produit et du modèle. La documentation générale xAI Imagine décrit la génération vidéo à partir de texte ou d’images fixes, tandis que la page officielle du modèle API grok-imagine-video-1.5-preview liste les modalités Image et Video et indique que ce modèle preview ne prend actuellement pas en charge le text-to-video.
Cette distinction compte si vous décidez quoi tester ensuite. Ce guide couvre la mise à jour de juin 2026 de Grok Imagine Video 1.5 Preview, les prompts prêts à copier, les notes de prix API, les limites text-to-video, les workflows image-to-video et video input, ainsi que la place de PixVerse lorsque vous voulez comparer Grok avec d’autres modèles vidéo IA dans un même workflow créatif.

Grok peut-il générer des vidéos ?
Oui. Grok génère des vidéos via Grok Imagine, la famille de modèles image et vidéo de xAI. Le xAI Imagine overview officiel décrit Imagine comme prenant en charge la génération d’images, l’édition d’images, la génération vidéo depuis du texte ou des images fixes, l’édition vidéo, le reference-to-video et l’extension vidéo.
Pour une recherche sur la génération vidéo de Grok, la réponse utile est plus nuancée qu’un simple oui. Grok Imagine peut animer des images fixes, prendre en charge des workflows avec références et couvrir des chemins de création ou d’édition vidéo dans la documentation large d’Imagine. Mais il ne faut pas supposer que chaque modèle vidéo Grok prend en charge le text-to-video. La page actuelle de grok-imagine-video-1.5-preview indique explicitement que ce modèle ne le prend pas en charge.
La réponse la plus sûre en production est donc : le support vidéo de Grok dépend de la surface utilisée. Vérifiez si vous travaillez dans Grok, X, l’API xAI ou un workflow partenaire, puis confirmez le nom exact du modèle, le type d’entrée, le prix, le rate limit et les contraintes de sortie.
Mise à jour de juin 2026 : Grok Imagine Video 1.5 Preview
Au 3 juin 2026, xAI dispose d’une page officielle pour grok-imagine-video-1.5-preview. L’enjeu n’est pas seulement de dire que Grok peut faire de la vidéo, mais de distinguer surface produit et modèle précis.
La page liste grok-imagine-video-1.5-preview comme nom de modèle et grok-imagine-video-1.5-2026-05-30 comme alias. Elle indique les modalités Image et Video, pas un chemin text-to-video pur. Elle précise aussi que le modèle ne prend actuellement pas en charge le text-to-video.
Côté prix, la même page liste l’output à $0.08 per second, l’image input à $0.01, le video input 480p à $0.08/sec, le video input 720p à $0.14/sec et une limite de 60 requests par minute. Traitez ces chiffres comme un instantané officiel, car l’accès, les limites et les prix d’un modèle preview peuvent changer.
La formulation la plus sûre est : les workflows vidéo larges de Grok Imagine peuvent inclure le text-to-video selon la surface et le modèle, mais la page actuelle de grok-imagine-video-1.5-preview liste Image et Video et dit que le text-to-video n’est pas pris en charge.
Grok Imagine vs Grok Imagine Video 1.5 Preview
Utilisez cette comparaison compacte pour choisir un test ou rédiger un brief de production.
| Modèle / surface | Direction d’entrée | Statut text-to-video | Meilleur usage |
|---|---|---|---|
| Workflows larges Grok Imagine produit/API | Texte, image, référence, édition et extension peuvent exister selon la surface. | Décrit dans l’overview Imagine, mais la disponibilité dépend du modèle et de la surface. | Exploration créative large avec prompts, animation d’images fixes, références, édition et extension. |
Modèle API grok-imagine-video-1.5-preview | Workflows avec entrée image et vidéo selon la page officielle. | Non pris en charge sur la page actuelle. | Tests contrôlés image-to-video et video input avec le nouveau modèle preview. |
Avant d’utiliser l’un ou l’autre, vérifiez l’accès actuel, le nom du modèle, le type d’entrée, la durée, la résolution, le stockage, la revue de sécurité, les prix et rate limits. Pour les coûts, consultez la xAI pricing page actuelle et la page du modèle spécifique.
Fonctions vidéo de Grok Imagine en 2026
Dans l’écosystème Grok Imagine plus large, la documentation xAI liste génération vidéo configurable, image-to-video, édition vidéo, reference-to-video et extension. Le point clé en 2026 est de vérifier ces capacités sur la page du modèle exact.
Le text-to-video est utile lorsque la surface accepte un prompt écrit et que vous voulez explorer vite : clips sociaux, moods produit, idées meme ou esquisses cinématographiques. Pour le modèle API 1.5 Preview, ne supposez pas ce chemin tant que la page ne change pas.
L’image-to-video est plus contrôlé pour photos produit, affiches, personnages, thumbnails et frames de concept. L’image fixe ancre le premier frame, ce qui aide pour la forme, la composition et l’identité.
Le reference-to-video sert à garder une identité visuelle sans imposer la référence comme premier frame. Il convient aux personnages, silhouettes produit, tenues, styles et objets récurrents.
L’édition et l’extension vidéo sont plus orientées production. L’édition modifie un clip existant tout en préservant le reste ; l’extension continue depuis le dernier frame. Ces workflows aident pour météo, restyling, second beat, fins alternatives et rythme short-form.
Prompts Grok Imagine à transformer en vidéos
Commencez par des prompts qui testent stabilité produit, mouvement humain et contrôle d’environnement cinématographique. Si votre surface Grok Imagine prend en charge le text-to-video, utilisez-les directement. Si vous testez grok-imagine-video-1.5-preview, créez ou chargez d’abord une image de départ, puis utilisez le prompt comme direction de mouvement, caméra et style.
1. Prompt publicité produit
Testez lisibilité produit, détails de surface, mouvement lumineux et finition commerciale.
Prompt :
A compact black wireless speaker sits on a rain-slicked rooftop at night. Neon signs reflect across the wet surface and tiny droplets bead on the speaker grille. The camera begins in an extreme macro close-up on the droplets, then slowly pulls back to reveal the skyline. A soft blue light pulses once around the speaker rim as rain falls in slow motion. Realistic premium product commercial, shallow depth of field, vertical 9:16, no text, no logo distortion.
Note de résultat: Un bon résultat doit ressembler à un teaser premium : silhouette lisible, pluie crédible et pull-back fluide sans perdre le produit. Le risque principal est le drift produit : si grille, bord ou corps changent trop, le clip est beau mais moins utile pour un vrai workflow produit.
2. Prompt clip social avec personnage
Testez stabilité du visage, mouvement du corps, transition de scène et énergie social hook.
Prompt :
A stylish young creator in a silver jacket stands in a tiny elevator lined with mirrored panels. The lights flicker once, then the elevator doors open onto a surreal midnight city street filled with glowing billboards and drifting steam. The camera tracks backward as she steps out, smiles at the camera, and raises a small camera toward the viewer. Fast social hook, cinematic but playful, crisp facial detail, smooth motion, vertical 9:16, no captions.
Note de résultat: Ce prompt teste si Grok Imagine garde une personne stable dans un hook social rapide. Le meilleur résultat rend la transition ascenseur-rue surprenante mais continue. Le risque est l’instabilité du visage : sourire, yeux ou veste peuvent dériver.
3. Prompt environnement cinématique
Testez échelle caméra, reflets, mouvement d’environnement et composition cinématique.
Prompt :
A lone astronaut walks across a shallow mirror-like salt flat at sunrise. The sky is pale orange and violet, and a huge broken moon hangs low on the horizon. Each step sends a soft ripple through the reflective water. The camera starts behind the astronaut, then slowly cranes upward to reveal the vast landscape and a distant glowing research station. Epic cinematic sci-fi mood, realistic reflections, slow graceful motion, widescreen 16:9, no text.
Note de résultat: C’est le test cinématique le plus fort : échelle, reflets et caméra contrôlée. Un bon rendu relie salines, ondulations, lune et crane-up. L’échec fréquent est beau mais vague : astronaute, reflet ou station deviennent incohérents.
Plus de prompts Grok Imagine pour différents cas
Utilisez ces prompts pour une couverture plus large. Les exemples text-to-video conviennent aux surfaces Grok Imagine qui acceptent une génération depuis texte seul. Pour Grok Imagine Video 1.5 Preview, traitez-les comme des briefs pour image source plus prompt de mouvement.
Text-to-Video : meme ou tendance rapide
A tiny robot barista tries to make latte art inside a crowded futuristic cafe. The foam accidentally forms a perfect smiley face, and everyone at the counter reacts with surprised laughter. Quick comedic timing, handheld social video feel, warm cafe lighting, clear robot expression, vertical 9:16, no text overlays.
Text-to-Video : beauté ou mode
A fashion model wearing a translucent raincoat walks through a glowing tunnel of blue LED lights. The camera tracks beside her in slow motion as water droplets sparkle on the fabric. High-fashion editorial look, crisp facial detail, glossy reflections, controlled runway pacing, vertical 9:16.
Text-to-Video : food ASMR
A chef slices a glossy mango on a dark stone board under warm morning light. Juice beads along the knife edge, thin slices fan open in perfect rhythm, and a soft breeze moves a linen napkin in the background. Macro food commercial, shallow depth of field, smooth slow motion, no text.
Image-to-Video : teaser produit
Animate the uploaded product image into a premium launch teaser. Keep the product shape, color, label, and camera angle consistent. Add a slow push-in, a subtle light sweep across the surface, tiny particles floating in the background, and a clean studio shadow shift. No extra text, no extra objects, vertical 9:16.
Image-to-Video : animation d’affiche
Animate this movie poster as a short atmospheric teaser. Keep the main character, composition, title placement, and color palette unchanged. Add drifting fog, a slow camera push toward the character’s face, faint background light movement, and subtle fabric motion. Cinematic suspense mood, no new text.
Reference-to-Video : test de cohérence personnage
Use the reference images to preserve the character’s face, hairstyle, jacket, and color palette. Generate a new shot where the character walks through a rainy train station at night, glances over their shoulder, then disappears into a passing crowd. Smooth tracking shot, realistic reflections, moody thriller lighting, no extra characters with the same face.
Reference-to-Video : test d’identité produit
Use the reference images to preserve the product silhouette, material, color, and front label. Create a new studio scene where the product rotates slowly on a matte black pedestal while a narrow beam of light moves across the surface. Premium hardware launch style, minimal background, no logo distortion, no text changes.
Édition vidéo : changement météo
Change the scene from sunny afternoon to light rain at dusk. Preserve the people, camera angle, building layout, and original action. Add wet pavement reflections, soft gray-blue lighting, small raindrops, and a calm cinematic mood. Do not add new people or text.
Édition vidéo : changement de couleur produit
Change only the product body color from white to deep matte black. Preserve the logo placement, shape, camera movement, hands, table, background, and lighting direction. Keep the rest of the scene unchanged and realistic.
Extension vidéo : second beat
Continue from the final frame. The camera pulls back slightly as the product lights turn on, a subtle blue pulse moves around the edge, and the background reflections become brighter. Keep the same product, setting, camera angle, lighting mood, and color palette.
Extension vidéo : fin d’histoire
Continue from the final frame. The character pauses, turns toward the distant glowing doorway, and takes one slow step forward as the light brightens. Keep the same character design, wardrobe, environment, camera movement, and cinematic mood.
Comment écrire de meilleurs prompts vidéo Grok Imagine
Les prompts vidéo Grok fonctionnent mieux lorsqu’ils décrivent le mouvement, pas seulement l’apparence. Un bon prompt répond à cinq points :
- Nommez le sujet qui doit rester lisible : personne, produit, objet, personnage ou scène.
- Décrivez ce qui change dans le clip : marche, rotation, balayage lumineux, pluie ou mouvement caméra.
- Ajoutez le comportement caméra : push-in, pull-back, tracking, crane-up, handheld, macro ou overhead.
- Définissez l’environnement : lieu, moment, lumière, météo, mouvement de fond et atmosphère.
- Ajoutez des contraintes de protection : pas de texte, ne pas déformer le logo, garder l’étiquette produit, préserver l’identité, éviter les personnes en trop.
Pour image-to-video et reference-to-video, la retenue est essentielle. L’image porte déjà sujet, composition et style ; le prompt doit se concentrer sur mouvement, caméra, atmosphère et éléments à préserver.
Prix et notes API de Grok Imagine Video 1.5
La documentation xAI rend les prix de grok-imagine-video-1.5-preview plus explicites. Ces chiffres aident pour les tests, mais doivent être revérifiés avant production.
Le coût principal est l’output à $0.08 per second : le budget se calcule donc par durée de clip, pas seulement par nombre de requêtes. L’image input est listé à $0.01; le video input coûte plus cher : $0.08/sec en 480p et $0.14/sec en 720p. Même de courts tests d’édition peuvent donc coûter si vous itérez beaucoup.
La page liste aussi 60 requests par minute. C’est suffisant pour des tests structurés, mais vérifiez accès de compte, région et rate limit actuel avant d’automatiser.
La courte durée structure le workflow. Traitez Grok Imagine comme un générateur de clips courts. Pour du contenu plus long, prévoyez plusieurs clips, extensions ou montage.
La cohérence a besoin d’ancrage. Si personne, produit, tenue ou objet doivent rester stables, image-to-video ou reference-to-video est souvent plus sûr qu’un text-to-video pur.
Texte et logos doivent être revus. Les modèles vidéo peuvent produire des labels qui semblent lisibles mais sont faux. Vérifiez tout texte à l’écran.
Les politiques de sécurité comptent. Évitez les workflows reposant sur likeness non consenti, changements d’identité trompeurs, sexualisation de personnes réelles ou transformations sensibles.
Comment tester Grok Imagine Video 1.5
Ne jugez pas Grok Imagine Video 1.5 Preview avec un seul beau prompt. Testez des entrées proches de la production et notez comme pour une vraie campagne.
Commencez par image-to-video. Utilisez photo produit propre, packaging, hero frame ecommerce, portrait, concept de personnage, affiche ou thumbnail campagne. Demandez un mouvement contrôlé : push caméra, balayage lumineux, geste subtil, atmosphère, brouillard, tissu ou particules. L’objectif n’est pas le maximum de drama, mais de voir si le sujet reste intact.
Testez ensuite video input avec des clips courts, action claire et framing stable. Demandez un seul changement à la fois : météo, lumière, mood, couleur, couleur produit, heure de fond ou direction artistique. Cela montre si le modèle préserve mouvement et composition en changeant seulement l’attribut demandé.
Notez cinq critères : cohérence du sujet, cohérence du mouvement, respect du prompt, exactitude texte/logo et utilité commerciale. Un clip beau mais avec produit déformé ou logo illisible n’est pas prêt pour publicité, ecommerce ou campagne de marque.
Comment PixVerse aide à tester Grok Imagine
Si vous voulez comparer Grok avec d’autres modèles vidéo IA, ou si vous avez besoin de text-to-video, image-to-video, reference control, workflows pub short-form et itérations, PixVerse sert de workflow de test plutôt que de dépendance à un seul modèle.
Sur PixVerse, traitez Grok comme une option parmi d’autres modèles disponibles. Lancez le même prompt, image ou idée de référence sur plusieurs modèles, puis comparez mouvement, stabilité d’identité, respect du prompt, qualité de sortie et coût d’itération avant de choisir le clip à publier.
Où essayer Grok Imagine ?
Plusieurs chemins existent, chacun pour un besoin différent.
Les surfaces Grok ou X sont les plus simples pour expérimenter vite et créer des idées sociales. Vérifiez toutefois que la génération vidéo est disponible dans votre région, votre plan et votre interface.
L’API xAI convient mieux aux workflows développeur, à l’automatisation et aux expériences contrôlées. Avant production, vérifiez les prix API, types d’entrée, résolution, durée, rate limits et stockage des assets générés.
PixVerse est le chemin pratique pour comparer Grok avec d’autres modèles vidéo IA dans un même environnement créatif. La question n’est pas seulement de savoir si Grok fonctionne, mais quel modèle produit le meilleur résultat pour votre prompt, image de référence, style et canal.
Si votre prochaine étape consiste à tester Grok dans un workflow créateur avec d’autres options vidéo IA, lisez notre Grok Imagine on PixVerse guide. Cette page est le tutoriel PixVerse ; cet article explique capacités, prompts, limites et décisions Grok Imagine.
FAQ : générateur vidéo Grok Imagine
Grok peut-il générer des vidéos ?
Oui. Grok peut générer des vidéos via Grok Imagine. Le point important en 2026 est que les capacités varient selon surface et modèle : la documentation large inclut la génération depuis texte ou image fixe, tandis que grok-imagine-video-1.5-preview est documenté comme modèle preview image/video input et ne prend pas actuellement en charge le text-to-video.
Grok Imagine Video 1.5 prend-il en charge text-to-video ?
Non, selon la page actuelle du modèle xAI. La page officielle grok-imagine-video-1.5-preview liste Image et Video et indique que le modèle ne prend actuellement pas en charge text-to-video.
Qu’est-ce que grok-imagine-video-1.5-preview ?
grok-imagine-video-1.5-preview est le modèle API preview officiel de xAI pour les workflows vidéo Grok Imagine. La page liste l’alias grok-imagine-video-1.5-2026-05-30, les modalités Image/Video, output $0.08/sec et un rate limit de 60 RPM.
Combien coûte Grok Imagine Video 1.5 ?
Selon xAI, l’output de grok-imagine-video-1.5-preview coûte $0.08 par seconde générée. La page liste aussi image input $0.01, video input 480p $0.08/sec et video input 720p $0.14/sec. Vérifiez la documentation officielle avant production.
Quelle différence entre Grok Imagine et Grok Imagine Video 1.5 Preview ?
Grok Imagine est la famille ou surface large de génération image/vidéo. Grok Imagine Video 1.5 Preview est un modèle API précis avec nom, alias, modalités, prix et rate limit. Toute affirmation générale sur text-to-video doit donc être vérifiée sur le modèle exact.
Grok a-t-il image-to-video ?
Oui. Grok Imagine peut animer une image fixe avec un prompt texte. L’image sert de point de départ visuel, utile pour produits, affiches, personnages, thumbnails et concepts contrôlés.
Grok Imagine est-il meilleur pour image-to-video ou text-to-video ?
Pour grok-imagine-video-1.5-preview, image-to-video et video input sont le focus le plus sûr car la page dit que text-to-video n’est pas pris en charge. Sur les surfaces qui le supportent, utilisez le texte pour explorer vite et image-to-video quand forme, identité, composition ou style doivent rester cohérents.
Puis-je comparer Grok Imagine avec d’autres modèles sur PixVerse ?
Oui. PixVerse permet de tester Grok comme une option parmi d’autres modèles vidéo IA. Utilisez le même prompt, image ou référence, puis comparez cohérence du sujet, mouvement, respect du prompt, exactitude texte/logo, utilité commerciale et coût d’itération.
Quelle est la meilleure structure de prompt vidéo Grok Imagine ?
Utilisez sujet, action, caméra, environnement et contraintes. Exemple : sujet et action d’abord, puis mouvement caméra, lumière, atmosphère, format de sortie et contraintes comme pas de texte ou conserver l’étiquette produit.
Grok Imagine prend-il en charge l’édition vidéo ?
Oui. xAI documente l’édition vidéo basée sur prompt : vous fournissez une vidéo existante et décrivez le changement souhaité tout en préservant le reste de la scène.
Grok Imagine peut-il utiliser des images de référence ?
Oui. Reference-to-video peut guider la sortie avec des références visuelles sans les imposer comme premier frame. C’est utile pour identité de personnage, forme produit, tenue, style et objets récurrents.
Quelle durée pour les vidéos Grok Imagine ?
L’overview vidéo xAI liste une génération jusqu’à 15 secondes, des vidéos d’entrée jusqu’à 8,7 secondes pour l’édition et des extensions de 2 à 10 secondes. Vérifiez toujours l’interface ou l’API actuelle.
Pourquoi la génération vidéo Grok n’apparaît-elle pas ?
La disponibilité varie selon surface, compte, région, rollout et chemin d’accès. Si la fonction manque, vérifiez Grok, X, l’API xAI ou un workflow partenaire pris en charge.
Conclusion
Grok peut générer des vidéos, mais la vraie question est quelle surface ou quel modèle Grok Imagine vous utilisez. Pour les workflows larges, textes, images fixes, références, édition et extension peuvent compter. Pour grok-imagine-video-1.5-preview, concentrez-vous sur le workflow officiel image/video input et ne supposez pas le text-to-video.
Pour tester concrètement, ne vous arrêtez pas à oui. Utilisez les notes de juin 2026, les prix, les prompts et le workflow d’évaluation ci-dessus pour décider entre Grok direct, API xAI ou comparaison multi-modèle dans PixVerse.