Grok Imagine İncelemesi: PixVerse’de xAI Video (2026 Rehberi)
Grok Imagine, PixVerse’e metinden videoya, görüntüden videoya, Referans, Uzat ve Değiştir modları getiriyor. Özellikler, fiyatlandırma, kullanım alanları ve başlangıç adımlarını inceleyin.
Grok Imagine, xAI’nin metin komutlarını ve durağan görüntüleri senkronize sesli video kliplere dönüştüren video-ses üretim modelidir. PixVerse üzerinde Pro ve Premium aboneler için sunulan model artık altı üretim modu sunuyor — Metinden Videoya, Görüntüden Videoya, Referans, Uzat, Değiştir ve yerleşik bir düzenleme paketi — bu da onu platformdaki en çok yönlü model seçeneklerinden biri haline getiriyor.
Bu içerik bir özellik turu değil. Bunun yerine rehber, Grok Imagine kullanırken gerçekten karşılaştığınız kararlar etrafında kurgulandı: projenize hangi modun uygun olduğu, uçtan uca maliyetin ne olduğu, hangi komut stratejilerinin işe yaradığı ve ne zaman tamamen farklı bir modele geçmeniz gerektiği.
30 Saniyelik Özet
| Soru | Cevap |
|---|---|
| Bu nedir? | xAI’nin video + ses üretim modeli, 28 Ocak 2026’da duyuruldu |
| Nerede kullanabilirim? | PixVerse içinde — ayrı bir xAI aboneliği gerekmez |
| Kimler erişebilir? | PixVerse Pro ve Premium aboneleri |
| Maksimum çözünürlük | 720p (1080p/4K için PixVerse V6 kullanın) |
| Maksimum süre | Üretim başına 15 saniyeye kadar (moda göre değişir) |
| Öne çıkan özellikler | Referans modu (çoklu görsel yönlendirme), Uzat (mevcut videoyu devam ettirme), Değiştir (yeniden üretmeden düzenleme), yerel ses |
| Başlangıç maliyeti | 480p’de saniye başına 10 kredi |
Grok Imagine ve Grok Sohbet Botu: Aynı Şey Değil

Başka kaynaklardaki Grok incelemelerini okuduysanız çoğu içerik Grok sohbet botunu ele alır — ChatGPT ve Claude ile rekabet eden, xAI’nin metin tabanlı konuşma odaklı yapay zekası. Grok Imagine ise tamamen ayrı bir üründür. Grok marka adını paylaşır, ancak metin sohbeti, matematik, kodlama veya web araması yapmaz. Yalnızca video ve ses üretir.
Bu ayrım önemli çünkü Grok sohbet botunun güçlü ve zayıf yönleri (güçlü matematik becerileri, yüksek sorgu limiti, tutarsız güvenlik korumaları) Grok Imagine’in video çıktı kalitesiyle ilgili değildir. Bunlar farklı amaçlar için geliştirilmiş farklı modellerdir.
Hangi Modu Kullanmalısınız?

Grok Imagine, PixVerse’te altı moda sahiptir. Her parametreyi tek tek listelemek yerine, hedefinize göre bir karar rehberi aşağıdadır:
“Aklımda metin fikri var ve bunu video olarak görmek istiyorum.”
Kullanın: Metinden Videoya
Bir komut yazarsınız, model videoyu sıfırdan üretir. Bu en basit moddur ve çoğu proje için başlangıç noktasıdır. Süre aralığı 1–15 saniyedir ve hedef platformunuza göre yedi en-boy oranı (16:9, 4:3, 1:1, 9:16, 3:4, 3:2, 2:3) seçebilirsiniz.
En uygun kullanım: konsept keşfi, moodboard üretimi, mevcut görsel varlıkların olmadığı sosyal medya taslakları.
”Canlandırmak istediğim bir görselim var.”
Kullanın: Görüntüden Videoya
Durağan bir görsel yüklersiniz, model kompozisyonu koruyarak görseli hareketlendirir. Kaynak görsel açılış karesi olur. Özellikle ürün çekimleri, portreler ve kadrajı korumak istediğiniz manzara sahnelerinde iyi sonuç verir.
En uygun kullanım: illüstrasyon canlandırma, ürün fotoğrafçılığı, tasarım mockup’ları.
”Karakterin veya nesnenin birden fazla sahnede tutarlı görünmesini istiyorum.”
Kullanın: Referans Modu

Grok Imagine’i birçok video modelinden ayıran nokta burasıdır. Referans modu, videoyu etkileyen en fazla 7 görsel yüklemenize izin verir — karakterler, nesneler, ortamlar — ancak ilk kareyi kilitlemez. Model bu görselleri görsel dayanaklar olarak kullanırken komutunuzdan özgürce üretim yapar.
Komutunuzda belirli referans görsellere @Image1, @Image2 gibi etiketlerle doğrudan işaret verebilirsiniz. Örneğin: “Bir kadın (@Image1), dışarıda yağmur yağarken bir kafede (@Image2) kahve sipariş ediyor” ifadesi, modelin hangi referans görseli hangi öğeye eşleştireceğini netleştirir.
| Parametre | Değer |
|---|---|
| Referans görseller | 1–7 |
| Süre | 1–10 saniye (varsayılan 8 sn) |
| Çözünürlük | 480p veya 720p |
En uygun kullanım: çok sahneli hikaye anlatımı, storyboard hazırlığı, karakter kimliğinin tutarlı kalması gereken marka videoları.
Neden önemli?: Çoğu video modeli ya Görüntüden Videoya kullanır (ilk kareyi görsele kilitler) ya da hiç referans sistemi sunmaz. Referans modu ikisinin ortasında konumlanır — görselleriniz kompozisyonu sınırlamadan içeriğe yön verir. PixVerse’te şu anda bunu sunan başka bir model yoktur.
”Videom neredeyse doğru ama çok kısa.”
Kullanın: Uzat Modu
Mevcut bir videoyu (2–15 saniye, MP4) ve sırada ne olacağını anlatan bir komutu içeri verirsiniz. Model yeni görüntüyü kesintisiz şekilde sona ekler. Çıktı tek bir devamlı klip olur: orijinal + uzatma.
| Parametre | Değer |
|---|---|
| Uzatma uzunluğu | 2–10 saniye (varsayılan 6 sn) |
| Kaynak video | MP4 (H.264/H.265/AV1), 2–15 saniye |
| Çıktı çözünürlüğü | Kaynakla aynı (maks. 720p) |
Faturalama yalnızca uzatılan bölüm için yapılır. 10 saniyelik bir videoyu 6 saniye uzatırsanız 16 değil, 6 saniye ücretlendirilirsiniz.
En uygun kullanım: klipleri platform minimumlarına uzatma (TikTok 15 sn, zincirlenirse YouTube Shorts 60 sn), ani biten kesitlere son ekleme, daha uzun anlatıları adım adım kurma.
Modeller arası ipucu: Uzat düğmesi, PixVerse’te videoyu hangi model üretmiş olursa olsun tüm videolarda görünür. PixVerse V6, Sora veya Veo ile üretilmiş bir klibi Grok Imagine’in Uzat moduyla devam ettirebilirsiniz.
”Videoda belirli bir değişiklik lazım ama sıfırdan başlamak istemiyorum.”
Kullanın: Değiştir Modu
Mevcut bir video yükler ve neyin değişeceğini tarif edersiniz — arka plan değiştirme, ışık ayarı, nesne rengi değiştirme, hava efekti ekleme gibi. Model, orijinal zamanlamayı ve en-boy oranını koruyarak düzenleme yapar.
| Parametre | Değer |
|---|---|
| Kaynak video süresi | Maksimum 8 saniye |
| Girdi işleme | Otomatik olarak 854x480’e ölçeklenir |
| Çıktı çözünürlüğü | Otomatik, 480p veya 720p |
En uygun kullanım: renk düzenleme denemeleri, arka plan değiştirme, mevsim varyasyonları (yaz→kış), videonun %90’ı doğruyken iteratif iyileştirme.
Bilmeniz gereken ödünleşim: Otomatik 854x480 ölçekleme, yüksek çözünürlüklü girdilerde detay kaybı yaratır. Kaynağınız net bir 1080p klipse, düzenleme daha yumuşak görünecektir. Bunu planlayın ya da final yükseltmeden önce üretim hattınızın erken aşamasında Değiştir modunu kullanın.
”Mevcut görüntüyü farklı bir görsel stile dönüştürmek istiyorum.”
Kullanın: Düzenleme Paketi (Restyle, Object Manipulation, Sketches to Life)
Grok Imagine’in düzenleme araçları sıfırdan üretmek yerine mevcut videoları dönüştürür:
- Restyle: Sanatsal stiller uygular — Cyberpunk, Anime, Retro, Origami, Suluboya, Mozaik
- Object Manipulation: Nesne ekleme, kaldırma veya değiştirme
- Sketches to Life: Çizgi çizimleri canlandırma
- Add Performance: Durağan karakterlere performans animasyonu ekleme
- Scene Control: Hava, mevsim ve renkleri değiştirme
En uygun kullanım: tek bir kaynak klipten stil varyasyonları üretme, kaba eskizleri animasyonlu önizlemeye çevirme, reklam görsel stilleri için A/B testi hazırlama.
Tipik Bir Projenin Gerçek Maliyeti
API bütçelemesinde saniye başı fiyat faydalıdır, ancak yaratıcı proje planlamasında tek başına yeterli olmaz. PixVerse kredileriyle gerçek iş akışlarının maliyeti şöyledir:
Senaryo 1: 15 Saniyelik TikTok Ürün Videosu
| Adım | Mod | Süre | Çözünürlük | Kredi |
|---|---|---|---|---|
| Taslak üretim | Metinden Videoya | 10 sn | 480p | 100 |
| 15 sn’ye uzatma | Uzat | 5 sn | 480p | 75 |
| Toplam | 15 sn | 480p | 175 |
Tek revizyon döngüsüyle (taslağı bir kez yeniden üretme) yaklaşık 275 kredi bütçeleyin.
Senaryo 2: 3 Planlı Marka Storyboard’u
| Adım | Mod | Süre | Çözünürlük | Kredi |
|---|---|---|---|---|
| Plan 1 (Referans, 2 referans görsel) | Referans | 8 sn | 720p | 180 |
| Plan 2 (Referans, aynı referanslar) | Referans | 8 sn | 720p | 180 |
| Plan 3 (Referans, aynı referanslar) | Referans | 6 sn | 720p | 135 |
| Plan 2 ışık düzenleme | Değiştir | 8 sn | 720p | 180 |
| Toplam | 30 sn | 720p | 675 |
Senaryo 3: Mevcut Klibi Yeniden Stillendirme
| Adım | Mod | Süre | Çözünürlük | Kredi |
|---|---|---|---|---|
| Anime stiline dönüştürme | Düzenleme paketi | 8 sn | 480p | 120 |
Tek üretim, iterasyon yok: 120 kredi.
Fiyatlandırma Referans Tablosu
| Mod | 480p (kredi/sn) | 720p (kredi/sn) |
|---|---|---|
| Metinden Videoya | 10 | 15 |
| Görüntüden Videoya | 10 | 15 |
| Referans | 15 | 22.5 |
| Uzat | 15 | 22.5 |
| Değiştir | 15 | 22.5 |
Üç yeni mod (Referans, Uzat, Değiştir), ek girdi varlıklarını işlediği için saniye başına daha yüksek maliyete sahiptir.
Grok Imagine ile İşe Yarayan Komut Stratejileri

Grok Imagine, metin tabanlı Grok veya diğer video modellerinden farklı şekilde komutlara yanıt verir. Birden fazla projede yaptığımız testlerden sonra, sürekli daha iyi sonuç veren kalıplar şunlardır:
Betimleyici Değil, Sinematik Yazın
Grok Imagine, sahne betiminden çok plan anlatımı gibi yazılmış komutlara iyi yanıt verir.
Daha zayıf: “Gece neon tabelalı ve yürüyen insanların olduğu bir şehir sokağı”
Daha güçlü: “Yağmurla ıslanmış Tokyo ara sokağında öne doğru dolly hareketi, neon tabelalar su birikintilerine yansıyor, sığ alan derinliği, şemsiyeli bir figür kadraja sağdan giriyor, sinematik 2.39:1 kadraj”
Modelde yerleşik kamera kontrol ön ayarları (Zoom In/Out, Dolly Out, Tilt Up, Pan Right, Timelapse) bulunur ve sinematik dil kullanan komutlar bunları genellikle daha doğru tetikler.
Referans Modunda @Image Etiketlerini Bilinçli Kullanın
Birden fazla görselle Referans modunu kullanırken, “bu görselleri kullanarak video üret” gibi belirsiz komutlar tutarsız sonuçlar üretir. Bunun yerine her referansı bir öğeyle açıkça eşleyin:
“@Image1 (kırmızı spor araba), @Image3 (gün batımı gökyüzü) arka plandayken dağ virajında drift yapıyor; @Image2 (sürücü karakter) direksiyonu yakın planda tutuyor”
Aksiyonu En Başa Koyun
Grok Imagine üretimi ilk kareden itibaren sıralı yapar. Ana aksiyonu komutun sonuna gömerseniz model, oraya ulaşmadan süreyi tüketebilir. Birincil hareketi veya olayı açıklamanızın erken bölümüne yerleştirin.
Daha zayıf: “Kuşların olduğu sakin bir orman sahnesi, sonra aniden bir geyik derenin üzerinden atlıyor”
Daha güçlü: “Altın saat ışığında bir geyik orman deresinin üzerinden atlıyor, kamera yayı takip ediyor, yakın dallardaki kuşlar havalanıyor”
Süreye Uygun Tempoyu Belirtin
Daha uzun kliplerde (10–15 saniye), komutunuzda tempoyu belirtin. Yönlendirme olmazsa model tüm hareketi ilk birkaç saniyeye yığıp kalan kısmı durağan bırakabilir.
“Terk edilmiş bir kütüphaneye yavaş zoom (0–5 sn), toz parçacıkları ışık huzmelerini yakalıyor (5–10 sn), raftan bir kitap düşüyor (10–12 sn), sayfalar zemine süzülüyor (12–15 sn)“
Ne Zaman Farklı Bir Model Kullanmalı?

Grok Imagine her zaman en iyi seçenek değildir. PixVerse’te başka bir modelin daha iyi sonuç vereceği belirli durumlar:
720p üzeri çözünürlük gerektiğinde
Bunun yerine PixVerse V6 kullanın. V6 doğal olarak 1080p üretir ve 4K yükseltme destekler. Projeniz yayın kalitesi, film festivali başvurusu veya büyük ekranda oynatma gerektiriyorsa 720p yeterli olmaz.
Hassas sinematik lens kontrolü gerektiğinde
Bunun yerine PixVerse V6 kullanın. V6, odak uzaklığı, alan derinliği ve kromatik sapma dahil 20’den fazla lens parametresi sunar. Grok Imagine’de 6 kamera ön ayarı vardır; kullanışlıdır ama aynı ayrıntı düzeyini vermez.
Tek seferde 15 saniyeden uzun klip gerektiğinde
Bunun yerine Sora 2 kullanın. Sora, üretim başına 20 saniyeye kadar destekler. Grok Imagine’de ise üret + uzat akışı gerekir; bu da maliyet ekler ve birleşim noktasında süreklilik riski doğurur.
Ses kalitesi kritik olduğunda
Özel bir ses aracı kullanın. Grok Imagine’in yerel sesi taslak ve sosyal içerik için pratiktir; ancak diyalog netliği ve müzik üretim kalitesi değişkendir. Daha cilalı prodüksiyonlar için videoyu Grok Imagine ile üretip sesi ayrı yönetin.
Kaynak videonuz yüksek çözünürlüklüyse ve bunu korumak istiyorsanız
Değiştir modundan kaçının. 854x480 otomatik ölçekleme yüksek çözünürlükte kalite kaybına yol açar. 1080p kaynağınız varsa ya önce kendiniz aşağı ölçekleyin (sonucu siz kontrol edin) ya da farklı bir düzenleme yaklaşımı kullanın.
Teknik Özelliklere Hızlı Bakış
Hızlı referans için altı modun karşılaştırması:
| Boyut | Metinden Videoya | Görüntüden Videoya | Referans | Uzat | Değiştir | Düzenleme Paketi |
|---|---|---|---|---|---|---|
| Girdi | Komut | Komut + görsel | Komut + 1–7 görsel | Komut + video (2–15 sn) | Komut + video | Video + stil/talimat |
| Süre | 1–15 sn | 1–15 sn | 1–10 sn | Uzatma: 2–10 sn | Kaynakla aynı (maks. 8 sn) | Kaynakla aynı |
| En-Boy Oranları | 7 seçenek | 7 seçenek | 7 seçenek | Kaynakla aynı | Kaynakla aynı | Kaynakla aynı |
| Çözünürlük | 480p / 720p | 480p / 720p | 480p / 720p | Kaynakla aynı (maks. 720p) | Otomatik / 480p / 720p | 480p / 720p |
| Ses | Evet | Evet | Evet | Evet | Evet | Değişken |
Sık Sorulan Sorular
Grok Imagine ile Grok sohbet botu arasındaki fark nedir?
Grok Imagine, xAI’nin video ve ses üretim modelidir. Grok sohbet botu (x.com ve aylık 30 $’lık SuperGrok aboneliği üzerinden erişilir) metin konuşmaları, kodlama, matematik ve web araması için kullanılır. Marka adını paylaşsalar da farklı yeteneklere sahip ayrı ürünlerdir. PixVerse’te Grok Imagine kullanmak için SuperGrok aboneliğine ihtiyacınız yoktur.
Referans modu nedir ve Görüntüden Videoya modundan farkı nedir?
Görüntüden Videoya modunda yüklediğiniz görsel videonun ilk karesi olur — model tam olarak o başlangıç noktasından animasyon üretir. Referans modunda ise görselleriniz herhangi bir kareyi kilitlemeden videoda neyin görüneceğini etkiler (karakterler, nesneler, ortamlar). Görüntüden Videoya için “bu görseli canlandır”, Referans modu için “bu görsel öğeleri içeren bir video üret” şeklinde düşünebilirsiniz.
Grok Imagine ile üretilmemiş bir videoyu uzatabilir veya değiştirebilir miyim?
Evet. Uzat ve Değiştir düğmeleri, videoyu hangi model üretmiş olursa olsun PixVerse’teki tüm video sonuçlarında görünür. Grok Imagine ile PixVerse V6 videosunu uzatabilir veya Sora ile üretilmiş klibi değiştirebilirsiniz. Kaynağın sadece MP4 formatında ve süre sınırları içinde olması gerekir.
Yeni modlar neden saniye başına daha pahalı?
Referans, Uzat ve Değiştir modları, komutla birlikte ek girdi varlıklarını (referans görseller veya kaynak videolar) da işler. Bu ek işlem yükü, standart Metinden Videoya ve Görüntüden Videoya modlarındaki saniye başına 10 krediye kıyasla, temel maliyeti saniye başına 15 krediye çıkarır.
Oluşturabileceğim maksimum video uzunluğu nedir?
Tek bir Metinden Videoya veya Görüntüden Videoya üretimi 15 saniyeye kadar destekler. Uzat moduyla her uzatmada 2–10 saniye daha ekleyebilirsiniz. Teorik olarak birden fazla uzatmayı zincirleyip daha uzun videolar oluşturabilirsiniz, ancak çoklu üretimde süreklilik kalitesi düşebilir.
Projem için Grok Imagine mi yoksa PixVerse V6 mı kullanmalıyım?
Önceliğinize bağlıdır. Karakter tutarlılığı için Referans moduna, mevcut klipleri düzenlemek için Uzat/Değiştir modlarına veya yerel ses üretimine ihtiyacınız varsa Grok Imagine’i seçin. 1080p+ çözünürlük, gelişmiş lens kontrolü veya profesyonel teslimat için en yüksek çıktı kalitesi gerekiyorsa PixVerse V6’yı seçin. Birçok içerik üretici aynı projede ikisini birlikte kullanır — hızlı iterasyon için Grok Imagine, final render için PixVerse V6.
Başlarken
- Pro veya Premium hesapla PixVerse giriş yapın
- Model seçicide Grok Imagine seçin
- Yukarıdaki karar rehberine göre bir mod seçin
- Çözünürlük, süre ve en-boy oranını yapılandırın
- Üretin, sonucu inceleyin ve sıfırdan başlamadan iterasyon yapmak için Uzat veya Değiştir kullanın
Teknik API dokümantasyonu için resmi xAI belgelerini ziyaret edin.