Kling O3 dan 3.0 di PixVerse: Pembuatan Video dan Gambar AI
Buat video dan gambar AI dengan Kling O3 dan Kling 3.0 di PixVerse. Teks ke video, gambar ke video, referensi ke video, dan output hingga 4K. Coba gratis sekarang.
Pendahuluan
Kling O3 adalah model pembuatan video dan gambar AI dari Kuaishou, kini tersedia di PixVerse bersama dengan Kling 3.0. Kedua model mendukung teks ke video, gambar ke video, transisi, dan teks ke gambar — semuanya dapat diakses dari workspace PixVerse yang sama yang sudah Anda gunakan untuk PixVerse V6, Veo 3.1, dan Sora 2.
Kling O3 menambahkan kemampuan referensi ke video (Reference-to-Video) dan output gambar native 4K. Kling 3.0 mencakup alur kerja inti yang sama dengan biaya kredit lebih rendah. Tidak perlu akun terpisah atau API key — masuk dan mulai membuat konten.
Apa Itu Kling O3 dan Kling 3.0?
Kling O3 (juga dikenal sebagai Kling Video 3.0 Omni) dan Kling 3.0 (Kling Video 3.0) adalah model pembuatan AI dari Kuaishou yang mendukung video dan gambar. Perbedaan utamanya: O3 dirancang untuk alur kerja berbasis referensi dan kontrol tinggi, sementara 3.0 adalah pilihan yang lebih sederhana dan hemat biaya untuk pembuatan berbasis prompt teks.
| Fitur | Kling O3 | Kling 3.0 |
|---|---|---|
| Mode video | T2V, I2V, Transisi, R2V | T2V, I2V, Transisi |
| Mode gambar | T2I, I2I | T2I, I2I |
| Durasi video maksimum | 15 detik | 15 detik |
| Resolusi gambar | Hingga 4K | Hingga 2K |
| Input gambar referensi | Hingga 10 gambar (gambar) / 4 gambar (R2V) | Satu gambar |
| Audio native | Ya | Ya |
| Mode multi-shot cerdas | Ya | Ya |
Apa Itu Reference-to-Video (R2V)?
Reference-to-Video adalah mode eksklusif Kling O3. Anda mengunggah hingga 4 gambar referensi karakter atau objek, dan model akan mempertahankan identitas visual tersebut sepanjang video yang dihasilkan — menjaga konsistensi penampilan, pakaian, dan ciri-ciri di berbagai sudut kamera dan adegan.
Berbeda dengan mode gambar ke video, gambar referensi tidak digunakan sebagai frame pertama. Gambar tersebut hanya berfungsi sebagai jangkar visual, sehingga model bebas menyusun adegan berdasarkan prompt teks Anda sambil menjaga karakter atau objek tetap terlihat sama. Ini memecahkan masalah umum “karakter meleleh” di mana penampilan subjek berubah di tengah video.
R2V berguna untuk:
- Narasi multi-shot: Pertahankan konsistensi karakter yang sama di seluruh rangkaian klip
- Video showcase produk: Kunci penampilan produk tertentu saat kamera bergerak mengelilinginya
- Storyboard sinematik: Pertahankan identitas visual di berbagai sudut dan kondisi pencahayaan
Mode Video Apa yang Didukung Kling?
Kedua model mendukung tiga alur kerja pembuatan video AI inti:
- Teks ke Video (T2V): Deskripsikan adegan Anda dalam prompt teks dan hasilkan klip video dari nol.
- Gambar ke Video (I2V): Unggah gambar awal dan ubah menjadi gerakan. Opsional, berikan frame akhir untuk membuat transisi.
- Transisi: Berikan frame awal dan frame akhir. Model menghasilkan transisi video yang halus di antara keduanya.
Kling O3 menambahkan mode keempat:
- Referensi ke Video (R2V): Unggah hingga 4 gambar referensi untuk mengunci penampilan karakter atau objek di seluruh klip (lihat bagian R2V di atas untuk detail).
Parameter Video
| Parameter | Pilihan |
|---|---|
| Durasi | 3 hingga 15 detik (default: 5 detik) |
| Rasio aspek | 16:9, 9:16, 1:1 |
| Mode kualitas | Standard atau Pro |
| Audio native | Aktif atau nonaktif — menghasilkan dialog, efek suara, dan audio ambient yang tersinkronisasi |
| Multi-shot | Mode cerdas untuk pembuatan sinematik multi-sudut otomatis |
Berapa Harga Video Kling di PixVerse?
| Model | Mode | Video Saja | Dengan Audio |
|---|---|---|---|
| Kling O3 | Standard | 25 kredit/dtk | 35 kredit/dtk |
| Kling O3 | Pro | 35 kredit/dtk | 45 kredit/dtk |
| Kling 3.0 | Standard | 20 kredit/dtk | 28 kredit/dtk |
| Kling 3.0 | Pro | 25 kredit/dtk | 35 kredit/dtk |
Klip 5 detik dengan Kling O3 Standard (video saja) menghabiskan 125 kredit. Dengan audio, klip yang sama menghabiskan 175 kredit. Kling 3.0 Standard menurunkannya menjadi 100 kredit untuk video saja — titik awal yang baik jika Anda ingin bereksperimen cepat sebelum beralih ke kualitas Pro.
Mode Gambar Apa yang Didukung Kling?
Kedua model mendukung:
- Teks ke Gambar (T2I): Buat gambar dari prompt teks dengan kontrol resolusi dan rasio aspek.
- Gambar ke Gambar (I2I): Transformasi gambar yang sudah ada berdasarkan prompt Anda — berguna untuk transfer gaya, pengeditan, atau remix.
Kling O3 mendukung hingga 10 gambar referensi sebagai input untuk kontrol kreatif yang lebih kuat. Kling 3.0 menerima satu gambar referensi.
| Fitur | Kling O3 | Kling 3.0 |
|---|---|---|
| Resolusi | 1K, 2K, 4K | 1K, 2K |
| Gambar referensi | Hingga 10 | Satu gambar |
| Rasio aspek | 16:9, 9:16, 1:1, 4:3, 3:4, 3:2, 2:3, 21:9 | 8 rasio yang sama |
Berapa Harga Gambar Kling di PixVerse?
| Model | Resolusi | Kredit per Gambar |
|---|---|---|
| Kling O3 | 1K / 2K | 10 kredit |
| Kling O3 | 4K | 20 kredit |
| Kling 3.0 | 1K / 2K | 10 kredit |
Cara Membuat Video dengan Kling O3 atau 3.0

- Masuk ke akun PixVerse Anda
- Buka bagian Video di panel pembuatan
- Pilih Kling O3 atau Kling 3.0 dari daftar model
- Pilih mode kualitas: Standard atau Pro
- Atur parameter: durasi (3–15 dtk), rasio aspek, dan aktifkan/nonaktifkan audio
- Masukkan prompt — atau unggah gambar awal untuk I2V, gambar referensi untuk R2V (hanya Kling O3), atau frame awal dan akhir untuk Transisi
- Klik Generate dan tunggu hasilnya
Untuk video multi-shot, aktifkan mode Intelligent. Model secara otomatis menyusun beberapa sudut kamera — shot lebar, medium close-up, dan shot detail — dalam satu kali pembuatan, menjaga identitas visual konsisten di setiap sudut.
Cara Membuat Gambar dengan Kling O3 atau 3.0

- Masuk ke PixVerse
- Buka bagian Gambar di panel pembuatan
- Pilih Kling O3 atau Kling 3.0 dari daftar model
- Pilih resolusi — 1K (default), 2K, atau 4K (hanya Kling O3)
- Pilih rasio aspek dari 8 pilihan yang tersedia
- Masukkan prompt — opsional unggah gambar referensi (hingga 10 untuk Kling O3, 1 untuk Kling 3.0)
- Buat gambar Anda
Kapan Harus Menggunakan Kling O3 vs Kling 3.0?
Kedua model berbagi alur kerja inti yang sama, tetapi cocok untuk situasi yang berbeda. Gunakan tabel ini untuk memutuskan:
| Jika proyek Anda membutuhkan… | Gunakan | Alasan |
|---|---|---|
| Klip cepat dari prompt teks | Kling 3.0 Standard | Biaya lebih rendah (20 kredit/dtk), output cepat |
| Konsistensi karakter lintas shot | Kling O3 (mode R2V) | R2V mengunci identitas visual menggunakan gambar referensi |
| Sekuens sinematik berkualitas tinggi | Kling O3 Pro | Kualitas lebih tinggi, mode multi-shot cerdas |
| Gambar 4K untuk cetak atau pemasaran | Kling O3 | Hanya O3 yang mendukung resolusi gambar 4K |
| Referensi gaya multi-gambar untuk gambar | Kling O3 | Hingga 10 gambar referensi vs 1 untuk Kling 3.0 |
| Iterasi dan draft hemat biaya | Kling 3.0 Standard | Biaya kredit terendah di keluarga Kling |
| Transisi halus antara dua frame | Model mana pun | Keduanya mendukung mode Transisi secara setara |
Secara umum: mulai dengan Kling 3.0 Standard untuk bereksperimen dengan biaya lebih rendah, lalu beralih ke Kling O3 Pro ketika Anda membutuhkan kontrol lebih ketat, penguncian referensi, atau resolusi lebih tinggi.
Tips untuk Hasil Lebih Baik
Beberapa hal yang membantu mendapatkan output lebih bersih dari kedua model Kling:
- Buat prompt yang spesifik: Alih-alih “seorang wanita berjalan di kota”, coba “seorang wanita berjas merah berjalan di jalanan Tokyo yang basah hujan di malam hari, pantulan neon di trotoar basah, shot tracking medium”. Sertakan subjek, aksi, lingkungan, pencahayaan, dan gerakan kamera.
- Gunakan mode multi-shot untuk narasi: Aktifkan mode Intelligent agar model menyusun beberapa sudut kamera — wide, medium close-up, dan detail — dalam satu pembuatan.
- Mulai pendek, lalu perpanjang: Buat klip uji coba 3–5 detik terlebih dahulu. Setelah Anda suka arahnya, buat versi lebih panjang dengan pengaturan yang sama.
- Gambar referensi penting untuk R2V: Gunakan foto yang jelas dan pencahayaan baik yang menunjukkan subjek dari berbagai sudut. Hindari latar belakang ramai yang bersaing dengan subjek.
- Aktifkan audio dengan sengaja: Audio native menambahkan dialog, suara ambient, dan efek — tetapi juga menggunakan lebih banyak kredit. Nonaktifkan jika Anda hanya membutuhkan track visual.
Siapa yang Dapat Mengakses Kling O3 dan 3.0 di PixVerse?
Model Video
Pembuatan video Kling O3 dan 3.0 tersedia untuk anggota Pro, Premium, dan Ultra. Anggota Ultra mendapatkan diskon kredit 40% untuk semua pembuatan video Kling.
Model Gambar
Akses pembuatan gambar Kling O3 dan 3.0 tergantung pada paket Anda:
| Paket | Akses Gambar Kling |
|---|---|
| Basic | Tidak tersedia |
| Standard | Tidak tersedia |
| Pro | Tidak tersedia |
| Premium | Tidak tersedia |
| Ultra | Tak terbatas dengan 0 kredit |
Anggota Ultra dapat membuat gambar Kling tanpa batas tanpa biaya kredit. Semua paket lainnya dapat mengakses gambar Kling melalui pembuatan berbasis kredit.
Mengapa Menggunakan Kling di PixVerse?
Menggunakan Kling O3 dan 3.0 melalui PixVerse memberikan beberapa keuntungan dibandingkan mengaksesnya secara terpisah:
- Semua dalam satu workspace: Buat video dan gambar dengan Kling, PixVerse V6, Veo 3.1, Sora 2, dan lainnya — tanpa mengelola banyak akun atau API key.
- Reference-to-Video untuk konsistensi karakter: Kunci penampilan karakter di beberapa shot menggunakan gambar referensi, langsung dari panel pembuatan PixVerse.
- Durasi fleksibel: Klip 3 hingga 15 detik mencakup semuanya mulai dari klip pendek sosial media hingga sekuens narasi sinematik yang lebih panjang.
- Audio native dalam sekali jalan: Buat video dengan dialog tersinkronisasi, efek suara, dan audio ambient — tanpa langkah desain suara terpisah.
- Harga kredit terjangkau: Kling 3.0 mulai dari 20 kredit per detik untuk video. Pembuatan gambar mulai dari hanya 10 kredit per gambar.
Pertanyaan yang Sering Diajukan
Apa perbedaan Kling O3 dan Kling 3.0?
Kling O3 (Video 3.0 Omni) dirancang untuk alur kerja berbasis referensi. Termasuk Reference-to-Video (R2V), mendukung output gambar 4K, dan menerima hingga 10 gambar referensi untuk pembuatan gambar. Kling 3.0 (Video 3.0) adalah pilihan yang lebih sederhana berbasis prompt dengan biaya kredit lebih rendah. Keduanya berbagi kemampuan T2V, I2V, dan Transisi yang sama.
Bagaimana cara kerja Reference-to-Video (R2V)?
Unggah hingga 4 gambar referensi karakter atau objek. Model menggunakan gambar ini sebagai jangkar visual untuk menjaga penampilan subjek tetap konsisten sepanjang video. Berbeda dengan gambar ke video, gambar referensi tidak digunakan sebagai frame pertama — model bebas menyusun adegan berdasarkan prompt Anda.
Bisakah saya menggunakan Kling O3 di PixVerse secara gratis?
PixVerse menyediakan kredit gratis harian untuk semua pengguna terdaftar. Anda dapat menggunakan kredit tersebut untuk membuat video atau gambar Kling. Pembuatan video dengan Kling memerlukan paket Pro atau lebih tinggi. Anggota Ultra mendapatkan pembuatan gambar Kling tak terbatas dengan 0 kredit dan diskon 40% untuk video.
Rasio aspek apa yang didukung Kling untuk video?
Kling O3 dan Kling 3.0 mendukung tiga rasio aspek video: 16:9 (lanskap), 9:16 (potret), dan 1:1 (persegi). Untuk gambar, keduanya mendukung 8 rasio: 16:9, 9:16, 1:1, 4:3, 3:4, 3:2, 2:3, dan 21:9.
Berapa lama video Kling bisa dibuat?
Kedua model menghasilkan klip 3 hingga 15 detik. Default-nya adalah 5 detik. Anda dapat mengatur angka bulat apa pun dalam rentang tersebut.
Apakah Kling O3 menghasilkan audio bersama video?
Ya. Kling O3 dan Kling 3.0 mendukung pembuatan audio native. Ketika audio diaktifkan, model menghasilkan dialog tersinkronisasi, efek suara, dan suara ambient bersamaan dengan video. Pembuatan audio memerlukan kredit tambahan (lihat tabel harga di atas).
Kesimpulan
Kling O3 dan Kling 3.0 menghadirkan pembuatan video dan gambar ke PixVerse dalam satu paket terintegrasi. Apakah Anda membutuhkan klip 3 detik untuk sosial media, sekuens narasi 15 detik dengan identitas karakter terkunci, atau gambar 4K untuk penggunaan profesional — model-model ini siap digunakan dari akun PixVerse Anda hari ini.
Dikombinasikan dengan lineup PixVerse yang sudah ada — termasuk model V6 kami sendiri, Veo 3.1, Sora 2, dan pembuat video AI lainnya — Anda kini memiliki rangkaian alat pembuatan yang lebih luas, semuanya di satu tempat.