Review DeepSeek V4: fitur, feedback, dan harga

Review DeepSeek V4: fitur Flash/Pro, konteks 1M, arsitektur CSA/HCA, benchmark, feedback pengguna, batasan, dan harga API.

Industry News
DeepSeek V4 Flash dan Pro di API publik

Tanggal rilis DeepSeek V4, detail model, dan parameter lama bercampur isu. Sekarang lebih jelas: DeepSeek V4 telah dirilis dengan deepseek-v4-flash dan deepseek-v4-pro, konteks 1M token, output hingga 384K, harga terdokumentasi, dan jalur migrasi dari deepseek-chat / deepseek-reasoner. PixVerse melihat V4 sebagai opsi untuk konteks panjang, analisis kode, dan alur kerja kreatif.

24 April 2026: DeepSeek V4 tersedia

Pada 24 April 2026, DeepSeek V4 berpindah dari spekulasi ke produk publik: konteks 1M token, bobot terbuka, dan API deepseek-v4-pro / deepseek-v4-flash. Angka yang disampaikan: 1,6T total / 49B aktif (Pro); 284B / 13B (Flash); prapelatihan 33T / 32T token. Web chat.deepseek.com; aplikasi resmi mode Ahli (Pro) dan Cepat (Flash). Penagihan dan kuota tetap mengacu halaman Model & harga daring.

Model dan harga: V4-Flash & V4-Pro

deepseek-v4-flash*deepseek-v4-pro
Base OpenAIhttps://api.deepseek.com=
Base Anthropichttps://api.deepseek.com/anthropic=
Konteks1M1M
Output maks. (tabel docs)384K384K
Harga (CNY/juta, input hit/miss, output)0,2 / 1 / 2 (output ≈ $0.28)1 / 12 / 24 (output ≈ $3.48)

Harga output adalah detail penting: V4-Flash sekitar $0.28 per 1M token output, sedangkan V4-Pro sekitar $3.48. Nama lama deepseek-chat dan deepseek-reasoner sebaiknya dimigrasikan ke ID V4.

Tanggal rilis: dari media ke API publik

Jan.–Apr. 2026 (Reuters, dll.) memberi latar. Untuk produk, tanggal publiknya adalah 24 April 2026, saat Flash dan Pro muncul di dokumentasi dengan ID, konteks, dan harga.

Parameter: narasi vs. tagihan

Media membahas ~1T MoE; tagihan = CNY per juta token resmi. Istilah teknis kuncinya adalah perhatian hibrida CSA (compressed sparse attention) + HCA (heavy compressed attention), yang membantu membuat konteks 1M lebih praktis. Infrastruktur Ascend dan adaptasi open source Cambricon vLLM untuk V4-Flash/V4-Pro juga penting untuk evaluasi deployment.

Benchmark dan evaluasi pihak ketiga

Menurut Arena.ai, V4-Pro berada di peringkat 3 dalam code arena model open source dan peringkat 14 secara keseluruhan. Dalam Vals AI Vibe Code Benchmark, V4 memimpin model open-weight, naik sekitar 10x dibanding V3.2, dan mengalahkan Gemini 3.1 Pro dalam skenario tertentu.

Feedback: konteks panjang dan Agent coding

Dalam uji praktik di Reddit, V4-Pro menemukan informasi fiktif yang disisipkan dalam dokumen 800.000 karakter. Untuk laporan industri 500.000 karakter, unggah sekitar 30 detik, proses sekitar 1 menit, dan ringkasan mencakup lebih dari 90% poin utama tanpa halusinasi serius. Untuk Agent coding, pengguna melihat mode Non-think, Think High, dan Think Max.

Batasan dan evaluasi objektif

DeepSeek menyatakan V4 masih tertinggal sekitar 3-6 bulan dari sistem tertutup terbaik dalam pengetahuan kompleks dan penalaran. Throughput V4-Pro juga memiliki batas karena keterbatasan komputasi kelas atas. Evaluasi harga bersama limit, wilayah, latensi, dan ketersediaan.

Kreator & PixVerse

Flash volume, Pro kedalaman. Dengan Seedance 2.0 (Seedance 2.0), pilih mesin yang pas. Integrasi V4 = rencana aktif dengan migrasi nama lama.

FAQ singkat

  • Rilis? Ya, Flash/Pro sudah ada di dokumentasi dan API, dengan pengecekan wilayah.
  • Nama lama? Akan dihapus — dipetakan ke Flash.
  • Harga API? Flash ≈ $0.28/1M token output; Pro ≈ $3.48/1M.
  • Parameter? Pro 1.6T total / 49B aktif; Flash 284B / 13B.