DeepSeek V4 Review: funciones, feedback y precios
Review de DeepSeek V4 con funciones Flash/Pro, contexto de 1M tokens, arquitectura CSA/HCA, benchmarks, feedback, límites y precios API.
La narrativa de DeepSeek V4 mezcló durante meses fecha de lanzamiento, detalles de modelo y cifras de parámetros. Ahora el panorama es más claro: DeepSeek V4 ya está publicado con deepseek-v4-flash y deepseek-v4-pro, contexto de 1M tokens, salida de hasta 384K, precios documentados y una ruta de migración desde deepseek-chat y deepseek-reasoner. En PixVerse, lo vemos como una familia útil para contexto largo, análisis de código y flujos creativos.
24 de abril de 2026: DeepSeek V4 ya está disponible
El 24 de abril de 2026, DeepSeek V4 pasó de la especulación al producto público: contexto de 1M tokens, pesos abiertos y API bajo deepseek-v4-pro y deepseek-v4-flash. Cifras divulgadas: 1,6T totales / 49B activos (Pro); 284B / 13B (Flash); preentrenamiento 33T / 32T tokens. Web en chat.deepseek.com; en la app oficial, modo Experto (Pro) y Rápido (Flash). Precios y cuotas siguen gobernados por la página Modelos y precios en vivo.
Modelos y precios: V4-Flash y V4-Pro
| deepseek-v4-flash* | deepseek-v4-pro | |
|---|---|---|
| Base OpenAI | https://api.deepseek.com | = |
| Base Anthropic | https://api.deepseek.com/anthropic | = |
| Contexto | 1M | 1M |
| Salida máx. (tabla docs) | 384K | 384K |
| Precio (CNY/M, input hit/miss, output) | 0,2 / 1 / 2 (salida ≈ $0.28) | 1 / 12 / 24 (salida ≈ $3.48) |
El coste de salida es clave para búsquedas como “DeepSeek V4 API pricing”: V4-Flash aparece en torno a $0.28 por millón de tokens de salida, mientras V4-Pro aparece en torno a $3.48. Los nombres legacy deepseek-chat y deepseek-reasoner deben migrarse a los IDs V4.
Fecha de lanzamiento: de rumores a API pública
Enero–abril 2026 trajo reportes de Reuters y otros medios; la fecha pública que importa para producto es el 24 de abril de 2026, cuando aparecieron V4-Flash y V4-Pro con modelo, contexto y precio en la documentación.
Parámetros (relato vs. factura)
Prensa: MoE a escala de billones, variantes ligeras. Facturación: CNY por millón de tokens en la web oficial. El término técnico clave es la atención híbrida CSA (compressed sparse attention) + HCA (heavy compressed attention), base para hacer viable el contexto de 1M tokens. También destacan el entrenamiento e inferencia sobre infraestructura doméstica Ascend y la adaptación open source de Cambricon vLLM para V4-Flash y V4-Pro.
Benchmarks y evaluación externa
Según Arena.ai, V4-Pro ocupa el puesto 3 en la arena de código de modelos open source y el 14 global. En Vals AI Vibe Code Benchmark, V4 lidera entre modelos open-weight, mejora alrededor de 10x frente a V3.2 y supera a modelos cerrados como Gemini 3.1 Pro en escenarios concretos.
Feedback: contexto largo y Agent coding
En una prueba práctica de Reddit, V4-Pro localizó una frase ficticia escondida en un documento de 800.000 caracteres. Con un informe sectorial de 500.000 caracteres, la subida tomó unos 30 segundos, el procesamiento cerca de 1 minuto y el resumen cubrió más del 90% de los puntos principales sin alucinaciones graves. En programación agentic, se observaron tres modos: Non-think, Think High y Think Max.
Limitaciones y evaluación objetiva
DeepSeek reconoce que V4 aún está entre 3 y 6 meses por detrás de los mejores sistemas cerrados en conocimiento complejo y razonamiento. Además, por restricciones de cómputo de gama alta, el throughput de V4-Pro tiene techo. Evalúa precio junto con límites, región, latencia y disponibilidad.
Creadores y PixVerse
- Flash para iterar barato, Pro para sesión profunda.
- 1M de contexto no sustituye buen diseño de prompts en bloques.
- Junto a Seedance 2.0 (Seedance 2.0) y otros, V4 es otra opción en el flujo, no reemplaza todo el vídeo.
Integración PixVerse: con IDs oficiales y migración de nombres legacy. Detalles prácticos en una entrada futura.
FAQ breve
- ¿Lanzada? Sí: la doc lista Flash/Pro, aunque conviene verificar región y límites.
- Precio API: salida Flash ≈ $0.28/M tokens; Pro ≈ $3.48/M tokens.
- Parámetros: Pro 1.6T totales / 49B activos; Flash 284B / 13B.
- PixVerse: sí, integración activa con la superficie pública de modelos.