DeepSeek V4 Review: funciones, feedback y precios

Review de DeepSeek V4 con funciones Flash/Pro, contexto de 1M tokens, arquitectura CSA/HCA, benchmarks, feedback, límites y precios API.

Industry News • 24 de abril de 2026

DeepSeek V4 Flash y Pro en la API pública

La narrativa de DeepSeek V4 mezcló durante meses fecha de lanzamiento, detalles de modelo y cifras de parámetros. Ahora el panorama es más claro: DeepSeek V4 ya está publicado con deepseek-v4-flash y deepseek-v4-pro, contexto de 1M tokens, salida de hasta 384K, precios documentados y una ruta de migración desde deepseek-chat y deepseek-reasoner. En PixVerse, lo vemos como una familia útil para contexto largo, análisis de código y flujos creativos.

24 de abril de 2026: DeepSeek V4 ya está disponible

El 24 de abril de 2026, DeepSeek V4 pasó de la especulación al producto público: contexto de 1M tokens, pesos abiertos y API bajo deepseek-v4-pro y deepseek-v4-flash. Cifras divulgadas: 1,6T totales / 49B activos (Pro); 284B / 13B (Flash); preentrenamiento 33T / 32T tokens. Web en chat.deepseek.com; en la app oficial, modo Experto (Pro) y Rápido (Flash). Precios y cuotas siguen gobernados por la página Modelos y precios en vivo.

Modelos y precios: V4-Flash y V4-Pro

	deepseek-v4-flash*	deepseek-v4-pro
Base OpenAI	https://api.deepseek.com	=
Base Anthropic	https://api.deepseek.com/anthropic	=
Contexto	1M	1M
Salida máx. (tabla docs)	384K	384K
Precio (CNY/M, input hit/miss, output)	0,2 / 1 / 2 (salida ≈ $0.28)	1 / 12 / 24 (salida ≈ $3.48)

El coste de salida es clave para búsquedas como “DeepSeek V4 API pricing”: V4-Flash aparece en torno a $0.28 por millón de tokens de salida, mientras V4-Pro aparece en torno a $3.48. Los nombres legacy deepseek-chat y deepseek-reasoner deben migrarse a los IDs V4.

Fecha de lanzamiento: de rumores a API pública

Enero–abril 2026 trajo reportes de Reuters y otros medios; la fecha pública que importa para producto es el 24 de abril de 2026, cuando aparecieron V4-Flash y V4-Pro con modelo, contexto y precio en la documentación.

Parámetros (relato vs. factura)

Prensa: MoE a escala de billones, variantes ligeras. Facturación: CNY por millón de tokens en la web oficial. El término técnico clave es la atención híbrida CSA (compressed sparse attention) + HCA (heavy compressed attention), base para hacer viable el contexto de 1M tokens. También destacan el entrenamiento e inferencia sobre infraestructura doméstica Ascend y la adaptación open source de Cambricon vLLM para V4-Flash y V4-Pro.

Benchmarks y evaluación externa

Según Arena.ai, V4-Pro ocupa el puesto 3 en la arena de código de modelos open source y el 14 global. En Vals AI Vibe Code Benchmark, V4 lidera entre modelos open-weight, mejora alrededor de 10x frente a V3.2 y supera a modelos cerrados como Gemini 3.1 Pro en escenarios concretos.

Feedback: contexto largo y Agent coding

En una prueba práctica de Reddit, V4-Pro localizó una frase ficticia escondida en un documento de 800.000 caracteres. Con un informe sectorial de 500.000 caracteres, la subida tomó unos 30 segundos, el procesamiento cerca de 1 minuto y el resumen cubrió más del 90% de los puntos principales sin alucinaciones graves. En programación agentic, se observaron tres modos: Non-think, Think High y Think Max.

Limitaciones y evaluación objetiva

DeepSeek reconoce que V4 aún está entre 3 y 6 meses por detrás de los mejores sistemas cerrados en conocimiento complejo y razonamiento. Además, por restricciones de cómputo de gama alta, el throughput de V4-Pro tiene techo. Evalúa precio junto con límites, región, latencia y disponibilidad.

Creadores y PixVerse

Flash para iterar barato, Pro para sesión profunda.
1M de contexto no sustituye buen diseño de prompts en bloques.
Junto a Seedance 2.0 (Seedance 2.0) y otros, V4 es otra opción en el flujo, no reemplaza todo el vídeo.

Integración PixVerse: con IDs oficiales y migración de nombres legacy. Detalles prácticos en una entrada futura.

FAQ breve

¿Lanzada? Sí: la doc lista Flash/Pro, aunque conviene verificar región y límites.
Precio API: salida Flash ≈ $0.28/M tokens; Pro ≈ $3.48/M tokens.
Parámetros: Pro 1.6T totales / 49B activos; Flash 284B / 13B.
PixVerse: sí, integración activa con la superficie pública de modelos.