Review do DeepSeek V4: recursos, feedback e preços
Review do DeepSeek V4 com recursos Flash/Pro, contexto de 1M tokens, arquitetura CSA/HCA, benchmarks, feedback, limites e preço da API.
A história do DeepSeek V4 misturou data de lançamento, detalhes de modelo e parâmetros em rumores. Agora o quadro é mais claro: DeepSeek V4 foi lançado com deepseek-v4-flash e deepseek-v4-pro, contexto de 1M tokens, até 384K de saída, preços publicados e migração a partir de deepseek-chat / deepseek-reasoner. A PixVerse acompanha o V4 como uma opção para contexto longo, análise de código e fluxos criativos.
24 de abril de 2026: DeepSeek V4 disponível
Em 24 de abril de 2026, o DeepSeek V4 passou da especulação para um produto público: contexto de 1M tokens, pesos abertos e API com deepseek-v4-pro e deepseek-v4-flash. Números divulgados: 1,6T total / 49B ativos (Pro); 284B / 13B (Flash); pré-treino 33T / 32T tokens. Web em chat.deepseek.com; app com modo Especialista (Pro) e Rápido (Flash). Preços e limites continuam na página Modelos e preços ao vivo.
Modelos e preços: V4-Flash e V4-Pro
| deepseek-v4-flash* | deepseek-v4-pro | |
|---|---|---|
| Base OpenAI | https://api.deepseek.com | = |
| Base Anthropic | https://api.deepseek.com/anthropic | = |
| Contexto | 1M | 1M |
| Saída máx. (tabela docs) | 384K | 384K |
| Preço (CNY/M, entrada hit/miss, saída) | 0,2 / 1 / 2 (saída ≈ $0.28) | 1 / 12 / 24 (saída ≈ $3.48) |
O custo de saída é um ponto de conversão importante: V4-Flash sai por cerca de $0.28 por 1M tokens, enquanto V4-Pro sai por cerca de $3.48 por 1M tokens. Os nomes legados deepseek-chat e deepseek-reasoner devem migrar para os IDs V4.
Data de lançamento: da imprensa à API pública
De janeiro a abril de 2026, reportagens da Reuters e de outros veículos deram contexto. Para produto, a data pública é 24 de abril de 2026, quando Flash e Pro apareceram com IDs, contexto e preços na documentação.
Parâmetros: narrativa x fatura
Mídias: ~1T MoE, V4 Lite. Custo: CNY/1M na web DeepSeek. O termo técnico central é a atenção híbrida CSA (compressed sparse attention) + HCA (heavy compressed attention), base para viabilizar 1M de contexto. Também importam a base Ascend para treino/inferência e a adaptação open source do Cambricon vLLM para V4-Flash e V4-Pro.
Benchmarks e avaliação externa
Segundo a Arena.ai, o V4-Pro ficou em 3º lugar na arena de código de modelos open source e em 14º no geral. No Vals AI Vibe Code Benchmark, o V4 liderou entre modelos open-weight, teve salto de cerca de 10x sobre o V3.2 e superou modelos fechados como Gemini 3.1 Pro em cenários específicos.
Feedback: contexto longo e Agent coding
Em um teste prático no Reddit, o V4-Pro localizou uma informação fictícia escondida em um documento de 800 mil caracteres. Em um relatório de 500 mil caracteres, o upload levou cerca de 30 segundos, o processamento cerca de 1 minuto e o resumo cobriu mais de 90% dos pontos centrais sem alucinações graves. Em programação agentic, apareceram modos Non-think, Think High e Think Max.
Limitações e avaliação objetiva
A DeepSeek afirma que o V4 ainda está cerca de 3 a 6 meses atrás dos melhores sistemas fechados em conhecimento complexo e raciocínio. Além disso, por limitações de computação de ponta, o throughput do V4-Pro tem teto. Avalie preço junto com limites, região, latência e disponibilidade.
Criadores e PixVerse
Flash para volume, Pro para profundidade. 1M de contexto exige bons chunkings. Com Seedance 2.0 (Seedance 2.0) e parceiros, V4 entra como opção completa, não mito único.
Integração: em curso com alinhamento aos nomes oficiais e fim de legados.
FAQ
- Lançou? Sim: Flash/Pro aparecem na documentação e na API, com verificação por região.
- Nomes antigos? Depreciação prevista.
- Preço API? Flash ≈ $0.28/1M tokens de saída; Pro ≈ $3.48/1M.
- Parâmetros? Pro 1.6T totais / 49B ativos; Flash 284B / 13B.