Review do DeepSeek V4: recursos, feedback e preços

Review do DeepSeek V4 com recursos Flash/Pro, contexto de 1M tokens, arquitetura CSA/HCA, benchmarks, feedback, limites e preço da API.

Industry News
DeepSeek V4 Flash e Pro na API pública

A história do DeepSeek V4 misturou data de lançamento, detalhes de modelo e parâmetros em rumores. Agora o quadro é mais claro: DeepSeek V4 foi lançado com deepseek-v4-flash e deepseek-v4-pro, contexto de 1M tokens, até 384K de saída, preços publicados e migração a partir de deepseek-chat / deepseek-reasoner. A PixVerse acompanha o V4 como uma opção para contexto longo, análise de código e fluxos criativos.

24 de abril de 2026: DeepSeek V4 disponível

Em 24 de abril de 2026, o DeepSeek V4 passou da especulação para um produto público: contexto de 1M tokens, pesos abertos e API com deepseek-v4-pro e deepseek-v4-flash. Números divulgados: 1,6T total / 49B ativos (Pro); 284B / 13B (Flash); pré-treino 33T / 32T tokens. Web em chat.deepseek.com; app com modo Especialista (Pro) e Rápido (Flash). Preços e limites continuam na página Modelos e preços ao vivo.

Modelos e preços: V4-Flash e V4-Pro

deepseek-v4-flash*deepseek-v4-pro
Base OpenAIhttps://api.deepseek.com=
Base Anthropichttps://api.deepseek.com/anthropic=
Contexto1M1M
Saída máx. (tabela docs)384K384K
Preço (CNY/M, entrada hit/miss, saída)0,2 / 1 / 2 (saída ≈ $0.28)1 / 12 / 24 (saída ≈ $3.48)

O custo de saída é um ponto de conversão importante: V4-Flash sai por cerca de $0.28 por 1M tokens, enquanto V4-Pro sai por cerca de $3.48 por 1M tokens. Os nomes legados deepseek-chat e deepseek-reasoner devem migrar para os IDs V4.

Data de lançamento: da imprensa à API pública

De janeiro a abril de 2026, reportagens da Reuters e de outros veículos deram contexto. Para produto, a data pública é 24 de abril de 2026, quando Flash e Pro apareceram com IDs, contexto e preços na documentação.

Parâmetros: narrativa x fatura

Mídias: ~1T MoE, V4 Lite. Custo: CNY/1M na web DeepSeek. O termo técnico central é a atenção híbrida CSA (compressed sparse attention) + HCA (heavy compressed attention), base para viabilizar 1M de contexto. Também importam a base Ascend para treino/inferência e a adaptação open source do Cambricon vLLM para V4-Flash e V4-Pro.

Benchmarks e avaliação externa

Segundo a Arena.ai, o V4-Pro ficou em 3º lugar na arena de código de modelos open source e em 14º no geral. No Vals AI Vibe Code Benchmark, o V4 liderou entre modelos open-weight, teve salto de cerca de 10x sobre o V3.2 e superou modelos fechados como Gemini 3.1 Pro em cenários específicos.

Feedback: contexto longo e Agent coding

Em um teste prático no Reddit, o V4-Pro localizou uma informação fictícia escondida em um documento de 800 mil caracteres. Em um relatório de 500 mil caracteres, o upload levou cerca de 30 segundos, o processamento cerca de 1 minuto e o resumo cobriu mais de 90% dos pontos centrais sem alucinações graves. Em programação agentic, apareceram modos Non-think, Think High e Think Max.

Limitações e avaliação objetiva

A DeepSeek afirma que o V4 ainda está cerca de 3 a 6 meses atrás dos melhores sistemas fechados em conhecimento complexo e raciocínio. Além disso, por limitações de computação de ponta, o throughput do V4-Pro tem teto. Avalie preço junto com limites, região, latência e disponibilidade.

Criadores e PixVerse

Flash para volume, Pro para profundidade. 1M de contexto exige bons chunkings. Com Seedance 2.0 (Seedance 2.0) e parceiros, V4 entra como opção completa, não mito único.

Integração: em curso com alinhamento aos nomes oficiais e fim de legados.

FAQ

  • Lançou? Sim: Flash/Pro aparecem na documentação e na API, com verificação por região.
  • Nomes antigos? Depreciação prevista.
  • Preço API? Flash ≈ $0.28/1M tokens de saída; Pro ≈ $3.48/1M.
  • Parâmetros? Pro 1.6T totais / 49B ativos; Flash 284B / 13B.