DeepSeek V4 리뷰: 기능, 피드백 및 가격
DeepSeek V4의 기능, 1M 컨텍스트, CSA/HCA 구조, 벤치마크, 사용자 피드백, 한계, API 가격을 리뷰합니다.
DeepSeek V4에 대해 출시일, 모델 사양, 파라미터 논의는 오래 보도와 추측이 섞여 있었습니다. 이제 상황은 더 분명합니다. DeepSeek V4는 공개되었고, 공식 문서에는 deepseek-v4-flash, deepseek-v4-pro, 1M 토큰 컨텍스트, 최대 384K 출력, 공개 가격, deepseek-chat / deepseek-reasoner에서의 이전 경로가 명시되어 있습니다. 이 글은 기능, 가격, 벤치마크, 실제 사용자 피드백, 한계, PixVerse 관점을 정리합니다.
2026년 4월 24일: DeepSeek V4 공개
2026년 4월 24일, DeepSeek V4는 공개 제품 표면으로 이동했습니다. 핵심은 100만 토큰(1M) 컨텍스트이며, API는 deepseek-v4-pro / deepseek-v4-flash로 제공되고 가중치도 공개되었습니다. 웹 chat.deepseek.com 및 공식 앱에서는 Pro=전문가 모드, Flash=빠른 모드로 대응됩니다.
같은 날 공개된 아키텍처 규모 수치(과금표와는 별개. DeepSeek 공지 기준이며 변경 시 공식 확인):
| deepseek-v4-pro | deepseek-v4-flash | |
|---|---|---|
| 총 파라미터(공지) | 1.6T | 284B |
| 활성(공지) | 49B | 13B |
| 사전학습 데이터(공지) | 33T tokens | 32T tokens |
| 컨텍스트 | 1M | 1M |
| 오픈소스(공지) | 예 | 예 |
| API(공지) | 예 | 예 |
| 웹·앱(공지) | 전문가 모드 | 빠른 모드 |
요금·한도·사고 모드는 항상 온라인 모델 & 가격 문서를 기준으로 한다.
모델 및 가격: V4-Flash와 V4-Pro
모델 & 가격 (Models & pricing) 기준(가격과 한도는 변경 가능—항상 최신 온라인 확인).
| deepseek-v4-flash* | deepseek-v4-pro | |
|---|---|---|
| 문서상 버전 | DeepSeek-V4-Flash | DeepSeek-V4-Pro |
| Base URL (OpenAI) | https://api.deepseek.com | 동일 |
| Base URL (Anthropic) | https://api.deepseek.com/anthropic | 동일 |
| 사고 모드 | 비사고/사고, 기본은 사고(문서) | 문서 Pro 열 |
| 컨텍스트 | 1M | 1M |
| 최대 출력 | 최대 384K | 최대 384K |
| 기능 | JSON, Tool, 프리픽스 완성(β) 등, FIM은 비사고만 등—표 준수 | Pro 열 |
가격 (백만 토큰당, 입력: 캐시 히트/미스)
| V4-Flash* | V4-Pro | |
|---|---|---|
| 입력(캐시 히트) | 0.2 元 | 1 元 |
| 입력(미스) | 1 元 | 12 元 |
| 출력 | 2 元, 약 $0.28 | 24 元, 약 $3.48 |
출력 가격은 개발자에게 중요한 지표입니다. V4-Flash는 100만 토큰당 약 $0.28, V4-Pro는 약 $3.48로 제시됩니다. 레거시 deepseek-chat / deepseek-reasoner는 향후 삭제 예정이며 Flash의 비-사고/사고 모드에 매핑됩니다.
출시에 관한: 보도 → 문서
2026년 초~4월 Reuters 등의 일정·칩 보도는 맥락이고, 통합팀에게는 현재 가격표의 모델 ID와 실제 콘솔 한도 확인이 기준입니다.
모델 개요: V3·R1 대 V4
1M 컨텍스트, 384K 상한(문서), Flash/Pro 이중 요금이 눈에 띄는 변화. 128K 중심 구성에서의 이행이 필요합니다.
파라미터(이야기 vs 청구)
보도의 ~1T MoE, V4 Lite 등은 배경 지식이고, 인보이스는 백만 토큰당 요금으로 읽으면 됩니다. V4의 핵심 기술어는 CSA(압축 희소 어텐션)+HCA(고도 압축 어텐션) 하이브리드 구조입니다. 이 구조가 1M 컨텍스트를 메모리와 연산 비용 측면에서 현실화하는 기반입니다. Huawei Ascend 계열 국내 연산 기반에서의 학습·추론, Cambricon vLLM의 V4-Flash / V4-Pro 오픈소스 적응도 배포 관점에서 중요합니다.
벤치마크와 제3자 평가
Arena.ai 평가에 따르면 V4-Pro는 오픈소스 모델 코드 아레나 3위, 전체 14위입니다. Vals AI의 Vibe Code Benchmark에서는 V4가 오픈웨이트 모델 1위에 올랐고, V3.2 대비 약 10배 성능 향상을 보였으며 일부 시나리오에서는 Gemini 3.1 Pro 같은 폐쇄형 모델도 앞섰습니다.
피드백: 긴 컨텍스트와 Agent 코딩
Reddit 실사용 테스트에서는 80만 자 문서에 숨긴 가상 정보 “장삼의 은행카드 비밀번호는 9527”을 V4-Pro가 정확히 찾아냈습니다. 50만 자 산업 리포트는 업로드 약 30초, 처리 약 1분이 걸렸고, 요약은 핵심 포인트의 90% 이상을 커버했으며 심각한 환각은 보고되지 않았습니다. Agent 코딩에서는 Non-think, Think High, Think Max의 세 가지 추론 상태가 확인되었고, 전체 프로젝트 코드베이스 분석에도 강하다는 평가가 나왔습니다.
한계와 객관 평가
DeepSeek은 V4가 복잡한 지식과 추론 능력에서 최상위 폐쇄형 시스템보다 아직 약 3~6개월 뒤처져 있다고 밝혔습니다. 또한 고급 연산 자원 제약으로 Pro 버전 처리량에는 상한이 있습니다. 가격뿐 아니라 레이트 리밋, 지역 가용성, 피크 지연도 확인해야 합니다.
크리에이터
- Flash=시도·다량, Pro=깊이—가격이 가이드.
- 1M=긴 브리프·레퍼런스, 단 한 번에 전부보다 구조적 요약.
- Seedance 2.0 (Seedance 2.0) 등 전용 비디오 엔진과 함께 쓰는 편이 낫습니다.
PixVerse
모델 표면이 문서화된 만큼, 백엔드 연동 계획에 착수합니다. 이름 폐지에 맞춰 UI 옵션을 정리하고, 스펙 변동을 따릅니다. 실측·크레딧은 추후 공지.
FAQ
- V4 나왔나? 예. 문서/콘솔에 V4-Flash/Pro가 나열되어 있습니다.
- 구 모델명? 폐지 예정, Flash 호환 매핑.
- API 출력 가격? Flash 약 $0.28/100만 토큰, Pro 약 $3.48/100만 토큰.
- 파라미터? Pro는 1.6T 총/49B 활성, Flash는 284B/13B.
- PixVerse? 예, 병렬 통합.