DeepSeek V4 리뷰: 기능, 피드백 및 가격

DeepSeek V4의 기능, 1M 컨텍스트, CSA/HCA 구조, 벤치마크, 사용자 피드백, 한계, API 가격을 리뷰합니다.

Industry News • 2026년 4월 24일

DeepSeek V4에 대해 출시일, 모델 사양, 파라미터 논의는 오래 보도와 추측이 섞여 있었습니다. 이제 상황은 더 분명합니다. DeepSeek V4는 공개되었고, 공식 문서에는 deepseek-v4-flash, deepseek-v4-pro, 1M 토큰 컨텍스트, 최대 384K 출력, 공개 가격, deepseek-chat / deepseek-reasoner에서의 이전 경로가 명시되어 있습니다. 이 글은 기능, 가격, 벤치마크, 실제 사용자 피드백, 한계, PixVerse 관점을 정리합니다.

2026년 4월 24일: DeepSeek V4 공개

2026년 4월 24일, DeepSeek V4는 공개 제품 표면으로 이동했습니다. 핵심은 100만 토큰(1M) 컨텍스트이며, API는 deepseek-v4-pro / deepseek-v4-flash로 제공되고 가중치도 공개되었습니다. 웹 chat.deepseek.com 및 공식 앱에서는 Pro＝전문가 모드, Flash＝빠른 모드로 대응됩니다.

같은 날 공개된 아키텍처 규모 수치(과금표와는 별개. DeepSeek 공지 기준이며 변경 시 공식 확인):

	deepseek-v4-pro	deepseek-v4-flash
총 파라미터(공지)	1.6T	284B
활성(공지)	49B	13B
사전학습 데이터(공지)	33T tokens	32T tokens
컨텍스트	1M	1M
오픈소스(공지)	예	예
API(공지)	예	예
웹·앱(공지)	전문가 모드	빠른 모드

요금·한도·사고 모드는 항상 온라인 모델 & 가격 문서를 기준으로 한다.

모델 및 가격: V4-Flash와 V4-Pro

모델 & 가격 (Models & pricing) 기준(가격과 한도는 변경 가능—항상 최신 온라인 확인).

	deepseek-v4-flash*	deepseek-v4-pro
문서상 버전	DeepSeek-V4-Flash	DeepSeek-V4-Pro
Base URL (OpenAI)	https://api.deepseek.com	동일
Base URL (Anthropic)	https://api.deepseek.com/anthropic	동일
사고 모드	비사고/사고, 기본은 사고(문서)	문서 Pro 열
컨텍스트	1M	1M
최대 출력	최대 384K	최대 384K
기능	JSON, Tool, 프리픽스 완성(β) 등, FIM은 비사고만 등—표 준수	Pro 열

가격 (백만 토큰당, 입력: 캐시 히트/미스)

	V4-Flash*	V4-Pro
입력(캐시 히트)	0.2 元	1 元
입력(미스)	1 元	12 元
출력	2 元, 약 $0.28	24 元, 약 $3.48

출력 가격은 개발자에게 중요한 지표입니다. V4-Flash는 100만 토큰당 약 $0.28, V4-Pro는 약 $3.48로 제시됩니다. 레거시 deepseek-chat / deepseek-reasoner는 향후 삭제 예정이며 Flash의 비-사고/사고 모드에 매핑됩니다.

출시에 관한: 보도 → 문서

2026년 초~4월 Reuters 등의 일정·칩 보도는 맥락이고, 통합팀에게는 현재 가격표의 모델 ID와 실제 콘솔 한도 확인이 기준입니다.

모델 개요: V3·R1 대 V4

1M 컨텍스트, 384K 상한(문서), Flash/Pro 이중 요금이 눈에 띄는 변화. 128K 중심 구성에서의 이행이 필요합니다.

파라미터(이야기 vs 청구)

보도의 ~1T MoE, V4 Lite 등은 배경 지식이고, 인보이스는 백만 토큰당 요금으로 읽으면 됩니다. V4의 핵심 기술어는 CSA(압축 희소 어텐션)+HCA(고도 압축 어텐션) 하이브리드 구조입니다. 이 구조가 1M 컨텍스트를 메모리와 연산 비용 측면에서 현실화하는 기반입니다. Huawei Ascend 계열 국내 연산 기반에서의 학습·추론, Cambricon vLLM의 V4-Flash / V4-Pro 오픈소스 적응도 배포 관점에서 중요합니다.

벤치마크와 제3자 평가

Arena.ai 평가에 따르면 V4-Pro는 오픈소스 모델 코드 아레나 3위, 전체 14위입니다. Vals AI의 Vibe Code Benchmark에서는 V4가 오픈웨이트 모델 1위에 올랐고, V3.2 대비 약 10배 성능 향상을 보였으며 일부 시나리오에서는 Gemini 3.1 Pro 같은 폐쇄형 모델도 앞섰습니다.

피드백: 긴 컨텍스트와 Agent 코딩

Reddit 실사용 테스트에서는 80만 자 문서에 숨긴 가상 정보 “장삼의 은행카드 비밀번호는 9527”을 V4-Pro가 정확히 찾아냈습니다. 50만 자 산업 리포트는 업로드 약 30초, 처리 약 1분이 걸렸고, 요약은 핵심 포인트의 90% 이상을 커버했으며 심각한 환각은 보고되지 않았습니다. Agent 코딩에서는 Non-think, Think High, Think Max의 세 가지 추론 상태가 확인되었고, 전체 프로젝트 코드베이스 분석에도 강하다는 평가가 나왔습니다.

한계와 객관 평가

DeepSeek은 V4가 복잡한 지식과 추론 능력에서 최상위 폐쇄형 시스템보다 아직 약 3~6개월 뒤처져 있다고 밝혔습니다. 또한 고급 연산 자원 제약으로 Pro 버전 처리량에는 상한이 있습니다. 가격뿐 아니라 레이트 리밋, 지역 가용성, 피크 지연도 확인해야 합니다.

크리에이터

Flash=시도·다량, Pro=깊이—가격이 가이드.
1M=긴 브리프·레퍼런스, 단 한 번에 전부보다 구조적 요약.
Seedance 2.0 (Seedance 2.0) 등 전용 비디오 엔진과 함께 쓰는 편이 낫습니다.

PixVerse

모델 표면이 문서화된 만큼, 백엔드 연동 계획에 착수합니다. 이름 폐지에 맞춰 UI 옵션을 정리하고, 스펙 변동을 따릅니다. 실측·크레딧은 추후 공지.

FAQ

V4 나왔나? 예. 문서/콘솔에 V4-Flash/Pro가 나열되어 있습니다.
구 모델명? 폐지 예정, Flash 호환 매핑.
API 출력 가격? Flash 약 $0.28/100만 토큰, Pro 약 $3.48/100만 토큰.
파라미터? Pro는 1.6T 총/49B 활성, Flash는 284B/13B.
PixVerse? 예, 병렬 통합.