DeepSeek V4 리뷰: 기능, 피드백 및 가격

DeepSeek V4의 기능, 1M 컨텍스트, CSA/HCA 구조, 벤치마크, 사용자 피드백, 한계, API 가격을 리뷰합니다.

Industry News
DeepSeek V4 Flash 및 Pro 공개 API 제공

DeepSeek V4에 대해 출시일, 모델 사양, 파라미터 논의는 오래 보도와 추측이 섞여 있었습니다. 이제 상황은 더 분명합니다. DeepSeek V4는 공개되었고, 공식 문서에는 deepseek-v4-flash, deepseek-v4-pro, 1M 토큰 컨텍스트, 최대 384K 출력, 공개 가격, deepseek-chat / deepseek-reasoner에서의 이전 경로가 명시되어 있습니다. 이 글은 기능, 가격, 벤치마크, 실제 사용자 피드백, 한계, PixVerse 관점을 정리합니다.

2026년 4월 24일: DeepSeek V4 공개

2026년 4월 24일, DeepSeek V4는 공개 제품 표면으로 이동했습니다. 핵심은 100만 토큰(1M) 컨텍스트이며, API는 deepseek-v4-pro / deepseek-v4-flash로 제공되고 가중치도 공개되었습니다. 웹 chat.deepseek.com 및 공식 앱에서는 Pro=전문가 모드, Flash=빠른 모드로 대응됩니다.

같은 날 공개된 아키텍처 규모 수치(과금표와는 별개. DeepSeek 공지 기준이며 변경 시 공식 확인):

deepseek-v4-prodeepseek-v4-flash
총 파라미터(공지)1.6T284B
활성(공지)49B13B
사전학습 데이터(공지)33T tokens32T tokens
컨텍스트1M1M
오픈소스(공지)
API(공지)
웹·앱(공지)전문가 모드빠른 모드

요금·한도·사고 모드는 항상 온라인 모델 & 가격 문서를 기준으로 한다.

모델 및 가격: V4-Flash와 V4-Pro

모델 & 가격 (Models & pricing) 기준(가격과 한도는 변경 가능—항상 최신 온라인 확인).

deepseek-v4-flash*deepseek-v4-pro
문서상 버전DeepSeek-V4-FlashDeepSeek-V4-Pro
Base URL (OpenAI)https://api.deepseek.com동일
Base URL (Anthropic)https://api.deepseek.com/anthropic동일
사고 모드비사고/사고, 기본은 사고(문서)문서 Pro 열
컨텍스트1M1M
최대 출력최대 384K최대 384K
기능JSON, Tool, 프리픽스 완성(β) 등, FIM은 비사고만 등—표 준수Pro 열

가격 (백만 토큰당, 입력: 캐시 히트/미스)

V4-Flash*V4-Pro
입력(캐시 히트)0.2 元1 元
입력(미스)1 元12 元
출력2 元, 약 $0.2824 元, 약 $3.48

출력 가격은 개발자에게 중요한 지표입니다. V4-Flash는 100만 토큰당 약 $0.28, V4-Pro는 약 $3.48로 제시됩니다. 레거시 deepseek-chat / deepseek-reasoner는 향후 삭제 예정이며 Flash의 비-사고/사고 모드에 매핑됩니다.

출시에 관한: 보도 → 문서

2026년 초~4월 Reuters 등의 일정·칩 보도는 맥락이고, 통합팀에게는 현재 가격표의 모델 ID와 실제 콘솔 한도 확인이 기준입니다.

모델 개요: V3·R1 대 V4

1M 컨텍스트, 384K 상한(문서), Flash/Pro 이중 요금이 눈에 띄는 변화. 128K 중심 구성에서의 이행이 필요합니다.

파라미터(이야기 vs 청구)

보도의 ~1T MoE, V4 Lite 등은 배경 지식이고, 인보이스는 백만 토큰당 요금으로 읽으면 됩니다. V4의 핵심 기술어는 CSA(압축 희소 어텐션)+HCA(고도 압축 어텐션) 하이브리드 구조입니다. 이 구조가 1M 컨텍스트를 메모리와 연산 비용 측면에서 현실화하는 기반입니다. Huawei Ascend 계열 국내 연산 기반에서의 학습·추론, Cambricon vLLM의 V4-Flash / V4-Pro 오픈소스 적응도 배포 관점에서 중요합니다.

벤치마크와 제3자 평가

Arena.ai 평가에 따르면 V4-Pro는 오픈소스 모델 코드 아레나 3위, 전체 14위입니다. Vals AI의 Vibe Code Benchmark에서는 V4가 오픈웨이트 모델 1위에 올랐고, V3.2 대비 약 10배 성능 향상을 보였으며 일부 시나리오에서는 Gemini 3.1 Pro 같은 폐쇄형 모델도 앞섰습니다.

피드백: 긴 컨텍스트와 Agent 코딩

Reddit 실사용 테스트에서는 80만 자 문서에 숨긴 가상 정보 “장삼의 은행카드 비밀번호는 9527”을 V4-Pro가 정확히 찾아냈습니다. 50만 자 산업 리포트는 업로드 약 30초, 처리 약 1분이 걸렸고, 요약은 핵심 포인트의 90% 이상을 커버했으며 심각한 환각은 보고되지 않았습니다. Agent 코딩에서는 Non-think, Think High, Think Max의 세 가지 추론 상태가 확인되었고, 전체 프로젝트 코드베이스 분석에도 강하다는 평가가 나왔습니다.

한계와 객관 평가

DeepSeek은 V4가 복잡한 지식과 추론 능력에서 최상위 폐쇄형 시스템보다 아직 약 3~6개월 뒤처져 있다고 밝혔습니다. 또한 고급 연산 자원 제약으로 Pro 버전 처리량에는 상한이 있습니다. 가격뿐 아니라 레이트 리밋, 지역 가용성, 피크 지연도 확인해야 합니다.

크리에이터

  • Flash=시도·다량, Pro=깊이—가격이 가이드.
  • 1M=긴 브리프·레퍼런스, 단 한 번에 전부보다 구조적 요약.
  • Seedance 2.0 (Seedance 2.0) 등 전용 비디오 엔진과 함께 쓰는 편이 낫습니다.

PixVerse

모델 표면이 문서화된 만큼, 백엔드 연동 계획에 착수합니다. 이름 폐지에 맞춰 UI 옵션을 정리하고, 스펙 변동을 따릅니다. 실측·크레딧은 추후 공지.

FAQ

  • V4 나왔나? 예. 문서/콘솔에 V4-Flash/Pro가 나열되어 있습니다.
  • 구 모델명? 폐지 예정, Flash 호환 매핑.
  • API 출력 가격? Flash 약 $0.28/100만 토큰, Pro 약 $3.48/100만 토큰.
  • 파라미터? Pro는 1.6T 총/49B 활성, Flash는 284B/13B.
  • PixVerse? 예, 병렬 통합.