DeepSeek V4 Review: tính năng, phản hồi và giá

Review DeepSeek V4: Flash/Pro, ngữ cảnh 1M, kiến trúc CSA/HCA, benchmark, phản hồi người dùng, giới hạn và giá API.

Industry News • 24 tháng 4, 2026

DeepSeek V4 Flash và Pro trên API công khai

Câu chuyện về ngày ra mắt DeepSeek V4, chi tiết mô hình và tham số từng lẫn lộn tin đồn. Giờ đây rõ hơn: DeepSeek V4 đã được phát hành với deepseek-v4-flash và deepseek-v4-pro, ngữ cảnh 1M token, tối đa 384K đầu ra, giá công khai và lộ trình chuyển từ deepseek-chat / deepseek-reasoner. PixVerse theo dõi V4 như một lựa chọn cho ngữ cảnh dài, phân tích code và quy trình sáng tạo.

24 tháng 4 năm 2026: DeepSeek V4 đã phát hành

24 tháng 4 năm 2026, DeepSeek V4 chuyển từ suy đoán sang sản phẩm công khai: ngữ cảnh 1M token, mở trọng số và API với deepseek-v4-pro / deepseek-v4-flash. Số liệu công bố: 1,6T tổng / 49B kích hoạt (Pro); 284B / 13B (Flash); tiền huấn luyện 33T / 32T token. Web chat.deepseek.com; ứng dụng chính thức: chế độ chuyên gia (Pro) và nhanh (Flash). Giá và hạn mức luôn theo trang Mô hình & giá trực tuyến.

Mô hình và giá: V4-Flash & V4-Pro

	deepseek-v4-flash*	deepseek-v4-pro
Base OpenAI	https://api.deepseek.com	giống
Base Anthropic	https://api.deepseek.com/anthropic	giống
Ngữ cảnh	1M	1M
Đầu ra tối đa (bảng)	384K	384K
Giá (CNY/triệu, vào hit/miss, ra)	0,2 / 1 / 2 (đầu ra ≈ $0.28)	1 / 12 / 24 (đầu ra ≈ $3.48)

Giá đầu ra là thông tin quan trọng: V4-Flash khoảng $0.28 cho 1M token đầu ra, còn V4-Pro khoảng $3.48. Các tên cũ deepseek-chat và deepseek-reasoner nên được chuyển sang ID V4.

Ngày ra mắt: từ báo chí đến API công khai

Từ đầu 2026 đến tháng 4, Reuters và các nguồn khác cung cấp bối cảnh. Với sản phẩm, ngày công khai là 24/4/2026, khi Flash và Pro xuất hiện trong tài liệu với ID, ngữ cảnh và giá.

Tham số: truyện kể vs. hóa đơn

Báo nói ~1T MoE; hóa đơn = CNY/triệu token. Thuật ngữ kỹ thuật cốt lõi là cơ chế chú ý lai CSA (compressed sparse attention) + HCA (heavy compressed attention), giúp 1M ngữ cảnh khả thi hơn. Ngoài ra còn có nền tảng Ascend cho huấn luyện/suy luận và bản thích ứng open source của Cambricon vLLM cho V4-Flash và V4-Pro.

Benchmark và đánh giá bên thứ ba

Theo Arena.ai, V4-Pro xếp thứ 3 trong code arena của mô hình open source và thứ 14 tổng thể. Trong Vals AI Vibe Code Benchmark, V4 đứng đầu nhóm open-weight, tăng khoảng 10x so với V3.2 và vượt Gemini 3.1 Pro trong một số tình huống.

Phản hồi: ngữ cảnh dài và Agent coding

Trong thử nghiệm thực tế trên Reddit, V4-Pro tìm đúng một thông tin hư cấu được giấu trong tài liệu 800.000 ký tự. Với báo cáo ngành 500.000 ký tự, tải lên mất khoảng 30 giây, xử lý khoảng 1 phút, bản tóm tắt bao phủ hơn 90% ý chính và không có hallucination nghiêm trọng. Với Agent coding, người dùng ghi nhận các chế độ Non-think, Think High và Think Max.

Giới hạn và đánh giá khách quan

DeepSeek cho biết V4 vẫn chậm hơn khoảng 3-6 tháng so với các hệ thống đóng hàng đầu về kiến thức phức tạp và suy luận. Thông lượng V4-Pro cũng có trần do giới hạn tính toán cao cấp. Hãy đánh giá giá cùng hạn mức, khu vực, độ trễ và khả dụng.

Nhà sáng tạo & PixVerse

Flash cho số lượng, Pro cho độ sâu. Cùng Seedance 2.0 (Seedance 2.0), chọn công cụ hợp cảnh. Tích hợp V4 theo tên mới.

FAQ ngắn

Ra mắt? Có, Flash/Pro đã có trong tài liệu và API, cần kiểm tra theo khu vực.
Tên cũ? Sẽ bỏ — ánh xạ Flash.
Giá API? Flash ≈ $0.28/1M token đầu ra; Pro ≈ $3.48/1M.
Tham số? Pro 1.6T tổng / 49B kích hoạt; Flash 284B / 13B.