DeepSeek V4 レビュー:機能、フィードバック、価格
DeepSeek V4の機能、1Mコンテキスト、CSA/HCA構成、ベンチマーク、利用者フィードバック、制約、API価格をレビューします。
DeepSeek V4 について、リリース時期、モデル仕様、パラメータ規模は長らく推測と報道が混在していました。現在は状況が明確です。DeepSeek V4 は公開され、deepseek-v4-flash と deepseek-v4-pro、1Mトークンのコンテキスト、最大384Kの出力、公開価格、旧 deepseek-chat / deepseek-reasoner からの移行方針が示されています。本稿では、機能、価格、ベンチマーク、実利用フィードバック、制約、PixVerse 側の見方を整理します。
2026年4月24日:DeepSeek V4 公開
2026年4月24日、DeepSeek V4 は公開プロダクト面に移りました。中心は100万トークン(1M)コンテキストで、API は deepseek-v4-pro / deepseek-v4-flash、重みも公開されています。Web は chat.deepseek.com、公式アプリでは Pro=エキスパートモード、Flash=高速モード と対応づけられています。
同日の発表に掲載されたアーキテクチャ規模の数値(課金表とは別次元。DeepSeek の表現に基づき、変更時は公式を再確認):
| deepseek-v4-pro | deepseek-v4-flash | |
|---|---|---|
| 総パラメータ(発表値) | 1.6T | 284B |
| アクティブ(発表値) | 49B | 13B |
| 事前学習データ(発表値) | 33T tokens | 32T tokens |
| コンテキスト | 1M | 1M |
| オープンソース(発表) | あり | あり |
| API(発表) | あり | あり |
| Web / アプリ(発表) | エキスパートモード | 高速モード |
料金・レート制限・思考モードは、引き続きオンラインの「モデルと価格」等の開発者向けドキュメントを正とする。
モデルと価格:V4-Flash と V4-Pro
出典は上記「モデルと価格」ページ Models & pricing(価格や上限は変わり得るため、常にオンライン版を確認)。
| deepseek-v4-flash* | deepseek-v4-pro | |
|---|---|---|
| ドキュメント上の版名 | DeepSeek-V4-Flash | DeepSeek-V4-Pro |
| Base URL (OpenAI 形式) | https://api.deepseek.com | 同左 |
| Base URL (Anthropic 形式) | https://api.deepseek.com/anthropic | 同左 |
| 思考モード | 非思考/思考。デフォルトは思考(同ドキュメント) | 同表の記述に従う |
| コンテキスト | 1M | 1M |
| 最大出力 | 最大 384K トークン | 同表どおり 384K |
| 機能 | JSON、Tool、プレフィックス補完(β)等。FIM は非思考のみ等、表を参照 | 同表の Pro 列 |
価格(百万トークンあたり;入力はキャッシュ命中/不命中)
| V4-Flash* | V4-Pro | |
|---|---|---|
| 入力(キャッシュ命中) | 0.2 元 | 1 元 |
| 入力(不命中) | 1 元 | 12 元 |
| 出力 | 2 元、約 $0.28 | 24 元、約 $3.48 |
出力単価は開発者にとって重要です。V4-Flash は100万トークンあたり約 $0.28、V4-Pro は約 $3.48 とされます。レガシー名 deepseek-chat / deepseek-reasoner は将来的に廃止され、互換のため Flash の非思考/思考に対応します。
リリース時期:報道の流れ
| 日付 | 内容(報道・観測) |
|---|---|
| 2026-01-09 ほか | コード重視のロードマップ、Huawei 絡みの報道など(Reuters 等) |
| 2026-04 上旬 | 「数週間以内」等の見出し |
| 以降 | 公式ドキュメント上の V4 モデル ID が統合時の参照点 |
エンジニア向けの基準は、現在のモデルID、価格表、レート制限を自分の環境で確認することです。
モデル像:V3 / R1 と V4
ドキュメント上、1M コンテキスト、384K 出力、Flash/Pro 二層が中心。従来 128K 前提のスタックからの設計切替と捉えると分かりやすいです。
パラメータ(叙述と請求の切り分け)
報道では約1T規模のMoE、スパース活性、V4 Lite等が語られてきました。V4で重要な技術語は、CSA(圧縮スパース注意)+ HCA(重度圧縮注意)というハイブリッド注意機構です。これは1Mコンテキストを現実的なメモリと計算コストで扱うための鍵です。Huawei Ascendなど国内計算基盤での学習・推論、Cambricon vLLMによる V4-Flash / V4-Pro 対応も、導入検討では見逃せません。
ベンチマークと第三者評価
Arena.ai の評価では、V4-Pro はオープンソースモデルのコードアリーナで3位、総合で14位です。Vals AI の Vibe Code Benchmark では、V4 はオープンウェイトモデル首位で、V3.2比で約10倍の伸びを示し、一部シナリオでは Gemini 3.1 Pro などのクローズドモデルを上回りました。
フィードバック:長文脈とAgentコーディング
Reddit の実利用テストでは、80万字の文書に埋め込んだ架空情報「張三の銀行カード暗証番号は9527」を V4-Pro が正確に抽出しました。50万字の業界レポートでは、アップロード約30秒、処理約1分で、要点の90%以上をカバーし、大きな幻覚は報告されていません。Agentコーディングでは、Non-think、Think High、Think Max の使い分けが確認され、プロジェクト全体のコード分析にも強いという評価です。
制約と客観評価
DeepSeek は、V4 が複雑な知識と推論能力では最上位のクローズドシステムにまだ3〜6か月ほど遅れているとしています。また、高性能計算資源の制約により、Pro版のスループットには上限があります。価格だけでなく、レート制限、リージョン、ピーク時遅延も確認が必要です。
クリエイター向け
- Flash=高頻度・試行、Pro=重い一発、という価格段の使い分け。
- 1M コンテキスト=長い brand bible にも、雑多な一括貼り付けではなく、区切りと要約が要る。
- PixVerse では、Seedance 2.0 (Seedance 2.0) 等と併用し、映像専用ツールと汎用 LLM を分けて使うのが現実的です。
PixVerse での扱い
モデル面が文書化された今、バックエンド接続を具体化する計画を進めます。旧名廃止に同期し、同一 UI 内のモデル選択を目指します。仕様変更にも追従します。稼働後、実測とクレジットは別稿で。
FAQ(要約)
- V4 は出た? はい。公式のモデル・価格表に
deepseek-v4-flash/deepseek-v4-proが掲載されています。 - 旧名は? 廃止予定、Flash への互換マッピングあり。
- API出力価格は? Flash は約 $0.28 / 100万トークン、Pro は約 $3.48 / 100万トークン。
- パラメータは? Pro は1.6T総パラメータ/49Bアクティブ、Flash は284B/13B。
- PixVerse に来る? はい、継続的な統合案件。