DeepSeek V4 レビュー:機能、フィードバック、価格

DeepSeek V4の機能、1Mコンテキスト、CSA/HCA構成、ベンチマーク、利用者フィードバック、制約、API価格をレビューします。

Industry News
DeepSeek V4 Flash と Pro が公開 API で利用可能

DeepSeek V4 について、リリース時期、モデル仕様、パラメータ規模は長らく推測と報道が混在していました。現在は状況が明確です。DeepSeek V4 は公開され、deepseek-v4-flashdeepseek-v4-pro、1Mトークンのコンテキスト、最大384Kの出力、公開価格、旧 deepseek-chat / deepseek-reasoner からの移行方針が示されています。本稿では、機能、価格、ベンチマーク、実利用フィードバック、制約、PixVerse 側の見方を整理します。

2026年4月24日:DeepSeek V4 公開

2026年4月24日、DeepSeek V4 は公開プロダクト面に移りました。中心は100万トークン(1M)コンテキストで、API は deepseek-v4-pro / deepseek-v4-flash、重みも公開されています。Web は chat.deepseek.com、公式アプリでは Pro=エキスパートモード、Flash=高速モード と対応づけられています。

同日の発表に掲載されたアーキテクチャ規模の数値(課金表とは別次元。DeepSeek の表現に基づき、変更時は公式を再確認):

deepseek-v4-prodeepseek-v4-flash
総パラメータ(発表値)1.6T284B
アクティブ(発表値)49B13B
事前学習データ(発表値)33T tokens32T tokens
コンテキスト1M1M
オープンソース(発表)ありあり
API(発表)ありあり
Web / アプリ(発表)エキスパートモード高速モード

料金・レート制限・思考モードは、引き続きオンラインの「モデルと価格」等の開発者向けドキュメントを正とする。

モデルと価格:V4-Flash と V4-Pro

出典は上記「モデルと価格」ページ Models & pricing(価格や上限は変わり得るため、常にオンライン版を確認)。

deepseek-v4-flash*deepseek-v4-pro
ドキュメント上の版名DeepSeek-V4-FlashDeepSeek-V4-Pro
Base URL (OpenAI 形式)https://api.deepseek.com同左
Base URL (Anthropic 形式)https://api.deepseek.com/anthropic同左
思考モード非思考/思考。デフォルトは思考(同ドキュメント)同表の記述に従う
コンテキスト1M1M
最大出力最大 384K トークン同表どおり 384K
機能JSON、Tool、プレフィックス補完(β)等。FIM は非思考のみ等、表を参照同表の Pro 列

価格(百万トークンあたり;入力はキャッシュ命中/不命中)

V4-Flash*V4-Pro
入力(キャッシュ命中)0.2 元1 元
入力(不命中)1 元12 元
出力2 元、約 $0.2824 元、約 $3.48

出力単価は開発者にとって重要です。V4-Flash は100万トークンあたり約 $0.28、V4-Pro は約 $3.48 とされます。レガシー名 deepseek-chat / deepseek-reasoner は将来的に廃止され、互換のため Flash の非思考/思考に対応します。

リリース時期:報道の流れ

日付内容(報道・観測)
2026-01-09 ほかコード重視のロードマップ、Huawei 絡みの報道など(Reuters 等)
2026-04 上旬「数週間以内」等の見出し
以降公式ドキュメント上の V4 モデル ID が統合時の参照点

エンジニア向けの基準は、現在のモデルID、価格表、レート制限を自分の環境で確認することです。

モデル像:V3 / R1 と V4

ドキュメント上、1M コンテキスト、384K 出力、Flash/Pro 二層が中心。従来 128K 前提のスタックからの設計切替と捉えると分かりやすいです。

パラメータ(叙述と請求の切り分け)

報道では約1T規模のMoE、スパース活性、V4 Lite等が語られてきました。V4で重要な技術語は、CSA(圧縮スパース注意)+ HCA(重度圧縮注意)というハイブリッド注意機構です。これは1Mコンテキストを現実的なメモリと計算コストで扱うための鍵です。Huawei Ascendなど国内計算基盤での学習・推論、Cambricon vLLMによる V4-Flash / V4-Pro 対応も、導入検討では見逃せません。

ベンチマークと第三者評価

Arena.ai の評価では、V4-Pro はオープンソースモデルのコードアリーナで3位、総合で14位です。Vals AI の Vibe Code Benchmark では、V4 はオープンウェイトモデル首位で、V3.2比で約10倍の伸びを示し、一部シナリオでは Gemini 3.1 Pro などのクローズドモデルを上回りました。

フィードバック:長文脈とAgentコーディング

Reddit の実利用テストでは、80万字の文書に埋め込んだ架空情報「張三の銀行カード暗証番号は9527」を V4-Pro が正確に抽出しました。50万字の業界レポートでは、アップロード約30秒、処理約1分で、要点の90%以上をカバーし、大きな幻覚は報告されていません。Agentコーディングでは、Non-think、Think High、Think Max の使い分けが確認され、プロジェクト全体のコード分析にも強いという評価です。

制約と客観評価

DeepSeek は、V4 が複雑な知識と推論能力では最上位のクローズドシステムにまだ3〜6か月ほど遅れているとしています。また、高性能計算資源の制約により、Pro版のスループットには上限があります。価格だけでなく、レート制限、リージョン、ピーク時遅延も確認が必要です。

クリエイター向け

  • Flash=高頻度・試行、Pro=重い一発、という価格段の使い分け。
  • 1M コンテキスト=長い brand bible にも、雑多な一括貼り付けではなく、区切りと要約が要る。
  • PixVerse では、Seedance 2.0 (Seedance 2.0) 等と併用し、映像専用ツールと汎用 LLM を分けて使うのが現実的です。

PixVerse での扱い

モデル面が文書化された今、バックエンド接続を具体化する計画を進めます。旧名廃止に同期し、同一 UI 内のモデル選択を目指します。仕様変更にも追従します。稼働後、実測とクレジットは別稿で。

FAQ(要約)

  • V4 は出た? はい。公式のモデル・価格表に deepseek-v4-flash / deepseek-v4-pro が掲載されています。
  • 旧名は? 廃止予定、Flash への互換マッピングあり。
  • API出力価格は? Flash は約 $0.28 / 100万トークン、Pro は約 $3.48 / 100万トークン。
  • パラメータは? Pro は1.6T総パラメータ/49Bアクティブ、Flash は284B/13B。
  • PixVerse に来る? はい、継続的な統合案件。