DeepSeek V4 即将引入峰谷定价：高峰时段价格翻倍

DeepSeek V4 正式版计划 7 月中旬上线，同步调整 API 定价规则。新方案引入峰谷定价机制，工作日高峰时段价格翻倍。

峰谷定价具体方案

高峰时段为北京时间工作日 9:00-12:00 和 14:00-18:00。调价前 24 小时通过邮件通知用户，继续使用即视为同意新计费方式，不同意可退出并申请退款。

当前 V4 系列已区分缓存命中和缓存未命中的输入价格，峰谷定价在此基础上叠加时段乘数：高峰时段所有单价统一翻倍。

模型	计费类型	平时价（元/百万 tokens）	高峰价（元/百万 tokens）
V4-Pro	输入缓存命中	0.025	0.05
V4-Pro	输入缓存未命中	3	6
V4-Pro	输出	6	12
V4-Flash	输入缓存命中	0.02	0.04
V4-Flash	输入缓存未命中	1	2
V4-Flash	输出	2	4

DeepSeek V4 价格对比

DeepSeek V4 的绝对价格处于全球最低梯队。V4-Flash 输出价格即使在高峰时段（4 元/百万 tokens）仍低于大多数竞品的日常价格。峰谷定价对成本敏感度高的开发者影响有限，但对大规模调用者而言，将批量任务调度到非高峰时段可以节省一半费用。

从 GPU 利用率角度看，工作日上午是推理需求的自然高峰。DeepSeek 此前在 V3 和 R1 时期已测试过低谷时段折扣（UTC 16:30-00:30），V4 正式版改变了策略：平时价格维持不变，高峰时段额外收费。相比低谷打折，这套机制对用户更透明，判断何时调用更划算也更直观。

峰谷定价下，开发者的主要优化手段是时间分流。实时交互类需求（聊天机器人、在线翻译）必须在高峰时段运行，成本上升不可避免。但批量处理类任务（数据标注、内容生成、评测跑分、日志分析）可以调度到非高峰时段，避开溢价。

另一个杠杆是模型分流。高峰时段如果 V4-Pro 成本过高，可以将部分任务降级到 V4-Flash。Flash 高峰输出价 4 元/百万 tokens，放在整个市场上仍处于最低价格带。

DeepSeek 还提供了退出机制：调价后继续使用视为同意新计费方式，不同意可退出并申请退款。这在 API 服务中不常见，给了用户缓冲期。

峰谷定价是对 GPU 算力的需求侧管理。当模型能力趋同，定价机制本身成了竞争维度。AWS Spot 实例和竞价型 GPU 已验证这套逻辑，DeepSeek 是首个将其引入大模型 API 的头部厂商。

来源：DeepSeek API 官方定价文档