DeepSeek V4 即将引入峰谷定价:高峰时段价格翻倍

DeepSeek V4 正式版计划 7 月中旬上线,同步调整 API 定价规则。新方案引入峰谷定价机制,工作日高峰时段价格翻倍。

峰谷定价具体方案

高峰时段为北京时间工作日 9:00-12:00 和 14:00-18:00。调价前 24 小时通过邮件通知用户,继续使用即视为同意新计费方式,不同意可退出并申请退款。

当前 V4 系列已区分缓存命中和缓存未命中的输入价格,峰谷定价在此基础上叠加时段乘数:高峰时段所有单价统一翻倍。

模型计费类型平时价(元/百万 tokens)高峰价(元/百万 tokens)
V4-Pro输入缓存命中0.0250.05
V4-Pro输入缓存未命中36
V4-Pro输出612
V4-Flash输入缓存命中0.020.04
V4-Flash输入缓存未命中12
V4-Flash输出24

DeepSeek V4 价格对比

高峰翻倍的实际影响

DeepSeek V4 的绝对价格处于全球最低梯队。V4-Flash 输出价格即使在高峰时段(4 元/百万 tokens)仍低于大多数竞品的日常价格。峰谷定价对成本敏感度高的开发者影响有限,但对大规模调用者而言,将批量任务调度到非高峰时段可以节省一半费用。

从 GPU 利用率角度看,工作日上午是推理需求的自然高峰。DeepSeek 此前在 V3 和 R1 时期已测试过低谷时段折扣(UTC 16:30-00:30),V4 正式版改变了策略:平时价格维持不变,高峰时段额外收费。相比低谷打折,这套机制对用户更透明,判断何时调用更划算也更直观。

开发者应对策略

峰谷定价下,开发者的主要优化手段是时间分流。实时交互类需求(聊天机器人、在线翻译)必须在高峰时段运行,成本上升不可避免。但批量处理类任务(数据标注、内容生成、评测跑分、日志分析)可以调度到非高峰时段,避开溢价。

另一个杠杆是模型分流。高峰时段如果 V4-Pro 成本过高,可以将部分任务降级到 V4-Flash。Flash 高峰输出价 4 元/百万 tokens,放在整个市场上仍处于最低价格带。

DeepSeek 还提供了退出机制:调价后继续使用视为同意新计费方式,不同意可退出并申请退款。这在 API 服务中不常见,给了用户缓冲期。

峰谷定价是对 GPU 算力的需求侧管理。当模型能力趋同,定价机制本身成了竞争维度。AWS Spot 实例和竞价型 GPU 已验证这套逻辑,DeepSeek 是首个将其引入大模型 API 的头部厂商。

来源:DeepSeek API 官方定价文档

相关推荐