DeepSeek API 更新并发限制与 user_id 隔离功能

5/21/2026AIDeepSeekAPI

DeepSeek API 官方文档更新了并发限制说明和新增的 user_id 隔离功能。V4 模型的并发上限现已明确:deepseek-v4-pro 为 500 并发,deepseek-v4-flash 为 2500 并发。

DeepSeek API 并发限速

并发限制

DeepSeek 对不同模型的并发限制如下:

模型并发限制
deepseek-v4-pro500
deepseek-v4-flash2500

几个关键点:

  • 并发以账号粒度计算,与 API Key 无关
  • 超出限制返回 HTTP 429 错误
  • 有更高并发需求的用户可免费提交扩容申请工单,扩容不增加额外费用
  • 一个请求从发出到模型响应完成之前记为一个并发

user_id 隔离

DeepSeek 新增 user_id 参数,支持在同一账号下对业务侧不同用户做细粒度管理。user_id 需满足正则 [a-zA-Z0-9\-_]+,最大长度 512 字符,不应包含用户隐私信息。

user_id 的三个作用:

  • 内容安全隔离:区分业务侧不同用户身份,进行独立的内容安全处理
  • KVCache 隔离:对不同业务用户的缓存进行隔离,保障隐私安全
  • 调度隔离:对不同业务用户进行独立的调度管理

设置方式

OpenAI Chat Completions 接口在请求体中直接添加 user_id 字段:

json
{
  "model": "deepseek-v4-pro",
  "messages": [{"role": "user", "content": "Hello!"}],
  "user_id": "your_user_id"
}

使用 OpenAI SDK 时通过 extra_body 传递:

python
client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[{"role": "user", "content": "Hello!"}],
    extra_body={"user_id": "your_user_id"}
)

Anthropic 接口通过 metadata 传递:

json
{
  "model": "deepseek-v4-pro",
  "messages": [{"role": "user", "content": "Hello!"}],
  "metadata": {"user_id": "your_user_id"},
  "max_tokens": 1024
}

并发计算规则

  • 普通 API 用户:同一账号下所有 user_id 合并计算并发
  • 已扩容账号:除限制账号总并发外,每个 user_id 也会受到与模型对应的单用户并发限制

这意味着扩容账号同时受到两层限制:账号总并发上限 + 每 user_id 独立并发上限,适合多租户场景下对单用户资源进行管控。

来源:DeepSeek API Docs

相关推荐