DeepSeek API 更新并发限制与 user_id 隔离功能
DeepSeek API 官方文档更新了并发限制说明和新增的 user_id 隔离功能。V4 模型的并发上限现已明确:deepseek-v4-pro 为 500 并发,deepseek-v4-flash 为 2500 并发。

并发限制
DeepSeek 对不同模型的并发限制如下:
| 模型 | 并发限制 |
|---|---|
| deepseek-v4-pro | 500 |
| deepseek-v4-flash | 2500 |
几个关键点:
- 并发以账号粒度计算,与 API Key 无关
- 超出限制返回 HTTP 429 错误
- 有更高并发需求的用户可免费提交扩容申请工单,扩容不增加额外费用
- 一个请求从发出到模型响应完成之前记为一个并发
user_id 隔离
DeepSeek 新增 user_id 参数,支持在同一账号下对业务侧不同用户做细粒度管理。user_id 需满足正则 [a-zA-Z0-9\-_]+,最大长度 512 字符,不应包含用户隐私信息。
user_id 的三个作用:
- 内容安全隔离:区分业务侧不同用户身份,进行独立的内容安全处理
- KVCache 隔离:对不同业务用户的缓存进行隔离,保障隐私安全
- 调度隔离:对不同业务用户进行独立的调度管理
设置方式
OpenAI Chat Completions 接口在请求体中直接添加 user_id 字段:
json{ "model": "deepseek-v4-pro", "messages": [{"role": "user", "content": "Hello!"}], "user_id": "your_user_id" }
使用 OpenAI SDK 时通过 extra_body 传递:
pythonclient.chat.completions.create( model="deepseek-v4-pro", messages=[{"role": "user", "content": "Hello!"}], extra_body={"user_id": "your_user_id"} )
Anthropic 接口通过 metadata 传递:
json{ "model": "deepseek-v4-pro", "messages": [{"role": "user", "content": "Hello!"}], "metadata": {"user_id": "your_user_id"}, "max_tokens": 1024 }
并发计算规则
- 普通 API 用户:同一账号下所有
user_id合并计算并发 - 已扩容账号:除限制账号总并发外,每个
user_id也会受到与模型对应的单用户并发限制
这意味着扩容账号同时受到两层限制:账号总并发上限 + 每 user_id 独立并发上限,适合多租户场景下对单用户资源进行管控。
来源:DeepSeek API Docs
相关推荐
- 鸿海 Q4 利润不及预期,给 AI 硬件热泼了一盆冷水3/16/2026
- 据路透:华虹旗下华力微电子拟量产 7 纳米,华虹或成中国第二家 7nm 代工厂3/16/2026
- 据报道,微软搁置 Windows 11 多项 Copilot 系统级整合计划3/16/2026
- 中国加大对 Meta 收购 Manus 审查:高管限制离境,审查升至国家层面3/18/2026
- 小米推理模型 MiMo-V2-Pro 上线:智能指数 49,榜单排第 103/18/2026
- MiniMax 发布 M2.7:国内首个公开的模型自我进化方案3/18/2026
- OpenAI 发布 GPT-5.4 mini 与 nano:小模型加速冲刺3/17/2026
- ChatGPT App 的模型切换入口,突然变得很难找3/17/2026
- 《华盛顿邮报》把 AI 用到订阅定价上,媒体的个性化收费又往前走了一步3/17/2026
- 爱泼斯坦案幸存者起诉 Google:AI 搜索放大了数据泄露的伤害3/27/2026
- 苹果把 WWDC 2026 定在 6 月 8 日,AI 与开发者工具会是重点3/23/2026
- 英伟达把 DLSS 5 说清楚了:输入只有 2D 帧和运动矢量3/21/2026
- Google 测试改写搜索结果网页标题,网站对标题的控制权又退了一步3/20/2026
- Claude Code 上线 Channels:用 Telegram 和 Discord 操控本地编程任务3/20/2026
- Google AI Studio 升级全栈 vibe coding:Antigravity 代理来了3/20/2026
- 谷歌 Gemini Mac 版内测:桌面端补课正式开始3/20/2026
- Kimi 员工指称 MiniMax 沿用其 Office Skill 代码始末3/19/2026
- OpenAI 收购 Astral:Python 工具链收编加速3/19/2026
- Firefox 149 内置免费 VPN:50GB 月流量,首批限四国3/19/2026
- 多地试点一人公司:免费公寓+办公空间,能否激活个体创新?3/19/2026
- Google 把 Stitch 升级成 AI 原生设计画布3/19/2026
- DLSS 5 引发的争议:老黄说批评者完全错误3/19/2026
- 小米三款大模型齐发:MiMo-V2-Pro、Omni、TTS 完整解读3/19/2026
- Hugging Face 最大开源仓库快被 AI 垃圾 PR 淹没了3/19/2026
- 欧盟推去衣AI禁令:3月26日表决,执法难在哪3/19/2026
- iOS 26.4 RC 发布:Apple Music 有 AI 歌单,Podcasts 支持视频3/18/2026
- Anthropic 超 8 万用户调研:81% 认为 AI 正兑现预期3/19/2026
- 椰树集团相关公司招标 50 台人形机器人剥椰子,产线开始提具体指标了3/19/2026
- 短视频内容标注,准备进入统一规则阶段3/21/2026
- 营收涨三倍,宇树科技冲刺科创板3/20/2026