GLM-5.2 追平 Anthropic Mythos 漏洞检测能力,美国 AI 限制政策遭批适得其反

智谱 AI 本月发布的开源模型 GLM-5.2 在软件漏洞检测领域已追平美国顶尖水平。安全公司 Semgrep 的测试显示,GLM-5.2 在 IDOR 检测基准上取得 39% F1,超过 Claude Code(32%),每发现一个漏洞成本仅约 0.17 美元。虽然仍低于 Semgrep 自家的多模态流水线(53-61%),但在仅凭 prompt 驱动的模型中,GLM-5.2 是表现最好的开源权重模型。

GLM-5.2 采用 MoE 架构,总参数约 7500 亿,每个 token 仅激活约 400 亿,推理成本相对可控。它在 Terminal-Bench 2.1 上得分 81.0(Claude Opus 4.8 为 85.0),SWE-bench Pro 上得分 62.1,已跻身全球使用量前列的开源大模型。MIT 许可意味着任何组织都可以下载、运行、微调,在自己的环境中完成安全检测。

Semgrep IDOR 检测基准对比:GLM-5.2 以 39% F1 领跑纯模型类别

360 安全公司在 ISC.AI 2026 大会上发布了号称匹敌 Mythos 的漏洞检测工具“屠龙锋”,标志着中国安全厂商在 AI 驱动防御能力上也在快速追赶。

与此同时,美国政府的 AI 限制政策却在引发反效果。OpenAI 在 6 月 27 日(周五)应美国政府要求,将最新发布的 GPT-5.6 限制为仅对少数“受信合作伙伴”开放预览。Anthropic 此前更惨:6 月 12 日美国政府依据出口管制指令,要求 Anthropic 关闭其最强的网络安全模型 Mythos 5 和通用模型 Fable 5 对所有用户的访问,包括 Anthropic 自身的非美国籍员工。直到 6 月 27 日,商务部才批准 Mythos 5 恢复对约 100 家美国关键基础设施运营机构的部署。Fable 5 至今仍未获批。

批评者指出这种矛盾:封禁美国自身的前沿模型,却在芯片出口政策上留有漏洞,客观上推动了全球企业转向更便宜、更容易获取的中国开源模型。OpenAI CEO Sam Altman 公开表示“不希望政府替企业挑选客户”,认为这种做法会阻碍网络安全防御者获得他们需要的工具。

GLM-5.2 的出现恰好说明了这种政策效果的讽刺性:当美国顶尖模型被层层限制时,中国开源模型正在通过公开的权重和可验证的基准测试,证明自己在关键安全领域能力并不逊色。

相关推荐