GLM-5.2 追平 Anthropic Mythos 漏洞检测能力，美国 AI 限制政策遭批适得其反

6/28/2026Anthropic 智谱 AI 网络安全开源模型 GLM-5.2

智谱 AI 本月发布的开源模型 GLM-5.2 在软件漏洞检测领域已追平美国顶尖水平。安全公司 Semgrep 的测试显示，GLM-5.2 在 IDOR 检测基准上取得 39% F1，超过 Claude Code（32%），每发现一个漏洞成本仅约 0.17 美元。虽然仍低于 Semgrep 自家的多模态流水线（53-61%），但在仅凭 prompt 驱动的模型中，GLM-5.2 是表现最好的开源权重模型。

GLM-5.2 采用 MoE 架构，总参数约 7500 亿，每个 token 仅激活约 400 亿，推理成本相对可控。它在 Terminal-Bench 2.1 上得分 81.0（Claude Opus 4.8 为 85.0），SWE-bench Pro 上得分 62.1，已跻身全球使用量前列的开源大模型。MIT 许可意味着任何组织都可以下载、运行、微调，在自己的环境中完成安全检测。

Semgrep IDOR 检测基准对比：GLM-5.2 以 39% F1 领跑纯模型类别

360 安全公司在 ISC.AI 2026 大会上发布了号称匹敌 Mythos 的漏洞检测工具“屠龙锋”，标志着中国安全厂商在 AI 驱动防御能力上也在快速追赶。

与此同时，美国政府的 AI 限制政策却在引发反效果。OpenAI 在 6 月 27 日（周五）应美国政府要求，将最新发布的 GPT-5.6 限制为仅对少数“受信合作伙伴”开放预览。Anthropic 此前更惨：6 月 12 日美国政府依据出口管制指令，要求 Anthropic 关闭其最强的网络安全模型 Mythos 5 和通用模型 Fable 5 对所有用户的访问，包括 Anthropic 自身的非美国籍员工。直到 6 月 27 日，商务部才批准 Mythos 5 恢复对约 100 家美国关键基础设施运营机构的部署。Fable 5 至今仍未获批。

批评者指出这种矛盾：封禁美国自身的前沿模型，却在芯片出口政策上留有漏洞，客观上推动了全球企业转向更便宜、更容易获取的中国开源模型。OpenAI CEO Sam Altman 公开表示“不希望政府替企业挑选客户”，认为这种做法会阻碍网络安全防御者获得他们需要的工具。

GLM-5.2 的出现恰好说明了这种政策效果的讽刺性：当美国顶尖模型被层层限制时，中国开源模型正在通过公开的权重和可验证的基准测试，证明自己在关键安全领域能力并不逊色。