Anthropic 的终极安全模型 Mythos,上线当天就被未授权访问了

Anthropic 上周发布了一个名为 Mythos 的顶级网络安全模型,号称具备批量发现零日漏洞、渗透主流操作系统的能力。出于安全考虑,Anthropic 仅在极小范围内向 Apple、Amazon、Cisco 等企业开放封闭测试,项目代号 Glasswing。

但彭博社 4 月 22 日披露,一个规模不大的 Discord 私人社群在 Mythos 发布当天就绕过限制获取了访问权限,并且持续使用近两周,期间未触发任何异常告警。直到相关截图被提供给彭博社后,此事才被外界知晓。

模型有多强

Anthropic 自称 Mythos(正式名称 Claude Mythos Preview)是"迄今最强大的模型",能够识别并利用"所有主流操作系统和所有主流浏览器"中的漏洞。Researcher 证实它可以自主组合多个弱点来穿透复杂系统,引发了对金融基础设施和关键系统成为攻击目标的担忧。

这些能力促使美国政府和金融监管层高度紧张——据报道,此事引发了财政部和美联储官员与华尔街银行 CEO 之间的紧急讨论。

Anthropic 对 Mythos 的定位极为谨慎,仅通过项目 Glasswing 向极少数科技和金融机构开放测试,目的是让这些组织先行排查自身基础设施的漏洞。

访问是怎么发生的

根据彭博社和 Techloy 的报道,未授权访问的路径出人意料地简单:

  • 该 Discord 社群专门搜集未发布 AI 模型的信息,成员使用自动化工具扫描 GitHub 等平台寻找技术线索
  • 其中一名成员拥有 Anthropic 使用的第三方供应商环境的 contractor 级别访问权限
  • 社群基于对 Anthropic 系统命名规则的了解,"有根据地猜测"了模型在线位置的 URL
  • 部分技术细节来自此前 AI 招聘初创公司 Mercor 发生的数据泄露

Anthropic 在声明中确认正在调查:"我们正在调查一份关于通过第三方供应商环境未经授权访问 Claude Mythos Preview 的报告。"公司表示目前没有证据表明访问超出了供应商环境范围或影响了内部系统。

Mythos报道配图

实际使用情况

让人稍感宽慰的是,该社群并未将 Mythos 用于恶意目的。据知情人士透露,他们进行的测试包括让模型搭建基础网站等简单任务,而非网络安全攻击。

该社群的访问从 Anthropic 宣布 Mythos 有限测试计划当天(4 月 7 日)开始,持续到彭博社报道时(4 月 22 日)——大约两周时间。信息来源通过截图和现场演示向彭博社证实了这些说法。

讽刺之处

这个事件最值得关注的地方在于:一个被定位为"过于危险、必须严格限制访问"的模型,其访问控制机制却被一个非正式社群用相对简单的方法绕过了。

Anthropic 花了大量精力构建安全叙事——从限制发布范围到引发政府高层的紧急会议,但在基本的供应链安全和第三方访问管理上却出现了漏洞。这暴露了 AI 行业一个结构性矛盾:对外宣称的安全能力越强,对自身安全实践的要求就越高。

行业影响

目前可以观察到的影响包括:

  • Mozilla 已经使用 Mythos 修复了 Firefox 的 271 个漏洞
  • Anthropic 正在加速 IPO 准备(据报道最早今年 10 月)
  • 美国监管层对 AI 安全模型的讨论进一步升温
  • 行业内关于"AI 能力封锁"是否可行的争论加剧

核心问题在于:当一个 AI 模型的安全价值本身就依赖于严格的访问控制时,访问控制失败意味着什么?这不仅关乎 Anthropic 一家公司的声誉,更关乎整个 AI 行业"负责任地限制危险模型"这一叙事的可信度。

来源:Bloomberg · Techloy

相关推荐