主流媒体屏蔽 Wayback Machine,百余名记者联名声援互联网档案馆

包括《纽约时报》、USA Today 母公司 Gannett 及 Reddit 在内的 23 家主流新闻网站和社交平台已开始屏蔽互联网档案馆(Internet Archive)的爬虫工具 ia_archiverbot。

主流媒体屏蔽 Wayback Machine,百余名记者联名声援互联网档案馆

这些机构的担忧指向同一个问题:档案馆存储的海量网页内容正被 AI 公司用于大模型训练,而它们认为这构成了版权侵权,并与自身业务形成直接竞争。部分媒体如《卫报》虽未直接屏蔽爬虫,但也限制了 API 访问权限。

作为回应,电子前哨基金会(EFF)等组织联合 100 多名记者签署了公开信,支持 Wayback Machine 的存档工作。联名者在信中指出,这个工具在事实核查、追踪报道修改、保留公共记录方面具有不可替代的作用——USA Today 最近的一篇调查报道就利用 Wayback Machine 追踪了美国移民与海关执法局(ICE)拘留数据的披露变化。

互联网档案馆目前正与相关媒体进行沟通。档案馆方面警告称,这种对公共网络的大规模封锁将严重削弱社会了解历史和现实的能力。

Wayback Machine 自 2001 年上线以来,已存档超过 8000 亿个网页,是全球最大的互联网存档项目。它的存在让消失的网页、被修改的文章、被删除的政策文件都有迹可循。当这个工具本身受到侵蚀,互联网"有记忆"的前提就在动摇。

相关推荐