苹果新版 Siri 将用 Google 云端 + Nvidia 芯片处理 AI 请求

据 The Information 报道,苹果计划在今年 9 月推出的新版 Siri,将把需要云端处理的 AI 查询交给 Google 数据中心运行,使用 Nvidia Blackwell B200 芯片进行运算,并通过 Nvidia 的硬件加密技术(Confidential Compute)保护用户数据。

为什么不用自己的服务器

苹果此前推出的 Private Cloud Compute 云端计算系统运行在自研的 M 系列芯片上,以隐私和安全为核心卖点。据报道,苹果曾尝试将修改版的 Google Gemini 模型部署在 Private Cloud Compute 上,但发现运行速度过慢,无法满足产品需求。

这标志着苹果罕见的让步——一向强调自研核心部件的策略,在 AI 推理性能面前做了妥协。The Information 指出,目前尚不清楚 Private Cloud Compute 系统在即将发布的 Siri 中将扮演什么角色,但苹果可能会保留这一品牌名称。

Nvidia Confidential Compute

Nvidia 的 Confidential Compute 是一种硬件级安全技术,数据在 GPU 上处理时全程加密。据 Nvidia 官方说明,该技术"保护部署在 Rubin、Blackwell 和 Hopper GPU 上的 AI 模型的机密性和完整性,即使在共享或云环境中也能以接近原生性能安全运行敏感工作负载"。

这一技术选择旨在让苹果在将用户数据交给 Google 云端处理时,仍能维持其在隐私方面的品牌承诺。

设备端 + 云端双轨架构

下周 WWDC 上,苹果预计将重点展示设备端 AI 能力。据此前报道,苹果一直在尝试将 Google 的大规模 Gemini 模型进行蒸馏(distillation),使其能在 iPhone 上本地运行部分任务。但对话式 AI 助手需要的能力——理解复杂指令、多轮对话、跨应用操作——仍然需要云端算力支撑。

最终的架构将是双轨模式:简单任务在设备端通过蒸馏后的小模型处理,复杂查询路由到 Google Cloud 上的 Gemini,由 Nvidia B200 芯片执行推理。

Apple Intelligence 的关键转折

Apple Intelligence 自 2024 年 WWDC 发布以来,市场反响平淡,原计划推出的个性化 Siri 功能多次延迟。苹果甚至因 Siri 功能延迟被提起集体诉讼,最终以 2.5 亿美元和解。

WWDC 2026(6 月 8 日开幕)被视为苹果重塑 AI 叙事的关键机会。新版 Siri 将是 Apple Intelligence 迄今最重要的产品更新,也是苹果首次在大规模消费者产品中深度依赖第三方 AI 基础设施。

Blackwell B200 是 Nvidia 2024 年发布的旗舰数据中心 GPU,专为大规模 AI 训练和推理设计,在推理速度、内存带宽和多 GPU 扩展方面相比上一代 Hopper 架构有显著提升。

来源:The Information · MacRumors · 9to5Mac · Ars Technica

相关推荐