苹果新版 Siri 将用 Google 云端 + Nvidia 芯片处理 AI 请求

6/4/2026AI 苹果 Siri Nvidia

据 The Information 报道，苹果计划在今年 9 月推出的新版 Siri，将把需要云端处理的 AI 查询交给 Google 数据中心运行，使用 Nvidia Blackwell B200 芯片进行运算，并通过 Nvidia 的硬件加密技术（Confidential Compute）保护用户数据。

为什么不用自己的服务器

苹果此前推出的 Private Cloud Compute 云端计算系统运行在自研的 M 系列芯片上，以隐私和安全为核心卖点。据报道，苹果曾尝试将修改版的 Google Gemini 模型部署在 Private Cloud Compute 上，但发现运行速度过慢，无法满足产品需求。

这标志着苹果罕见的让步——一向强调自研核心部件的策略，在 AI 推理性能面前做了妥协。The Information 指出，目前尚不清楚 Private Cloud Compute 系统在即将发布的 Siri 中将扮演什么角色，但苹果可能会保留这一品牌名称。

Nvidia Confidential Compute

Nvidia 的 Confidential Compute 是一种硬件级安全技术，数据在 GPU 上处理时全程加密。据 Nvidia 官方说明，该技术"保护部署在 Rubin、Blackwell 和 Hopper GPU 上的 AI 模型的机密性和完整性，即使在共享或云环境中也能以接近原生性能安全运行敏感工作负载"。

这一技术选择旨在让苹果在将用户数据交给 Google 云端处理时，仍能维持其在隐私方面的品牌承诺。

设备端 + 云端双轨架构

下周 WWDC 上，苹果预计将重点展示设备端 AI 能力。据此前报道，苹果一直在尝试将 Google 的大规模 Gemini 模型进行蒸馏（distillation），使其能在 iPhone 上本地运行部分任务。但对话式 AI 助手需要的能力——理解复杂指令、多轮对话、跨应用操作——仍然需要云端算力支撑。

最终的架构将是双轨模式：简单任务在设备端通过蒸馏后的小模型处理，复杂查询路由到 Google Cloud 上的 Gemini，由 Nvidia B200 芯片执行推理。

Apple Intelligence 的关键转折

Apple Intelligence 自 2024 年 WWDC 发布以来，市场反响平淡，原计划推出的个性化 Siri 功能多次延迟。苹果甚至因 Siri 功能延迟被提起集体诉讼，最终以 2.5 亿美元和解。

WWDC 2026（6 月 8 日开幕）被视为苹果重塑 AI 叙事的关键机会。新版 Siri 将是 Apple Intelligence 迄今最重要的产品更新，也是苹果首次在大规模消费者产品中深度依赖第三方 AI 基础设施。

Blackwell B200 是 Nvidia 2024 年发布的旗舰数据中心 GPU，专为大规模 AI 训练和推理设计，在推理速度、内存带宽和多 GPU 扩展方面相比上一代 Hopper 架构有显著提升。

来源：The Information · MacRumors · 9to5Mac · Ars Technica