苹果被曝蒸馏 Gemini，想先把 AI 能力压进 iPhone

据 AppleInsider 引述 The Information，苹果正在研究把 Google Gemini 的部分能力通过蒸馏方式拆成更小模型，目标是让这些模型更适合跑在 iPhone 这样的终端设备上。

如果这个方向属实，它透露出的重点很清楚：苹果当下更在意的，是把一批高频、明确、可复用的 AI 能力尽量压回设备端。眼下看，它还没有把主要精力放在训练一个全面正面对打 Gemini 的超大模型上。

Apple 与 Gemini 相关配图

端侧路线对苹果并不意外。Apple Intelligence 从一开始就把“能在设备上做的事尽量在设备上做”摆在很前面，原因也不复杂：本地处理更容易控制时延、隐私和稳定性，也更能发挥自家芯片和系统协同的优势。对 iPhone 这类硬件平台来说，这比追求一个参数规模更大的通用模型更贴近产品现实。

报道里更值得注意的一点，是苹果并不是把 Gemini 当成单纯的外部接口来接入，而是希望借助蒸馏，把大模型里对特定任务真正有用的能力拆出来，再训练成更轻的小模型。这样做的好处是明确的：在某些具体功能上，保留原模型的速度和准确度，同时把成本、功耗和硬件门槛都压下来。

从产品角度看，这也是一条更符合苹果节奏的路。Siri、写作辅助、摘要、邮件整理、通知理解，这些场景并不都需要一个始终在线的超大云端模型。很多能力如果能被做成更小的端侧模块，体验往往会更稳定，也更容易规模化落地。

这并不意味着 Gemini 会很快退场。按公开报道的说法，Gemini 作为完整模型，短期内仍可能继续为 Siri 的部分查询提供支持。换句话说，苹果眼下更像是在一边借助外部大模型补齐能力，一边把真正需要长期留在自家体系里的部分慢慢收回到设备端。

更关键的问题，是苹果准备把哪些能力留下来、哪些能力继续放在云上。这个分层一旦做清楚，Apple Intelligence 后面几代的形态也会越来越明确：云端模型负责兜底，端侧模型负责高频体验，苹果自己则把核心控制权逐步拿回手里。

来源：