苹果被曝蒸馏 Gemini,想先把 AI 能力压进 iPhone

据 AppleInsider 引述 The Information,苹果正在研究把 Google Gemini 的部分能力通过蒸馏方式拆成更小模型,目标是让这些模型更适合跑在 iPhone 这样的终端设备上。

如果这个方向属实,它透露出的重点很清楚:苹果当下更在意的,是把一批高频、明确、可复用的 AI 能力尽量压回设备端。眼下看,它还没有把主要精力放在训练一个全面正面对打 Gemini 的超大模型上。

Apple 与 Gemini 相关配图

端侧路线对苹果并不意外。Apple Intelligence 从一开始就把“能在设备上做的事尽量在设备上做”摆在很前面,原因也不复杂:本地处理更容易控制时延、隐私和稳定性,也更能发挥自家芯片和系统协同的优势。对 iPhone 这类硬件平台来说,这比追求一个参数规模更大的通用模型更贴近产品现实。

报道里更值得注意的一点,是苹果并不是把 Gemini 当成单纯的外部接口来接入,而是希望借助蒸馏,把大模型里对特定任务真正有用的能力拆出来,再训练成更轻的小模型。这样做的好处是明确的:在某些具体功能上,保留原模型的速度和准确度,同时把成本、功耗和硬件门槛都压下来。

从产品角度看,这也是一条更符合苹果节奏的路。Siri、写作辅助、摘要、邮件整理、通知理解,这些场景并不都需要一个始终在线的超大云端模型。很多能力如果能被做成更小的端侧模块,体验往往会更稳定,也更容易规模化落地。

这并不意味着 Gemini 会很快退场。按公开报道的说法,Gemini 作为完整模型,短期内仍可能继续为 Siri 的部分查询提供支持。换句话说,苹果眼下更像是在一边借助外部大模型补齐能力,一边把真正需要长期留在自家体系里的部分慢慢收回到设备端。

更关键的问题,是苹果准备把哪些能力留下来、哪些能力继续放在云上。这个分层一旦做清楚,Apple Intelligence 后面几代的形态也会越来越明确:云端模型负责兜底,端侧模型负责高频体验,苹果自己则把核心控制权逐步拿回手里。

来源:

相关推荐