苹果被曝蒸馏 Gemini,想先把 AI 能力压进 iPhone
据 AppleInsider 引述 The Information,苹果正在研究把 Google Gemini 的部分能力通过蒸馏方式拆成更小模型,目标是让这些模型更适合跑在 iPhone 这样的终端设备上。
如果这个方向属实,它透露出的重点很清楚:苹果当下更在意的,是把一批高频、明确、可复用的 AI 能力尽量压回设备端。眼下看,它还没有把主要精力放在训练一个全面正面对打 Gemini 的超大模型上。

端侧路线对苹果并不意外。Apple Intelligence 从一开始就把“能在设备上做的事尽量在设备上做”摆在很前面,原因也不复杂:本地处理更容易控制时延、隐私和稳定性,也更能发挥自家芯片和系统协同的优势。对 iPhone 这类硬件平台来说,这比追求一个参数规模更大的通用模型更贴近产品现实。
报道里更值得注意的一点,是苹果并不是把 Gemini 当成单纯的外部接口来接入,而是希望借助蒸馏,把大模型里对特定任务真正有用的能力拆出来,再训练成更轻的小模型。这样做的好处是明确的:在某些具体功能上,保留原模型的速度和准确度,同时把成本、功耗和硬件门槛都压下来。
从产品角度看,这也是一条更符合苹果节奏的路。Siri、写作辅助、摘要、邮件整理、通知理解,这些场景并不都需要一个始终在线的超大云端模型。很多能力如果能被做成更小的端侧模块,体验往往会更稳定,也更容易规模化落地。
这并不意味着 Gemini 会很快退场。按公开报道的说法,Gemini 作为完整模型,短期内仍可能继续为 Siri 的部分查询提供支持。换句话说,苹果眼下更像是在一边借助外部大模型补齐能力,一边把真正需要长期留在自家体系里的部分慢慢收回到设备端。
更关键的问题,是苹果准备把哪些能力留下来、哪些能力继续放在云上。这个分层一旦做清楚,Apple Intelligence 后面几代的形态也会越来越明确:云端模型负责兜底,端侧模型负责高频体验,苹果自己则把核心控制权逐步拿回手里。
来源:
- 据路透:华虹旗下华力微电子拟量产 7 纳米,华虹或成中国第二家 7nm 代工厂3/16/2026
- 鸿海 Q4 利润不及预期,给 AI 硬件热泼了一盆冷水3/16/2026
- 八家科技巨头签署反诈骗协议,平台反诈开始从单案协作走向跨平台联防3/16/2026
- OpenAI 发布 GPT-5.4 mini 与 nano:小模型加速冲刺3/17/2026
- 《华盛顿邮报》把 AI 用到订阅定价上,媒体的个性化收费又往前走了一步3/17/2026
- 据报道,微软搁置 Windows 11 多项 Copilot 系统级整合计划3/16/2026
- ChatGPT App 的模型切换入口,突然变得很难找3/17/2026
- Google 把 Stitch 升级成 AI 原生设计画布3/19/2026
- 椰树集团相关公司招标 50 台人形机器人剥椰子,产线开始提具体指标了3/19/2026
- Firefox 149 内置免费 VPN:50GB 月流量,首批限四国3/19/2026
- Google AI Studio 升级全栈 vibe coding:Antigravity 代理来了3/20/2026
- 小型出版商两年丢掉六成搜索流量,内容分发正在改道3/19/2026
- AirPods Max 2 发布:起售价 RMB 3999,3 月 25 日起预购3/16/2026
- 营收涨三倍,宇树科技冲刺科创板3/20/2026
- 多地试点一人公司:免费公寓+办公空间,能否激活个体创新?3/19/2026
- iOS 26.4 RC 发布:Apple Music 有 AI 歌单,Podcasts 支持视频3/18/2026
- Google 宣布逐步向全港用户扩展 Gemini,移动端稍后跟进3/16/2026
- Anthropic 超 8 万用户调研:81% 认为 AI 正兑现预期3/19/2026
- 欧盟推去衣AI禁令:3月26日表决,执法难在哪3/19/2026
- 装个App等24小时:Google给Android侧载上了把锁3/20/2026
- 谷歌 Gemini Mac 版内测:桌面端补课正式开始3/20/2026
- MiniMax 发布 M2.7:国内首个公开的模型自我进化方案3/18/2026
- iOS 27 可能不含重大设计变更,Liquid Glass 优化是长期过程3/15/2026
- 14 英寸 MacBook Pro 配 M5 Max 的问题,不是跑不起来,而是很难长时间撑住3/15/2026
- Claude Code 上线 Channels:用 Telegram 和 Discord 操控本地编程任务3/20/2026
- OpenAI 收购 Astral:Python 工具链收编加速3/19/2026
- 小米推理模型 MiMo-V2-Pro 上线:智能指数 49,榜单排第 103/18/2026
- Google公布Android侧载新规:安装未验证应用须等24小时3/20/2026
- Kimi 员工指称 MiniMax 沿用其 Office Skill 代码始末3/19/2026
- 小米三款大模型齐发:MiMo-V2-Pro、Omni、TTS 完整解读3/19/2026