Google 发布 Gemma 4 开放模型：4 种规格覆盖手机到工作站

Google 发布了 Gemma 4 开放模型家族，提供 E2B、E4B、26B MoE 和 31B Dense 四种规格，以 Apache 2.0 许可证开放，全系列覆盖从 Android 手机到开发工作站的硬件范围。

四种规格，各有侧重

Gemma 4 的四个模型定位明确：

E2B 和 E4B 面向端侧设备，可在 Android 手机、笔记本甚至 Raspberry Pi 上完全离线运行。两者支持图像和视频处理，并支持原生音频输入（语音识别），上下文窗口 128K。
26B MoE 总参数 260 亿，推理时仅激活 38 亿参数，主打低延迟，适合需要快速响应的 Agent 工作流。
31B Dense 追求原始质量，目前在 Arena AI 文本榜单上排名第 3 的开放模型（26B MoE 排第 6），上下文窗口 256K，击败了规模大 20 倍的模型。

全系列共享以下能力：

Gemma 4 基于与 Gemini 3 相同的技术底座构建。Google 将其定位为"可以在你自己的硬件上运行的最强模型"，与闭源的 Gemini 系列互补——Gemini 为旗舰闭源方案，Gemma 为开放可定制版本。

Gemma 系列自首代发布以来累计下载超过 4 亿次，衍生版本超过 10 万个。这次发布延续了 Google 在开放模型上的投入节奏，进一步缩小开放模型与闭源前沿之间的能力差距。

Gemma 4