Google 发布 Gemma 4 开放模型:4 种规格覆盖手机到工作站

Google 发布了 Gemma 4 开放模型家族,提供 E2B、E4B、26B MoE 和 31B Dense 四种规格,以 Apache 2.0 许可证开放,全系列覆盖从 Android 手机到开发工作站的硬件范围。

四种规格,各有侧重

Gemma 4 的四个模型定位明确:

  • E2B 和 E4B 面向端侧设备,可在 Android 手机、笔记本甚至 Raspberry Pi 上完全离线运行。两者支持图像和视频处理,并支持原生音频输入(语音识别),上下文窗口 128K。
  • 26B MoE 总参数 260 亿,推理时仅激活 38 亿参数,主打低延迟,适合需要快速响应的 Agent 工作流。
  • 31B Dense 追求原始质量,目前在 Arena AI 文本榜单上排名第 3 的开放模型(26B MoE 排第 6),上下文窗口 256K,击败了规模大 20 倍的模型。

核心能力

全系列共享以下能力:

  • 函数调用、结构化 JSON 输出、原生系统指令,面向 Agent 工作流设计
  • 高质量代码生成,支持本地离线使用
  • 原生图像和视频理解(可变分辨率),支持 OCR 和图表理解
  • 原生支持 140+ 语言
  • 量化版本可在消费级 GPU 上本地运行

与 Gemini 的关系

Gemma 4 基于与 Gemini 3 相同的技术底座构建。Google 将其定位为"可以在你自己的硬件上运行的最强模型",与闭源的 Gemini 系列互补——Gemini 为旗舰闭源方案,Gemma 为开放可定制版本。

Gemma 系列自首代发布以来累计下载超过 4 亿次,衍生版本超过 10 万个。这次发布延续了 Google 在开放模型上的投入节奏,进一步缩小开放模型与闭源前沿之间的能力差距。

Gemma 4

来源: Google Blog

相关推荐