Google 发布 Gemini 3.1 Flash Live：实时语音对话模型换代

Google 今天发布了 Gemini 3.1 Flash Live，这是 Gemini 系列中迄今音质最高的实时音频和语音模型，主打更低延迟和更自然的对话节奏，面向开发者、企业和普通用户三个方向落地。

模型能力提升

Gemini 3.1 Flash Live 在多个基准测试中取得领先成绩：

在声学层面，模型对音高、语速等细节的识别精度超过上一代 2.5 Flash Native Audio，同时能更好地识别用户的情绪表达（如困惑或不满），并动态调整回应方式。嘈杂环境下的语音处理能力也明显加强。

3.1 Flash Live 已接入以下产品：

Verizon、The Home Depot、LiveKit 等企业已在测试中使用该模型，反馈集中在对话自然度的提升。

3.1 Flash Live 生成的所有音频均嵌入 SynthID 水印，用于可靠检测 AI 生成内容，防止误导性传播。