标签: 语音模型 清除筛选
字节跳动发布 Seeduplex:全双工语音模型在豆包全面上线
4 月 9 日,字节跳动正式推出 Seeduplex——一款原生全双工端到端语音大模型,目前已全量上线豆包 App。
传统语音交互系统大多采用半双工范式:严格遵循"你讲我听、我讲你听"的轮流机制。这种模式在面对真实世界中复杂的声学环境和碎片化的交流习惯时,局限性明显。
Seeduplex 的核心突破在于实现了"边听边说"。模型在持续接收用户语音的同时,可以同步输出回应,不再需要等待用户说完才开始处理。这一能力基于海量语音数据预训练与强化学习(RL),通过语音语义联合建模,将对话节奏控制、强抗干扰、精准轮次切换与指向性理解等能力融入模型训练体系。
