阿里确认 HappyHorse 视频模型:1333 Elo 登顶,API 即将开放

4 月 8 日,阿里巴巴 ATH(Alibaba Token Hub)创新业务部向科创板日报确认:HappyHorse 是由 ATH 创新业务部开发的 AI 视频生成模型,目前处于内部测试阶段,API 即将开放使用。

阿里确认 HappyHorse 视频模型:1333 Elo 登顶,API 即将开放

这一确认意味着,此前在 Artificial Analysis 视频模型排行榜上以 1333 Elo 稳居第一名的神秘 "HappyHorse",正式归入阿里巴巴版图。

核心成绩:全面碾压 ByteDance Seedance 2.0

在 Artificial Analysis 的视频竞技场(Video Arena)中,HappyHorse 1.0 的表现堪称统治级:

  • 综合 Elo 1333,超越字节跳动 Seedance 2.0 排名第一
  • 文生视频(无音频) 得分 1383,领先第二名 110 分
  • 图生视频(无音频) 得分 1413,刷新该赛道历史纪录

三项指标均大幅领先,是目前公开评测中综合表现最强的视频生成模型。

技术细节:15B 参数的统一架构

根据已公开的技术信息,HappyHorse 1.0 的关键规格如下:

项目参数
参数量15B
架构40 层统一自注意力 Transformer
生成时长5 秒
分辨率1080p
推理硬件单张 H100
推理耗时约 38 秒

值得注意的是,该模型采用统一自注意力 Transformer 架构,而非视频生成领域常见的扩散模型路线。这种架构在长程时序建模上具有天然优势,或为其在竞技场中的高分表现提供了基础。

原生唇形同步:7 种语言,行业最低词错率

HappyHorse 的另一大亮点是原生唇形同步能力,支持以下 7 种语言:

  • 英语、普通话、粤语、日语、韩语、德语、法语

在同类模型中,HappyHorse 的词错率(Word Error Rate)最低。这意味着生成的视频中,人物口型与语音的高度一致性达到了行业领先水平,对 AI 短剧、AI 直播、虚拟数字人等场景具有极高的实用价值。

团队背景:从淘天未来生活实验室到 ATH

HappyHorse 的研发团队原属淘天集团的未来生活实验室,由张迪带队。团队现已划归 ATH 创新业务部。

ATH(Alibaba Token Hub)由 CEO 吴泳铭于 3 月 16 日宣布成立,整合了阿里内部 5 个 AI 相关业务部门,定位为统一的 AI Token 化平台与创新引擎。HappyHorse 是 ATH 创新业务部对外确认的首批重要产品之一。

阿里 AI 战略持续推进

除 HappyHorse 的确认外,阿里巴巴近期的 AI 布局动作频频:

  1. 4 月 8 日:阿里设立集团技术委员会,通义实验室升级为通义大模型事业部
  2. 商业化提速:据科创板日报报道,阿里云销售团队已在主动对接 AI 短剧客户,为视频生成模型的商业化铺路
  3. ATH 创新业务部透露,已启动「AI 时代新交互探索计划」,未来将推出更多产品

写在最后

HappyHorse 的确认标志着阿里巴巴在 AI 视频生成领域正式亮牌。从竞技场成绩来看,它在生成质量上已处于行业第一梯队;从商业化节奏来看,API 即将开放、销售团队提前铺排,阿里显然不甘于只做技术验证。

接下来值得关注的两个节点:API 的具体开放时间和定价策略,以及 15B 统一 Transformer 架构能否在高分辨率、长时序生成上继续突破。

来源:科创板日报 | 科创板日报

相关推荐