阿里 HappyHorse 1.1 视频生成模型发布：五维系统升级

阿里今天发布视频生成模型 HappyHorse 1.1。

HappyHorse 1.1 AI 视频生成模型

新版本围绕五个维度做了系统升级：动态表现力、主体一致性、指令遵循、视觉质感、音频同步。基础规格保持不变，单次生成 3-15 秒，720P 和 1080P 双分辨率，兼容自定义宽高比。

HappyHorse 1.1 重点强化了多图参考生视频（R2V）能力。商品、角色、场景的视觉还原更精准，复杂 Prompt 下的镜头编排也更稳定，多场景多角色的连贯演绎能力提升明显。

技术架构上，HappyHorse 是 150 亿参数的单流 Transformer，把文本、图像、视频、音频统一编码，原生音视频同步生成。

接入渠道三个：HappyHorse 官网、阿里云百炼、千问云，全部同步上线，API 开放调用。

这款模型今年 4 月 27 日发布 1.0 版本时是以匿名身份登上 Artificial Analysis Video Arena 榜首的，4 月 9 日才被 CNCB 确认是阿里的项目。1.0 上线不到两个月，已经广泛应用在短剧制作、电商广告、品牌营销、游戏 CG 等场景。1.1 算是迭代版本，参数规模没动，主要在训练和后处理上做文章。

同一天，阿里联合虎鲸文娱集团启动"Horsepower"AI 影像大赛，优胜者拿百万商单合作机会，评委包括导演张纪中。明显是想用赛事带动创作者生态和品牌曝光。

来源：新浪科技 · 阿里云百炼官方文档 · Alizila