阿里 HappyHorse 1.1 视频生成模型发布:五维系统升级

阿里今天发布视频生成模型 HappyHorse 1.1。

HappyHorse 1.1 AI 视频生成模型

新版本围绕五个维度做了系统升级:动态表现力、主体一致性、指令遵循、视觉质感、音频同步。基础规格保持不变,单次生成 3-15 秒,720P 和 1080P 双分辨率,兼容自定义宽高比。

HappyHorse 1.1 重点强化了多图参考生视频(R2V)能力。商品、角色、场景的视觉还原更精准,复杂 Prompt 下的镜头编排也更稳定,多场景多角色的连贯演绎能力提升明显。

技术架构上,HappyHorse 是 150 亿参数的单流 Transformer,把文本、图像、视频、音频统一编码,原生音视频同步生成。

接入渠道三个:HappyHorse 官网、阿里云百炼、千问云,全部同步上线,API 开放调用。

这款模型今年 4 月 27 日发布 1.0 版本时是以匿名身份登上 Artificial Analysis Video Arena 榜首的,4 月 9 日才被 CNCB 确认是阿里的项目。1.0 上线不到两个月,已经广泛应用在短剧制作、电商广告、品牌营销、游戏 CG 等场景。1.1 算是迭代版本,参数规模没动,主要在训练和后处理上做文章。

同一天,阿里联合虎鲸文娱集团启动"Horsepower"AI 影像大赛,优胜者拿百万商单合作机会,评委包括导演张纪中。明显是想用赛事带动创作者生态和品牌曝光。

来源:新浪科技 · 阿里云百炼官方文档 · Alizila

相关推荐