WanX 2.1 是什么?
Wanx 2.1 是阿里巴巴云推出的多模态大模型,专注于从文本生成高质量图像和视频。它通过自研 VAE 和 DiT 架构,实现复杂运动和物理规律的精准还原,支持中英文文字特效,生成效率大幅提升。在 VBench 评测中位居榜首,广泛应用于内容创作、广告制作、教育等领域,目前已免费开放。
WanX 2.1 的功能特点
高质量视频生成:WanX 2.1能够生成逼真的视觉效果,严格遵循物理规则,提升画面的像素质量和真实感。复杂运动处理:WanX 2.1擅长处理大规模肢体运动和复杂旋转,如花样滑冰、游泳等场景,保持身体协调性和真实运动轨迹。多语言文字特效:WanX 2.1支持中英文文字特效,满足广告设计和短视频制作等行业的需求。高效编解码技术:WanX 2.1采用自研的 VAE(变分自编码器)和 DiT(去噪扩散 Transformer)架构,支持无限长 1080P 视频的高效编解码。物理规律还原:WanX 2.1精准模拟现实世界中的物理规律,如碰撞、反弹等,进一步提升画面逼真度。超长上下文训练:WanX 2.1支持超长上下文,确保文本指令与视频生成的精准对应,提升生成效率。
WanX 2.1 的应用场景
内容创作:Wanx 2.1 可以快速生成高质量的短视频内容,支持多种艺术风格模板,如油画、赛博朋克等,帮助创作者提升创作效率和内容多样性,满足不同平台和受众的需求。广告与营销:该模型能够根据品牌需求生成个性化的广告视频,支持动态字幕和特效生成,提升广告的吸引力和传播效果,为广告设计和短视频制作提供强大的创意支持。教育培训:Wanx 2.1 可以生成沉浸式教学视频,通过生动的视觉效果和动态演示,帮助学生更好地理解和掌握复杂概念,提升教学效果和学习体验。影视制作:Wanx 2.1 支持电影级运镜效果和复杂肢体动作的生成,能够精准模拟碰撞、反弹等物理现象,为影视特效和动画制作提供逼真的场景和动态效果,提升制作效率和视觉质量。游戏与娱乐:该模型可用于生成沉浸式的虚拟场景和动画效果,支持实时场景渲染,为游戏开发和虚拟现实应用提供高效的视觉内容生成能力,增强用户体验。
WanX 2.1 的性能评测
Wanx 2.1通过准确处理复杂动作、提高像素质量、遵守物理规则以及优化指令执行精度,在生成逼真的视觉效果方面表现出色。对指令的精确执行使 Wanx 2.1 在视频生成模型综合基准测试套件 VBench 排行榜上名列前茅。根据 VBench 的数据,Wanx 2.1 在动态程度、空间关系和多对象交互等关键维度上遥遥领先,总得分高达 84.7%。
如何体验WanX 2.1?
Wanx 2.1 目前已在通义万相官方免费开放,个人开发者和企业用户可以通过阿里百炼平台使用其功能。
通义万相官网:https://tongyi.aliyun.com/wanxiang/videoCreation阿里百炼平台:https://www.alibabacloud.com/zh/product/modelstudio