NVIDIA实验室发布了SANA-WM开源世界模型,这是一个拥有26亿参数的突破性视频生成模型。该模型能够生成长达1分钟的720p高清视频内容,代表了多模态AI技术的重大进步。
SANA-WM采用了创新的时间建模架构,在保持高质量视觉输出的同时,大幅降低了计算资源需求。相比传统的视频生成方法,该技术显著提升了生成效率,使得高质量视频创作工具的开源化成为可能。
研究人员表示,该模型的发布将加速AI视频生成技术在各行各业的应用,从内容创作到教育培训,都将受益于这一技术进步。开源策略也鼓励社区贡献和持续改进。
发表回复