SANA-WM – 专为1分钟720p视频设计的26亿开源世界模型

NVIDIA发布新型开源世界模型,专注于视频理解任务。

– 参数量为26亿的世界模型,属于中等规模的开源模型
– 专门针对1分钟长度的720p高清视频进行优化
– 采用世界模型架构,能够理解和预测复杂场景变化
– 开源发布,便于学术界和工业界的研究和应用

该模型的发布为视频理解领域的研究提供了新的工具和基准。

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注