通义万相推出开源首尾帧生视频模型,实现高清视频定制化生成

阿里通义万相近日开源了其14B参数规模的首尾帧生视频模型,成为业界首个百亿参数级别的开源首尾帧视频模型。该模型能够根据用户提供的开始和结束图片,生成一段720p高清视频,实现自然流畅的画面过渡。相比文生视频或单图生视频,首尾帧生视频在可控性和定制化方面表现更优。

技术上,模型通过引入条件控制机制和专门的训练数据,确保生成内容与输入图像一致,同时支持提示词指令和动作协调性要求。推理阶段采用模型切分与序列并行策略,在有限内存下优化了高清视频生成效率。

用户可通过通义万相官网免费体验,或从多个平台下载模型进行二次开发。这一升级支持复杂特效变化和运镜控制,为视频创作带来更多可能性。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1