AI最新进展:一键生成电影?NVIDIA研究团队发布可处理视频的文本提示模型

NVIDIA研究团队刚刚发布了一篇关于如何通过文本提示创建高质量短视频的新研究论文。
它可以创建1280x2048分辨率的113帧视频,以24 FPS渲染,生成4.7秒的短片。该团队首先对模型进行图像训练,然后添加了时间维度,使其可以处理视频。
这项新的研究是令人印象深刻的。在当前的开发速度下,我们可能很快就能够在未来几年内仅凭少量的文本提示生成完整长度的电影。

Video LDMs生成的相关视频示例:https://research.nvidia.com/labs/toronto-ai/VideoLDM/samples.html