欢迎光临散文网 会员登陆 & 注册

动动嘴,AI帮你做视频后期|Rerender—开源版Gen2来了!

2023-06-17 23:48 作者:每月常照阿伯  | 我要投稿

论文:https://arxiv.org/abs/2306.07954

项目地址:https://anonymous-31415926.github.io/

推友**balconychy**对论文的解读(类似ebsynth的原理):

  • 直观的理解就是插值。 每一帧单独的跑SD不是闪烁吗?那我就不跑每帧,隔K帧选择关键帧跑。 关键帧之间的图像,就用风格化后的图像,利用光流的方式向后贴图;这样贴到底K帧可能不一致了,于是,从第K帧反向再来一把,然后把两个融合,过渡就自然了


  • Rerender 能实现视频全局形状、纹理和颜色的连贯性,有效减少了外观偏离和画面闪烁
  • 这个框架由两部分组成:关键帧翻译和完整视频翻译。
  • 在第一部分,Rerender使用了改进的扩散模型来生成关键帧,同时应用层次交叉帧约束以确保在形状、纹理和颜色上的连贯性。
  • 在第二部分,我们通过时间感知补丁匹配和帧混合,将这些关键帧传播到其他帧中。这个过程实现了全局风格和局部纹理的时序一致性,并且无需重新训练或优化

动动嘴,AI帮你做视频后期|Rerender—开源版Gen2来了!的评论 (共 条)

分享到微博请遵守国家法律