欢迎光临散文网 会员登陆 & 注册

2023.03.10 ArXiv精选

2023-03-10 12:19 作者:PaperABC  | 我要投稿
  • 关注领域

    • AIGC

    • 3D computer vision learning

    • Fine-grained learning

    • GNN

    • 其他

  • 声明

    • 论文较多,时间有限,本专栏无法做文章的讲解,只挑选出符合PaperABC研究兴趣和当前热点问题相关的论文,如果你的research topic和上述内容有关,那本专栏可作为你的论文更新源或Paper reading list.

Paper list:

今日ArXiv共更新108篇.

AIGC

Scaling up GANs for Text-to-Image Synthesis

https://arxiv.org/pdf/2303.05511.pdf

CMU的工作.现阶段的文本到图像的生成工作,大多数都是被扩散模型,自回归模型所垄断.本文提出了一个想法,能否将GAN scale up到大型数据集例如LAION上.于是,本文提出了GigaGAN,能够以较快的速度实现高像素的图像生成.


3DGen: Triplane Latent Diffusion for Textured Mesh Generation

https://arxiv.org/pdf/2303.05371.pdf

来自于Meta的一篇工作,提出了一个triplane VAE来学习带有纹理的mesh的latent representation, 然后利用一个条件扩散模型完成生成.很推荐这篇文章,尤其是做3D跨模态生成的方向.


Controllable Video Generation by Learning the Underlying Dynamical System with Neural ODE

https://arxiv.org/pdf/2303.05323.pdf


Unifying Layout Generation with a Decoupled Diffusion Model

https://arxiv.org/pdf/2303.05049.pdf

微软亚洲研究院的工作,提出一个解耦的扩散模型用于layout generation.


CoralStyleCLIP: Co-optimized Region and Layer Selection for Image Editing

https://arxiv.org/pdf/2303.05031.pdf

Adobe公司的工作,提出CoralStyleCLIP,通过在styleGAN2的特征空间中,使用多层注意力引导的混合策略,从而实现图像的高保真编辑.


视觉语言学习

Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection

https://arxiv.org/pdf/2303.05499.pdf


大湾区研究院的一篇工作,将DINO推广到了Open-Set Object Detection,从而提出了grounding DINO,质量很高.最近会分享.





2023.03.10 ArXiv精选的评论 (共 条)

分享到微博请遵守国家法律