2023.03.10 ArXiv精选

2023-03-10 12:19 作者:PaperABC 0人读过 | 我要投稿

论文较多，时间有限，本专栏无法做文章的讲解，只挑选出符合PaperABC研究兴趣和当前热点问题相关的论文，如果你的research topic和上述内容有关，那本专栏可作为你的论文更新源或Paper reading list．

Paper list:

今日ArXiv共更新108篇.

Scaling up GANs for Text-to-Image Synthesis

https://arxiv.org/pdf/2303.05511.pdf

CMU的工作．现阶段的文本到图像的生成工作，大多数都是被扩散模型，自回归模型所垄断．本文提出了一个想法，能否将GAN scale up到大型数据集例如LAION上．于是，本文提出了GigaGAN，能够以较快的速度实现高像素的图像生成．

3DGen: Triplane Latent Diffusion for Textured Mesh Generation

https://arxiv.org/pdf/2303.05371.pdf

来自于Meta的一篇工作，提出了一个triplane VAE来学习带有纹理的mesh的latent representation, 然后利用一个条件扩散模型完成生成．很推荐这篇文章，尤其是做3D跨模态生成的方向．

Controllable Video Generation by Learning the Underlying Dynamical System with Neural ODE

https://arxiv.org/pdf/2303.05323.pdf

Unifying Layout Generation with a Decoupled Diffusion Model

https://arxiv.org/pdf/2303.05049.pdf

微软亚洲研究院的工作，提出一个解耦的扩散模型用于layout generation.

CoralStyleCLIP: Co-optimized Region and Layer Selection for Image Editing

https://arxiv.org/pdf/2303.05031.pdf

Adobe公司的工作，提出CoralStyleCLIP,通过在styleGAN2的特征空间中，使用多层注意力引导的混合策略，从而实现图像的高保真编辑．

Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection

https://arxiv.org/pdf/2303.05499.pdf

大湾区研究院的一篇工作，将DINO推广到了Open-Set Object Detection,从而提出了grounding DINO,质量很高．最近会分享．

标签：