2023.03.10 ArXiv精选
关注领域:
AIGC
3D computer vision learning
Fine-grained learning
GNN
其他
声明
论文较多,时间有限,本专栏无法做文章的讲解,只挑选出符合PaperABC研究兴趣和当前热点问题相关的论文,如果你的research topic和上述内容有关,那本专栏可作为你的论文更新源或Paper reading list.

Paper list:
今日ArXiv共更新108篇.
AIGC
Scaling up GANs for Text-to-Image Synthesis
https://arxiv.org/pdf/2303.05511.pdf

CMU的工作.现阶段的文本到图像的生成工作,大多数都是被扩散模型,自回归模型所垄断.本文提出了一个想法,能否将GAN scale up到大型数据集例如LAION上.于是,本文提出了GigaGAN,能够以较快的速度实现高像素的图像生成.
3DGen: Triplane Latent Diffusion for Textured Mesh Generation
https://arxiv.org/pdf/2303.05371.pdf

来自于Meta的一篇工作,提出了一个triplane VAE来学习带有纹理的mesh的latent representation, 然后利用一个条件扩散模型完成生成.很推荐这篇文章,尤其是做3D跨模态生成的方向.
Controllable Video Generation by Learning the Underlying Dynamical System with Neural ODE
https://arxiv.org/pdf/2303.05323.pdf

Unifying Layout Generation with a Decoupled Diffusion Model
https://arxiv.org/pdf/2303.05049.pdf

微软亚洲研究院的工作,提出一个解耦的扩散模型用于layout generation.
CoralStyleCLIP: Co-optimized Region and Layer Selection for Image Editing
https://arxiv.org/pdf/2303.05031.pdf

Adobe公司的工作,提出CoralStyleCLIP,通过在styleGAN2的特征空间中,使用多层注意力引导的混合策略,从而实现图像的高保真编辑.
视觉语言学习
Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection
https://arxiv.org/pdf/2303.05499.pdf
大湾区研究院的一篇工作,将DINO推广到了Open-Set Object Detection,从而提出了grounding DINO,质量很高.最近会分享.