Talk预告 | UCSD在读博士孔之丰: DiffWave基础, 生成模型介绍

2021-05-18 10:26 作者:TechBeat人工智能社区 0人读过 | 我要投稿

本周为TechBeat人工智能社区第306期线上Talk。
北京时间5月19日(周三)晚8点，加州大学圣地亚哥分校在读博士—孔之丰的Talk将准时在TechBeat人工智能社区开播！
他与大家分享的主题是: “DiffWave基础——生成模型介绍”，DiffWave是一类能实现多种语音任务的音频生成模型，其结合了多种前沿生成模型，包括降噪扩散概率模型(DDPM)以及WaveNet。

为了帮助大家更好地理解工作，本期Talk将介绍相关生成模型的基础，对生成模型进行简短的综述，并详细介绍DDPM和WaveNet两类模型，5月27日的Talk将详细讲解ICLR 2021 (Oral) 的相关paper。

Talk·信息

▼

主题：DiffWave基础——生成模型介绍

嘉宾：加州大学圣地亚哥分校

在读博士生孔之丰

时间：北京时间 5月19日 (周三) 20:00

地点：TechBeat人工智能社区

http://www.techbeat.net/

完整版怎么看？

扫描下方二维码，或复制链接 https://datayi.cn/w/kojk3wQ9 至浏览器，一键完成预约！上线后会在第一时间收到通知哦~

Talk·提纲

▼

无监督生成模型在图像，语音，文本，3D以及细分专业领域的应用十分广泛。现有的多种方法在复杂庞大的数据集，如高分辨率图像或高质量语音的生成效果还有进一步提高的空间。除此之外，针对不同的数据类型需要设计特定的模型以及网络结构。

讲者将会通过两场Talk进行详细讲解，第一场（5月19日）以背景介绍为重点，第二场（5月27日）将以ICLR 2021的相关paper讲解为重点。

本次分享的主要内容如下：

1. 主流的生成模型简介

2. 降噪扩散概率模型（详细介绍，包括算法、实验、理论，以及与其它模型的关联）

3. 语音领域的生成模型——WaveNet简介

Talk·参考资料

▼

这是本次分享中将会提及的资料，建议提前预习哦！

[1] DDPM 1: https://arxiv.org/pdf/1503.03585.pdf

[2] DDPM2: https://arxiv.org/pdf/2006.11239.pdf[

3] WaveNet: https://arxiv.org/pdf/1609.03499.pdf

[4] DiffWave: https://arxiv.org/pdf/2009.09761.pdf

[5] Others (background)：

How to Train Your Energy-Based Models

https://arxiv.org/pdf/1906.02691.pdf；

Generating Diverse High-Fidelity Images with VQ-VAE-2

https://arxiv.org/pdf/1906.00446.pdf；

PIXELCNN++: Improving The PlxelcnnI With Discretized Logistic Mixture Likelihood And Other Modifications

https://openreview.net/pdf?id=BJrFC6ceg；

U-Net: Convolutional Networks for Biomedical Image Segmentation

https://arxiv.org/pdf/1505.04597.pdf；

On Maximum Likelihood Training of Score-Based Generative Models

https://arxiv.org/pdf/2101.09258.pdf；

Flow-based Deep Generative Models

https://lilianweng.github.io/lil-log/2018/10/13/flow-based-deep-generative-models.html；

From Autoencoder to Beta-VAE

https://lilianweng.github.io/lil-log/2018/08/12/from-autoencoder-to-beta-vae.html；

WaveNet: A generative model for raw audio

https://deepmind.com/blog/article/wavenet-generative-model-raw-audio

Talk·提问交流

▼

通过以下两种方式提问都将获得微信现金红包奖励哦！

方式 ①

在Talk界面下的【交流区】参与互动！留下你的打call🤟和问题🙋，和更多小伙伴们共同讨论，被讲者直接翻牌解答！

你的每一次贡献，我们都会给予你相应的i豆积分，还会有惊喜奖励哦！

方式 ②

在本文留言区直接提出你的问题，或扫描下方二维码提问！

Talk·嘉宾介绍

▼

孔之丰，本科毕业于西安交通大学数学系，现在是加州大学圣地亚哥分校计算机科学的三年级博士生，导师是Kamalika Chaudhuri, 主要的研究方向为生成模型的理论，理解与应用。在ICLR, AISTATS, AAAI等会议发表论文，获得百度美国研究院和英伟达深度学习研究院的研究实习。

关于TechBeat人工智能社区

▼

TechBeat(www.techbeat.net)是一个荟聚全球华人AI精英的成长社区。我们希望为AI人才打造更专业的服务和体验，加速并陪伴其学习成长。期待这里可以成为你学习AI前沿知识的高地，分享自己最新工作的沃土，在AI进阶之路上的升级打怪的根据地！

更多详细介绍>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ

标签：