Talk预告 | UCSD在读博士孔之丰: DiffWave基础, 生成模型介绍
本周为TechBeat人工智能社区第306期线上Talk。
北京时间5月19日(周三)晚8点,加州大学圣地亚哥分校在读博士—孔之丰的Talk将准时在TechBeat人工智能社区开播!
他与大家分享的主题是: “DiffWave基础——生成模型介绍”,DiffWave是一类能实现多种语音任务的音频生成模型,其结合了多种前沿生成模型,包括降噪扩散概率模型(DDPM)以及WaveNet。
为了帮助大家更好地理解工作,本期Talk将介绍相关生成模型的基础,对生成模型进行简短的综述,并详细介绍DDPM和WaveNet两类模型,5月27日的Talk将详细讲解ICLR 2021 (Oral) 的相关paper。

Talk·信息
▼
主题:DiffWave基础——生成模型介绍
嘉宾:加州大学圣地亚哥分校
在读博士生 孔之丰
时间:北京时间 5月19日 (周三) 20:00
地点:TechBeat人工智能社区
http://www.techbeat.net/
完整版怎么看?
扫描下方二维码,或复制链接 https://datayi.cn/w/kojk3wQ9 至浏览器,一键完成预约!上线后会在第一时间收到通知哦~

Talk·提纲
▼
无监督生成模型在图像,语音,文本,3D以及细分专业领域的应用十分广泛。现有的多种方法在复杂庞大的数据集,如高分辨率图像或高质量语音的生成效果还有进一步提高的空间。除此之外,针对不同的数据类型需要设计特定的模型以及网络结构。
讲者将会通过两场Talk进行详细讲解,第一场(5月19日)以背景介绍为重点,第二场(5月27日)将以ICLR 2021的相关paper讲解为重点。
本次分享的主要内容如下:
1. 主流的生成模型简介
2. 降噪扩散概率模型(详细介绍,包括算法、实验、理论,以及与其它模型的关联)
3. 语音领域的生成模型——WaveNet简介
Talk·参考资料
▼
这是本次分享中将会提及的资料,建议提前预习哦!
[1] DDPM 1: https://arxiv.org/pdf/1503.03585.pdf
[2] DDPM2: https://arxiv.org/pdf/2006.11239.pdf[
3] WaveNet: https://arxiv.org/pdf/1609.03499.pdf
[4] DiffWave: https://arxiv.org/pdf/2009.09761.pdf
[5] Others (background):
How to Train Your Energy-Based Models
https://arxiv.org/pdf/1906.02691.pdf;
Generating Diverse High-Fidelity Images with VQ-VAE-2
https://arxiv.org/pdf/1906.00446.pdf;
PIXELCNN++: Improving The PlxelcnnI With Discretized Logistic Mixture Likelihood And Other Modifications
https://openreview.net/pdf?id=BJrFC6ceg;
U-Net: Convolutional Networks for Biomedical Image Segmentation
https://arxiv.org/pdf/1505.04597.pdf;
On Maximum Likelihood Training of Score-Based Generative Models
https://arxiv.org/pdf/2101.09258.pdf;
Flow-based Deep Generative Models
https://lilianweng.github.io/lil-log/2018/10/13/flow-based-deep-generative-models.html;
From Autoencoder to Beta-VAE
https://lilianweng.github.io/lil-log/2018/08/12/from-autoencoder-to-beta-vae.html;
WaveNet: A generative model for raw audio
https://deepmind.com/blog/article/wavenet-generative-model-raw-audio
Talk·提问交流
▼
通过以下两种方式提问都将获得微信现金红包奖励哦!
方式 ①
在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
方式 ②
在本文留言区直接提出你的问题,或扫描下方二维码提问!

Talk·嘉宾介绍
▼

UCSD在读博士
孔之丰,本科毕业于西安交通大学数学系,现在是加州大学圣地亚哥分校计算机科学的三年级博士生,导师是Kamalika Chaudhuri, 主要的研究方向为生成模型的理论,理解与应用。在ICLR, AISTATS, AAAI等会议发表论文,获得百度美国研究院和英伟达深度学习研究院的研究实习。
关于TechBeat人工智能社区
▼
TechBeat(www.techbeat.net)是一个荟聚全球华人AI精英的成长社区。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ