欢迎光临散文网 会员登陆 & 注册

Talk预告 | UCSD在读博士孔之丰: DiffWave基础, 生成模型介绍

2021-05-18 10:26 作者:TechBeat人工智能社区  | 我要投稿

本周为TechBeat人工智能社区306线上Talk。

北京时间5月19(周三)晚8点加州大学圣地亚哥分校在读博士孔之丰的Talk将准时在TechBeat人工智能社区开播!

他与大家分享的主题是: “DiffWave基础——生成模型介绍”,DiffWave是一类能实现多种语音任务的音频生成模型,其结合了多种前沿生成模型,包括降噪扩散概率模型(DDPM)以及WaveNet。

为了帮助大家更好地理解工作,本期Talk将介绍相关生成模型的基础,对生成模型进行简短的综述,并详细介绍DDPM和WaveNet两类模型,5月27日的Talk将详细讲解ICLR 2021 (Oral) 的相关paper。

Talk·信息

主题:DiffWave基础——生成模型介绍

嘉宾:加州大学圣地亚哥分校

在读博士生 孔之丰

时间:北京时间 5月19日 (周三) 20:00

地点:TechBeat人工智能社区

http://www.techbeat.net/


完整版怎么看?

扫描下方二维码,或复制链接 https://datayi.cn/w/kojk3wQ9 至浏览器,一键完成预约!上线后会在第一时间收到通知哦~

Talk·提纲

无监督生成模型在图像,语音,文本,3D以及细分专业领域的应用十分广泛。现有的多种方法在复杂庞大的数据集,如高分辨率图像或高质量语音的生成效果还有进一步提高的空间。除此之外,针对不同的数据类型需要设计特定的模型以及网络结构。

讲者将会通过两场Talk进行详细讲解,第一场(5月19日)以背景介绍为重点,第二场(5月27日)将以ICLR 2021的相关paper讲解为重点。

本次分享的主要内容如下:

1. 主流的生成模型简介

2. 降噪扩散概率模型(详细介绍,包括算法、实验、理论,以及与其它模型的关联)

3. 语音领域的生成模型——WaveNet简介


Talk·参考资料

这是本次分享中将会提及的资料,建议提前预习哦!

[1] DDPM 1: https://arxiv.org/pdf/1503.03585.pdf

[2] DDPM2: https://arxiv.org/pdf/2006.11239.pdf[

3] WaveNet: https://arxiv.org/pdf/1609.03499.pdf

[4] DiffWave:   https://arxiv.org/pdf/2009.09761.pdf 

[5] Others (background):

How to Train Your Energy-Based Models

        https://arxiv.org/pdf/1906.02691.pdf;

Generating Diverse High-Fidelity Images with VQ-VAE-2

       https://arxiv.org/pdf/1906.00446.pdf;

PIXELCNN++: Improving The PlxelcnnI With Discretized Logistic Mixture Likelihood And Other Modifications

       https://openreview.net/pdf?id=BJrFC6ceg;

U-Net: Convolutional Networks for Biomedical Image Segmentation

       https://arxiv.org/pdf/1505.04597.pdf; 

On Maximum Likelihood Training of Score-Based Generative Models

       https://arxiv.org/pdf/2101.09258.pdf;

Flow-based Deep Generative Models

        https://lilianweng.github.io/lil-log/2018/10/13/flow-based-deep-generative-models.html;

From Autoencoder to Beta-VAE

        https://lilianweng.github.io/lil-log/2018/08/12/from-autoencoder-to-beta-vae.html;

WaveNet: A generative model for raw audio

       https://deepmind.com/blog/article/wavenet-generative-model-raw-audio


Talk·提问交流

通过以下两种方式提问都将获得微信现金红包奖励哦!

方式 ①

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

方式 ②

在本文留言区直接提出你的问题,或扫描下方二维码提问!

Talk·嘉宾介绍

孔之丰
UCSD在读博士

孔之丰,本科毕业于西安交通大学数学系,现在是加州大学圣地亚哥分校计算机科学的三年级博士生,导师是Kamalika Chaudhuri, 主要的研究方向为生成模型的理论,理解与应用。在ICLR, AISTATS, AAAI等会议发表论文,获得百度美国研究院和英伟达深度学习研究院的研究实习。

关于TechBeat人工智能社区

TechBeat(www.techbeat.net)是一个荟聚全球华人AI精英的成长社区。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ


Talk预告 | UCSD在读博士孔之丰: DiffWave基础, 生成模型介绍的评论 (共 条)

分享到微博请遵守国家法律