欢迎光临散文网 会员登陆 & 注册

Talk预告 | OSU博士生刘濠赫: VoiceFixer: 面向通用的语音修复

2021-09-29 13:10 作者:TechBeat人工智能社区  | 我要投稿


本期为TechBeat人工智能社区347线上Talk。

北京时间9月30(周四)晚8点美国俄亥俄州立大学(OSU) 计算机科学与工程博士在读—刘濠赫的Talk将准时在TechBeat人工智能社区开播!

他与大家分享的主题是: “VoiceFixer: 面向通用的语音修复”,届时将探讨语音修复技术方面的进展与挑战。

Talk·信息

主题:VoiceFixer: 面向通用的语音修复

嘉宾:美国俄亥俄州立大学(OSU) 计算机科学与工程博士在读 刘濠赫

时间:北京时间 9月30日 (周四) 20:00

地点:TechBeat人工智能社区

http://www.techbeat.net/


完整版怎么看?

扫描下方二维码,或复制链接https://datayi.cn/w/QPDL3LBP至浏览器,一键完成预约!

上线后会在第一时间收到通知哦~


Talk·提纲

对数字语音中失真的修复,不论是在当今社会还是对于历史研究都有非常重要的应用意义。然而受到技术的限制,语音修复并没有像图像修复算法一样得到广泛的应用。这个Talk探讨了其中可能的原因,存在的问题以及我们的解决方案。

本次分享主要为:

1. 引述

2. 现代和历史语音修复效果展示

3. 研究背景介绍

a) 语音修复在实际场景和科学研究中的应用

b)语音信号的数学表征

c) 常见的四种语音失真及主流的处理方案

d) 主流方案中可能存在的问题

4. 当前语音修复方法存在的问题及解决方案5. 设计VoiceFixer的脑科学启发6. VoiceFixer模型结构介绍7. 实验设置与讨论8. 实验结果分析9. 结论与未来可做的工作


Talk·参考资料

这是本次分享中将会提及的资料,建议提前预习哦!

1. Demo网站:

https://haoheliu.github.io/demopage-voicefixer/

2. 项目主页:

https://github.com/haoheliu/voicefixer_main

3. 语音修复相关文章:Speech Super Resolution:[1708.00853] Audio Super Resolution using Neural Networks (arxiv.org)

4. Speech Enhancement: [1708.07524] Supervised Speech Separation Based on Deep Learning: An Overview (arxiv.org)

5. Speech Dereverberation:Speech Dereverberation Using Fully Convolutional Networks | IEEE Conference Publication | IEEE Xplore

6. Speech Declipping:[1910.12116] Image to Image Translation based on Convolutional Neural Network Approach for Speech Declipping (arxiv.org)

7. 声码器相关文章:TFGAN Neural Vocoder:[2011.12206] TFGAN: Time and Frequency Domain Based Generative Adversarial Network for High-fidelity Speech Synthesis (arxiv.org)


Talk·提问交流

通过以下两种方式提问都将获得微信现金红包奖励哦!

方式 ①

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!


方式 ②

在本文留言区直接提出你的问题,或扫描下方二维码提问!

扫码来提问吧!

Talk·嘉宾介绍

刘濠赫

美国俄亥俄州立大学(OSU)计算机科学与工程博士在读

刘濠赫,目前为美国俄亥俄州立大学计算机科学与工程博士一年级在读,师从Deliang Wang教授,此前在西北工业大学获得学士学位。本科期间在谢磊老师ASLP实验室从事音乐分离的相关研究。随后在字节跳动进行语音降噪和声音修复的研究。曾在2021 ISMIR国际音乐分离大赛中取得人声效果第二名(Leaderboard A)的成绩。研究兴趣主要为音源分离和声音修复。相关成果已在INTERSPEECH, ICASSP,ISMIR等语音和声学领域主流会议上发表。

个人主页:

haoheliu (Leo) (github.com)

长按识别二维码,一键完成预约

关于TechBeat人工智能社区

TechBeat (www.techbeat.net) 是一个荟聚全球华人AI精英的成长社区。 我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。 期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ 

Talk预告 | OSU博士生刘濠赫: VoiceFixer: 面向通用的语音修复的评论 (共 条)

分享到微博请遵守国家法律