欢迎光临散文网 会员登陆 & 注册

语音识别 | 基于端到端的ASR论文集

2021-01-28 15:41 作者:深蓝学院  | 我要投稿

目前基于端到端的语音识别已经取得了非常好的效果,在很多论文中已经取得了比传统语音识别更好的效果,业界也已经有产品级别的端到端的语音识别的应用,并取得了不错的效果。

基于端到端的语音识别方法包括基于CTC的方法,基于RNN-T的方法,基于Attention Encoder-Decoder的方法。

主要有两个分支:

1. attention类:LAS虽然性能好,但不能满足流式;

2. transduers类:这类天然自带流式方案。

那近期,语音识别中基于端到端的方法有哪些?又有哪些相关的工作呢?

在GitHub上有伙伴整理好了相关的参考论文(https://github.com/xingchensong/speech-recognition-papers

分类主要分为:

  • Streaming ASR

    • RNA based

    • RNN-T based

    • Attention based

    • Unified Streaming/Non-streaming models

  • Non-autoregressive (NAR) ASR

  • ASR Rescoring / Spelling Correction (2-pass decoding)

  • On-device ASR

各个类别共61篇论文~

有需要的站友们,可长按识别下方链接,免费获取PDF版论文:

https://www.shenlanxueyuan.com/page/38


语音识别 | 基于端到端的ASR论文集的评论 (共 条)

分享到微博请遵守国家法律