语音识别 | 基于端到端的ASR论文集
目前基于端到端的语音识别已经取得了非常好的效果,在很多论文中已经取得了比传统语音识别更好的效果,业界也已经有产品级别的端到端的语音识别的应用,并取得了不错的效果。
基于端到端的语音识别方法包括基于CTC的方法,基于RNN-T的方法,基于Attention Encoder-Decoder的方法。
主要有两个分支:
1. attention类:LAS虽然性能好,但不能满足流式;
2. transduers类:这类天然自带流式方案。
https://github.com/xingchensong/speech-recognition-papers
Streaming ASR
RNA based
RNN-T based
Attention based
Unified Streaming/Non-streaming models
Non-autoregressive (NAR) ASR
ASR Rescoring / Spelling Correction (2-pass decoding)
On-device ASR
获取PDF版论文:
https://www.shenlanxueyuan.com/page/38