将aishell中train文件下120098条语音来扩充训练集:
原本语音对应的句子格式如下图
所占的显存还是7000多MiB 与扩充之前相差不大,训练数据的大小并没有影响所占的显存,模型太大了
把batch_size降到8之后 显存和GPU占用率都会明显降低
通过显存占用公式:
可以解二元一次方程组: 解得模型所占显存大概是1161MiB
一个样本的显存为374.75MiB