TTS

我这里如何修改melgan.nemo里面的batch_size的大小后面爆显存了

已在群里回复:增加内存,可以使用swap增加虚拟内存,或者通过子进程的方式执行语音识别和视觉部分的代码,这样保证前两个模块执行后,内存可以得到释放,参考上周六的视频回放nano端的代码

你确定可以吗? swap增加的是 cpu 的virtual memory, 但是这里报出的是 CUDA out of memory. 这应该指的是 GPU memory是吗?

在 ASR 做 transfer training 时也发生 CUDA out of memory (3050 4GB GPU memory), 然后编辑 quartznet。yaml 找出 batch 又 32 改成 4 就可以执行,你也尝试找出相对应的 model configuration 然后更改 batch size。也许可以成功。

你看在报错图片中:在频谱图生成的地方就已经出现cpu内存不足所导致的问题了:频谱图是一个绿色的小横条,表示没有成功生成频谱图。所以这里cpu内存也是可以或者说需要通过增加swap方式来处理的。

请问您的联系方式? 我这里发生一样的问题但是解决方式是别的。能否为微信讨论 +86 15618653775

楼主问题解决了吗??怎么解决的