speech

是否可以使用NVIDIA显卡运行Tacotron2或Fastspeech来构建新语言的模型?

我读过的许多文章都描述了使用Tacotron2来训练语音合成模型,这些文章似乎都使用了非常高端的NVIDIAGPU。我意识到有大量数据需要分析,但是否有可能将各种可用的工具应用于例如带有低端卡的桌面CPU?我心里有一个项目,但实际上无法使用不同作者描述的一些更昂贵的硬件。