Coqui TTS基于深度学习的文本转语音库
Coqui TTS 是一个用于高级文本到语音生成的库。它建立在最新研究的基础上,旨在实现易于训练、速度和质量之间的最佳平衡。Coqui TTS 带有预训练模型、用于测量数据集质量的工具,并且已经在 20 多种语言中用于产品和研究项目。
特征:
- 用于 Text2Speech 任务的高性能深度学习模型
- 快速高效的模型训练
- 终端和 Tensorboard 上的详细训练日志
- 支持多扬声器 TTS
- 高效、灵活、轻量级但具有完整的 Trainer API
- 能够将 PyTorch 模型转换为 Tensorflow 2.0 和 TFLite 以进行推理
- 已发布和可供阅读的模型
- 在 dataset_analysis 下管理 Text2Speech 数据集的工具
- 用于使用和测试模型的实用程序
- 模块化的代码库可以轻松实现新想法
安装
从 PyPI 安装是最简单的选择。
pip install TTS
默认情况下,这只会安装 PyTorch,要安装 tensorflow 依赖项,需要额外使用tf
。
pip install TTS[tf]
如果您打算编码或训练模型,请克隆并在本地安装它。
git clone https://github.com/coqui-ai/TTS pip install -e .[all,dev,notebooks,tf] # Select the relevant extras
如果您使用的是 Ubuntu (Debian),还可以运行以下命令进行安装。
$ make system-deps # intended to be used on Ubuntu (Debian). Let us know if you have a diffent OS. $ make install
评论