Coqui TTS基于深度学习的文本转语音库

联合创作 · 2023-09-30

Coqui TTS 是一个用于高级文本到语音生成的库。它建立在最新研究的基础上,旨在实现易于训练、速度和质量之间的最佳平衡。Coqui TTS 带有预训练模型、用于测量数据集质量的工具,并且已经在 20 多种语言中用于产品和研究项目。

特征:

  • 用于 Text2Speech 任务的高性能深度学习模型
  • 快速高效的模型训练
  • 终端和 Tensorboard 上的详细训练日志
  • 支持多扬声器 TTS
  • 高效、灵活、轻量级但具有完整的 Trainer API
  • 能够将 PyTorch 模型转换为 Tensorflow 2.0 和 TFLite 以进行推理
  • 已发布和可供阅读的模型
  • 在 dataset_analysis 下管理 Text2Speech 数据集的工具
  • 用于使用和测试模型的实用程序
  • 模块化的代码库可以轻松实现新想法

安装

从 PyPI 安装是最简单的选择。

pip install TTS

默认情况下,这只会安装 PyTorch,要安装 tensorflow 依赖项,需要额外使用tf

pip install TTS[tf]

如果您打算编码或训练模型,请克隆并在本地安装它。

git clone https://github.com/coqui-ai/TTS
pip install -e .[all,dev,notebooks,tf]  # Select the relevant extras

如果您使用的是 Ubuntu (Debian),还可以运行以下命令进行安装。

$ make system-deps  # intended to be used on Ubuntu (Debian). Let us know if you have a diffent OS.
$ make install
浏览 5
点赞
评论
收藏
分享

手机扫一扫分享

编辑
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑
举报