Coqui TTS基于深度学习的文本转语音库

联合创作 · 2023-09-30 10:11

Coqui TTS 是一个用于高级文本到语音生成的库。它建立在最新研究的基础上,旨在实现易于训练、速度和质量之间的最佳平衡。Coqui TTS 带有预训练模型、用于测量数据集质量的工具,并且已经在 20 多种语言中用于产品和研究项目。



特征:



  • 用于 Text2Speech 任务的高性能深度学习模型

  • 快速高效的模型训练

  • 终端和 Tensorboard 上的详细训练日志

  • 支持多扬声器 TTS

  • 高效、灵活、轻量级但具有完整的 Trainer API

  • 能够将 PyTorch 模型转换为 Tensorflow 2.0 和 TFLite 以进行推理

  • 已发布和可供阅读的模型

  • 在 dataset_analysis 下管理 Text2Speech 数据集的工具

  • 用于使用和测试模型的实用程序

  • 模块化的代码库可以轻松实现新想法


安装


从 PyPI 安装是最简单的选择。




pip install TTS


默认情况下,这只会安装 PyTorch,要安装 tensorflow 依赖项,需要额外使用tf




pip install TTS[tf]


如果您打算编码或训练模型,请克隆并在本地安装它。




git clone https://github.com/coqui-ai/TTS
pip install -e .[all,dev,notebooks,tf] # Select the relevant extras


如果您使用的是 Ubuntu (Debian),还可以运行以下命令进行安装。




$ make system-deps # intended to be used on Ubuntu (Debian). Let us know if you have a diffent OS.
$ make install

浏览 52
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报