纯 PyTorch 语音工具包 SpeechBrain 开源,Kaldi:“ 我压力有点大”
开源前哨
共 2454字,需浏览 5分钟
·
2021-03-16 15:14
转自:机器之心
【导语】:距离 Mirco Ravanelli 宣布打造新的语音工具包过去了一年多,SpeechBrain 真的如期而至。
开发团队与 HuggingFace 集成一些预训练模型,这些模型具备可运行推理的接口。如果 HuggingFace 模型不可用,团队会提供一个 Google Drive 文件夹,包含所有对应的实验结果;
使用 PyTorch 数据并行或分布式数据并行来进行多 GPU 训练和推理;
混合精度,加快训练速度;
透明且完全可自定义的数据输入和输出 pipeline。SpeechBrain 遵循 PyTorch 数据加载器和数据集样式,使用户能够自定义 I / O pipeline。
SpeechBrain 支持 CPU 和 GPU,但对于大多数 recipe 而言,训练期间必须使用 GPU。需要注意的是,必须正确安装 CUDA 才能使用 GPU。
pip install speechbrain
import speech brain as sb
git clone https://github.com/speechbrain/speechbrain.gitcd speechbrainpip install -r requirements.txtpip install --editable .
import speechbrain as sb
- EOF -
更多优秀开源项目(点击下方图片可跳转)
开源前哨
日常分享热门、有趣和实用的开源项目。参与维护10万+star 的开源技术资源库,包括:Python, Java, C/C++, Go, JS, CSS, Node.js, PHP, .NET 等
关注后获取
回复 资源 获取 10万+ star 开源资源
分享、点赞和在看
支持我们分享更多优秀开源项目,谢谢!
评论
Kaldi语音识别工具
Kaldi是一个语音识别工具。使用C++开发,基于Apache许可证。目的是为语音识别研究者提供。Kaldi的目标和受众范围与HTK相似。目标是用C++编写的现代灵活的代码,易于修改和扩展。重要功能包
Kaldi语音识别工具
0
MindAudio语音领域开源一体化工具包
MindAudio是一个基于全场景AI框架 MindSpore 建立的,针对语音领域的开源一体化工具包。它提供语音领域的常用音频数据处理、音频特征提取以及音频数据增强等系列API,用户可便利地进行数据
MindAudio语音领域开源一体化工具包
0