Mocking Bird实时语音克隆

联合创作 · 2023-09-30 10:09

Mocking Bird 是一个实时语音克隆项目，可在 5 秒内克隆声音并生成任意语音内容。

特性

支持普通话并使用多种中文数据集进行测试：aidatatang_200zh, magicdata, aishell3, biaobei, MozillaCommonVoice, data_aishell 等

适用于 Pytorch，已在 1.9.0 版本（最新于 2021 年 8 月）中测试，GPU Tesla T4 和 GTX 2060

可在 Windows 操作系统和 linux 操作系统中运行（苹果系统M1版也有社区成功运行案例）

仅需下载或新训练合成器（synthesizer）就有良好效果，复用预训练的编码器/声码器，或实时的HiFi-GAN作为vocoder

可将训练结果保存在服务器端，供远程调用

浏览 37

点赞

收藏

分享

举报

评论

图片

表情

Real-Time Voice Cloning克隆语音并实时生成任意语音

Real-Time Voice Cloning 是“Transfer Learning from S

Real-Time Voice Cloning克隆语音并实时生成任意语音

Real-TimeVoiceCloning是“TransferLearningfromSpeakerVerificationtoMultispeakerText-To-SpeechSynthesis（

实时中文语音克隆,声音模仿如此简单

开源你我他

FlapFlapFlappy Bird 的克隆

FlapFlap 是 Flappy Bird 的克隆，主要用于学习。

FlapFlapFlappy Bird 的克隆

FlapFlap是FlappyBird的克隆，主要用于学习。

VALL-E X多语言文本到语音合成与语音克隆

VALL-E X多语言文本到语音合成与语音克隆

VALL-E X多语言文本到语音合成与语音克隆

微软 VALL-EX 零样本语音合成模型的开源实现。预训练模型现已向公众开放，供研究或应用使用。VALL-EX是一个强大而创新的多语言文本转语音（TTS）模型，最初由微软发布。虽然微软最初在他们的研究

Humming bird网站实时监控

Hummingbird 可以让你实时的了解访问者与网站之间的交互，这个实时并不是每五分钟一次，而是每

如何监控实时语音的质量

Humming bird网站实时监控

Hummingbird可以让你实时的了解访问者与网站之间的交互，这个实时并不是每五分钟一次，而是每秒钟20。Hummingbird基于Node.js构建

点赞

收藏

分享

举报