推荐 3 个火火火的 AI 语音开源项目！-技术圈

嗨喽！GitHub科技的各位小伙伴们，由于公众号做了乱序推送改版，为了保证公众号的推文能够第一时间及时送达到大家手上，大家记得将公众号加星标置顶，公众号每天会送上几个GitHub开源项目给大家学习！

视频翻译配音

   这是一个视频翻译配音工具，可将一种语言的视频翻译为指定语言的视频，自动生成和添加该语言的字幕和配音。

  

   语音识别支持 faster-whisper模型 openai-whisper模型 和 GoogleSpeech zh_recogn阿里中文语音识别模型 。

  

   文字翻译支持 微软翻译|Google翻译|百度翻译|腾讯翻译|ChatGPT|AzureAI|Gemini|DeepL|DeepLX|离线翻译OTT 。

  

https://github.com/jianchang512/pyvideotrans

本地运行语音处理：Sherpa-ONNX

   sherpa-ONNX 是一个开源项目，它允许您在本地设备上运行语音处理模型，包括语音识别、语音合成、说话人识别和语音活动检测。它支持多种平台和操作系统，包括 Windows、macOS、Linux、Android 和 iOS，以及多种编程语言，例如 C++、Python、Java 和 C#。

  

https://github.com/k2-fsa/sherpa-onnx

ChatTTS语音克隆

   ChatTTS是一款神奇工具，能让你的文字像人一样说话，而且听起来自然真实。这个工具适合用在需要语音合成的场景，比如智能助手、客服机器人，甚至是让你的文章或故事开口说话。

  

   ChatTTS是专门为对话场景设计的文本转语音模型，例如LLM助手对话任务。它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。

  

   亮点：

对话式 TTS: ChatTTS针对对话式任务进行了优化，实现了自然流畅的语音合成，同时支持多说话人。

细粒度控制: 该模型能够预测和控制细粒度的韵律特征，包括笑声、停顿和插入词等。

更好的韵律: ChatTTS在韵律方面超越了大部分开源TTS模型。同时提供预训练模型，支持进一步的研究。

https://github.com/2noise/ChatTTS

--完--

读到这里说明你喜欢本公众号的文章，欢迎 置顶（标星）本公众号 GitHub科技，这样就可以第一时间获取推送了~

在本公众号，后台回复：666，领取一份450个副业指南手册！

推荐 3 个火火火的 AI 语音开源项目 ！

推荐 3 个火火火的 AI 语音开源项目！