Google-LyraGoogle 开源的语音编解码器
Lyra 是一种高质量、低比特率的语音编解码器,即使在最慢的网络上也可以进行语音通信。为此,它应用了传统的编解码器技术,同时利用机器学习 (ML) 的进步和在数千小时数据上训练的模型来创建压缩和传输语音信号的新方法。
Lyra 的架构分为两部分,编码器和解码器。当有人对着手机说话时,编码器会从他们的语音中捕捉独特的属性。这些语音属性,也称为特征,以 40ms 为单位提取,然后压缩并通过网络发送。解码器的工作是将这些特征转换回音频波形,以便通过电话听筒播放出来。将特征解码回波形的过程是通过生成模型(Generative models)处理的,生成模型是一种特殊类型的机器学习模型,非常适合从有限的特征中重新创建一个完整的音频波形。Lyra架构与传统的音频编解码器非常相似,几十年来,传统的音频编解码器已经构成了互联网通信的主干。这些传统的编解码器是基于数字信号处理(DSP)技术,而 Lyra 的关键优势来自于生成模型重建高质量语音信号的能力。
Lyra 的代码是用 C++ 所编写的,以提高速度、效率和互操作性,使用 Bazel 构建框架和 GoogleTest 框架进行彻底的单元测试,并基于 Apache 许可协议进行分发。
评论
Codec2开源低带宽语音编解码器
Codec2是一个为低带宽应用设计的开源数字语音编解码器,它刚刚发布了V0.1alpha版。它填补了5000bit/s以下开源语音编解码器的空白,源代码以LGPL2许可证发布。V0.1版可以将3.75
Codec2开源低带宽语音编解码器
0
BroadVoice语音编解码器
FreeSWITCH团队宣布支持开源的BroadVoice语音编解码–窄带8kKZ的BV16和宽带16kHZ的BV32。BroadVoice2.1使用LGPL(LesserGeneralPublicL
BroadVoice语音编解码器
0
SVT-AV1AV1 开源编解码器
SVT-AV1是由英特尔和Netflix合作启动的 AV1开源编解码器,其编解码器性能水平能适用于各种应用,从视频点播到实时直播的编码和转码等。SVT-AV1旨在提供高质量、高性能的AV1编码,它是S
SVT-AV1AV1 开源编解码器
0
OpenAI-WhisperOpenAI 开源的语音识别系统
Whisper 是 OpenAI 开源的自动语音识别(ASR,Automatic Speech Re
OpenAI-WhisperOpenAI 开源的语音识别系统
0
OpenAI-WhisperOpenAI 开源的语音识别系统
Whisper是OpenAI开源的自动语音识别(ASR,AutomaticSpeechRecognition)系统,OpenAI通过从网络上收集了68万小时的多语言(98种语言)和多任务(multit
OpenAI-WhisperOpenAI 开源的语音识别系统
0
mycroft-core开源语音助手
Mycroft是一个开源语音助手入门首先获取系统上的代码,最简单的方法是通过git(git安装说明):cd~/gitclonehttps://github.com/MycroftAI/mycroft-
mycroft-core开源语音助手
0