EnCodec基于深度学习的音频编解码器

联合创作 · 2023-09-29 20:23

EnCodec 是一个基于深度学习的音频编解码器,由 AI 驱动,可以在音频质量没有损失的前提下,将音频压缩到比 MP3 格式还要小 10 倍的程度。



实现过程如下:



  • 首先,编码器将未压缩的数据转换为较低帧率的 "latent space" 表示(representation);

  • 然后,量化器将这个表示压缩到目标大小,同时跟踪最重要的信息,这些信息以后将被用于重建原始信号(这个压缩信号将通过网络发送或保存在磁盘上);

  • 最后,解码器使用单个 CPU 上的神经网络将压缩的数据实时地转变回音频;


安装


EnCodec 需要 Python 3.8 和 PyTorch 1.11.0,要安装 EnCodec,可以运行:




pip install -U encodec # stable release
pip install -U git+https://git@github.com/facebookresearch/encodec#egg=encodec # bleeding edge
# of if you cloned the repo locally
pip install .


使用


然后,可以使用 EnCodec 命令:




python3 -m encodec [...]
# or
encodec [...]



 
浏览 30
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报