DeepFilterNet语音增强框架

联合创作 · 2023-09-29 20:30

DeepFilterNet 是一个全频段音频低复杂度语音增强框架。



这个框架支持 Linux、macOS 和 Windows,该框架的结构如下:



  • libDF 包含用于数据加载和增强的 Rust 代码

  • DeepFilterNet 包含 DeepFilterNet 代码训练、评估和可视化,以及预训练的模型权重

  • pyDF-data 包含一个 libDF 数据集功能的 Python 封装,并提供一个 PyTorch 数据加载器。

  • ladspa 包含一个 LADSPA 插件,用于实时抑制噪音。

  • models 包含在 DeepFilterNet(Python)或 libDF/deep-filter(Rust)中使用的预训练。


使用方法


deep-filter


从 Release 页面下载预编译的二进制文件,可以使用 deep-filter 来抑制嘈杂的 .wav 音频文件的噪音。目前,只支持采样率为 48kHz 的 wav 文件。



USAGE:
deep-filter [OPTIONS] [FILES]...

ARGS:
<FILES>...

OPTIONS:
-D, --compensate-delay
Compensate delay of STFT and model lookahead
-h, --help
Print help information
-m, --model <MODEL>
Path to model tar.gz. Defaults to DeepFilterNet2.
-o, --out-dir <OUT_DIR>
[default: out]
--pf
Enable postfilter
-v, --verbose
Logging verbosity
-V, --version
Print version information

浏览 96
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报