DeepFilterNet语音增强框架
DeepFilterNet 是一个全频段音频低复杂度语音增强框架。
这个框架支持 Linux、macOS 和 Windows,该框架的结构如下:
-
libDF包含用于数据加载和增强的 Rust 代码 -
DeepFilterNet包含 DeepFilterNet 代码训练、评估和可视化,以及预训练的模型权重 -
pyDF-data包含一个 libDF 数据集功能的 Python 封装,并提供一个 PyTorch 数据加载器。 -
ladspa包含一个 LADSPA 插件,用于实时抑制噪音。 -
models包含在 DeepFilterNet(Python)或 libDF/deep-filter(Rust)中使用的预训练。
使用方法
deep-filter
从 Release 页面下载预编译的二进制文件,可以使用 deep-filter 来抑制嘈杂的 .wav 音频文件的噪音。目前,只支持采样率为 48kHz 的 wav 文件。
USAGE:
deep-filter [OPTIONS] [FILES]...
ARGS:
<FILES>...
OPTIONS:
-D, --compensate-delay
Compensate delay of STFT and model lookahead
-h, --help
Print help information
-m, --model <MODEL>
Path to model tar.gz. Defaults to DeepFilterNet2.
-o, --out-dir <OUT_DIR>
[default: out]
--pf
Enable postfilter
-v, --verbose
Logging verbosity
-V, --version
Print version information
评论
