DeepFilterNet语音增强框架
DeepFilterNet 是一个全频段音频低复杂度语音增强框架。
这个框架支持 Linux、macOS 和 Windows,该框架的结构如下:
-
libDF
包含用于数据加载和增强的 Rust 代码 -
DeepFilterNet
包含 DeepFilterNet 代码训练、评估和可视化,以及预训练的模型权重 -
pyDF-data
包含一个 libDF 数据集功能的 Python 封装,并提供一个 PyTorch 数据加载器。 -
ladspa
包含一个 LADSPA 插件,用于实时抑制噪音。 -
models
包含在 DeepFilterNet(Python)或 libDF/deep-filter(Rust)中使用的预训练。
使用方法
deep-filter
从 Release 页面下载预编译的二进制文件,可以使用 deep-filter
来抑制嘈杂的 .wav 音频文件的噪音。目前,只支持采样率为 48kHz 的 wav 文件。
USAGE: deep-filter [OPTIONS] [FILES]... ARGS: <FILES>... OPTIONS: -D, --compensate-delay Compensate delay of STFT and model lookahead -h, --help Print help information -m, --model <MODEL> Path to model tar.gz. Defaults to DeepFilterNet2. -o, --out-dir <OUT_DIR> [default: out] --pf Enable postfilter -v, --verbose Logging verbosity -V, --version Print version information
评论