DeepFilterNet语音增强框架

联合创作 · 2023-09-29 20:30

DeepFilterNet 是一个全频段音频低复杂度语音增强框架。

这个框架支持 Linux、macOS 和 Windows,该框架的结构如下:

  • libDF 包含用于数据加载和增强的 Rust 代码
  • DeepFilterNet 包含 DeepFilterNet 代码训练、评估和可视化,以及预训练的模型权重
  • pyDF-data 包含一个 libDF 数据集功能的 Python 封装,并提供一个 PyTorch 数据加载器。
  • ladspa 包含一个 LADSPA 插件,用于实时抑制噪音。
  • models 包含在 DeepFilterNet(Python)或 libDF/deep-filter(Rust)中使用的预训练。

使用方法

deep-filter

从 Release 页面下载预编译的二进制文件,可以使用 deep-filter 来抑制嘈杂的 .wav 音频文件的噪音。目前,只支持采样率为 48kHz 的 wav 文件。

USAGE:
    deep-filter [OPTIONS] [FILES]...

ARGS:
    <FILES>...

OPTIONS:
    -D, --compensate-delay
            Compensate delay of STFT and model lookahead
    -h, --help
            Print help information
    -m, --model <MODEL>
            Path to model tar.gz. Defaults to DeepFilterNet2.
    -o, --out-dir <OUT_DIR>
            [default: out]
    --pf
            Enable postfilter
    -v, --verbose
            Logging verbosity
    -V, --version
            Print version information
浏览 6
点赞
评论
收藏
分享

手机扫一扫分享

编辑
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑
举报